超碰8_亚洲国产高清视频_黄频视频_欧美午夜影院_亚洲高清在线视频_成人精品久久久

英偉達 TensorRT 8 上線,BERT 推理延遲僅有 1.2 毫秒

作者: 來源: 2021-07-21 12:56:13 閱讀 我要評論 直達商品

  英偉達昨日發布了其 TensorRT 的 8.0 版本。TensorRT 可以看作是在英偉達各種 GPU 硬件平臺下運行的一個深度學習推理框架,其核心是一個 C++ 庫。

  

英偉達TensorRT 8上線,BERT推理延遲僅有1.2ms

 

  開發者可以將其他框架訓練好的模型轉化為 TensorRT 格式,并通過 TensorRT 推理引擎提升該模型的運行速度。芯東西等媒體和英偉達 AI 軟件部的產品管理總監 Kari Briski、產品營銷主管 Siddharth Sharma 就 TensorRT 8 的技術細節、應用落地等進行了深入地探討。

  此外,Kari Briski 和 Siddharth Sharma 也分享了英偉達團隊在推薦系統競賽中所取得的成績。

  一、運行速度和精準度提升 1 倍,推理延遲僅有 1 毫秒

  Kari Briski 首先回顧了英偉達 TensorRT 的推出背景和成績。她說,AI 模型正在以指數級的速度增長,很多公司不得不縮減模型大小以追求響應速度。而英偉達 2016 年推出的 TensorRT 可以幫助這些企業擴大其模型規模,提升精度。5 年來,已經有超過 35 萬名開發者下載了 250 萬次 TensorRT。TensorRT 7 也幫助英偉達創造了多項基準測試記錄。

  而相比 7.0 版本,TensorRT 8 的運行速度和精準度都提升了 1 倍。此外,TensorRT 8 還有 2 項較為關鍵的特性,提升了其 AI 推理性能。

  第一個是稀疏性(Sparsity)技術,該技術能夠提升英偉達 Ampere 架構 GPU 性能,可以在保持推理精度的同時,降低模型中的部分權重。這意味著模型所需的帶寬和內存也會更小。

  第二個是量化感知訓練(Quantization Aware Training)。這使開發者能夠利用訓練好的模型,以 INT8 精度進行推理,既保證精度,也減少了計算和存儲成本。

  

 

  ▲ 英偉達 TensorRT 8 提升的性能

  當前,開源 AI 公司 Hugging Face 和醫療方案解決商 GE 醫療正在應用 TensorRT。

  Hugging Face 產品總監 Jeff Boudier 稱,通過采用 TensorRT 8,Hugging Face 在 BERT(預訓練的語言表征模型)上的推理延遲僅有 1.2 毫秒。

  GE 醫療心血管超聲首席工程師 Erik Steen 也談道,當前臨床醫生需要花費寶貴的時間來選擇和評估超聲圖像。TensorRT 則憑借其實時推理能力,提高了 GE 醫療的視圖檢測算法性能,能夠加快臨床醫生的工作效率。

  

 

  ▲ 英偉達 TensorRT 的應用

  二、連獲 3 項冠軍,7 分鐘即可完成 CPU 近 24 小時工作

  除了 TensorRT 8 的具體細節,Kari Briski 和 Siddharth Sharma 也分享了英偉達推薦系統團隊在 RecSys 推薦系統數據科學競賽中所獲得的成績。推薦系統作為計算機科學較新的分支,能夠幫助互聯網用戶找到自己想看、想玩、想買的內容。

  在本次 ACM RecSys 挑戰賽中,Twitter 會在 28 天內向參與者提供數百萬個數據點,要求他們預測用戶會點贊或轉發哪些推文。規則要求選手的模型上限為 20 千兆字節,必須基于云端 CPU 的單一內核運行,且時間不能超過 24 小時。

  英偉達的 7 人團隊則第二次獲得了這一比賽的冠軍。

  英偉達參賽成員之一的 Gilberto Titericz 認為,其推理模型需要去適應 CPU 核心是本次比賽的難點之一,對英偉達的團隊來說“就好像回到了遠古時代”。事實上,在比賽后,該團隊在單個 NVIDIA A100 Tensor Core GPU 上運行了比賽模型,CPU 花費將近 24 小時的工作,英偉達 A100 GPU 僅用了 7 分鐘就完成運行。

  此前 5 個月中,英偉達還參與了 Booking.com 挑戰賽和 SIGIR 電子商務數據挑戰賽。前者要求選手使用匿名數據點預測歐洲度假者最終選擇前往的城市,后者則提供了 3700 萬個數據點要求選手預測消費者會購買哪些產品。

  這 2 項比賽吸引了阿里巴巴、沃爾瑪等企業參與,而英偉達最終獲得了 2 項比賽的冠軍。

  

 

  ▲ 英偉達推薦系統團隊

  結語:TensorRT 可有效提升英偉達 GPU 推理表現

  TensorRT 作為英偉達 GPU 的推理庫,5 年中更新了 7 個版本。本次,英偉達推出的 TensorRT 8 相比上一版本再次有較大幅度的性能提升,側面體現出了英偉達對推理領域的重視。

  另外,TensorRT 也支持 Python 調用,可在數據中心、嵌入式和汽車等平臺中應用。TensorRT 可以提升視頻流傳輸、語音識別、推薦和自然語言處理等工作的推理延遲,滿足了許多實時服務、自動和嵌入式應用的要求。


  推薦閱讀

  英偉達顯卡驅動 471.41 發布,正式支持微軟 Win11

  7 月 20 日消息 上周,英特爾推出了新的圖形驅動程序,正式支持 Win11 操作系統。  今天,英偉達發布了支持 Win11 的 GeForce 驅動程序版本 471.41,帶來了全新的顯卡>>>詳細閱讀


本文標題:英偉達 TensorRT 8 上線,BERT 推理延遲僅有 1.2 毫秒

地址:http://www.brh9h.cn/a/zhibo/311222.html

樂購科技部分新聞及文章轉載自互聯網,供讀者交流和學習,若有涉及作者版權等問題請及時與我們聯系,以便更正、刪除或按規定辦理。感謝所有提供資訊的網站,歡迎各類媒體與樂購科技進行文章共享合作。

網友點評
我的評論: 人參與評論
驗證碼: 匿名回答
網友評論(點擊查看更多條評論)
友情提示: 登錄后發表評論,可以直接從評論中的用戶名進入您的個人空間,讓更多網友認識您。
自媒體專欄

評論

熱度

主站蜘蛛池模板: 亚洲日日做日日谢日日鲁 | 精品一区免费 | 久久无人码一码二码三码 | 欧美性受xxxx白人性爽 | 欧美日韩精品在线观看 | 国产精品日本一区二区不卡视频 | 色鬼综合| 麻豆电影免费观看 | 久中文字字幕乱码手机看 | 久久久久久久久久久免费av | 亚洲mv大片免费直接看 | 久久公开视频 | 欧美性生交大片免费视频 | 国产成人精品久久二区二区91 | 91在线视频在线观看 | 天堂国产欧美一区二区三区 | 欧美色图一区二区三区 | 国产91在线观 | 国产欧美日韩视频在线观看 | 国产成人综合网 | 日韩精品电影一区二区 | 亚洲国产精品一 | 亚洲色图25p | 伊人久久在线 | 国产91清纯白嫩初高中在线观看 | 日韩精品视频在线播放 | 伊人网在线视频观看 | 透逼视频 | 亚洲最大综合网 | 欧美中文在线 | 大香区一二三四区2021区 | 亚洲精品午夜久久久久久久 | 中文字幕在线影院 | 在线观看欧美日韩 | 亚洲精品成人网 | 国内精品视频一区二区三区 | 成人影视 | 欧美色图一区二区三区 | 九九视频一区二区 | 九色a| 91精品91久久久中777 |