快訊

陸可望正面回應團客來台 王滬寧指農產解禁等都能解決

四技二專統測今第2天 突遇地震3大原則一次看

輝達AI晶片H200 創MLPerf的Llama 2基準測試紀錄

輝達(NVIDIA)身為當前的AI霸主,28日宣布該公司在業界標準測試中提供了世界上最快的生成式AI推論平台。

在最新的MLPerf基準測試中,NVIDIA TensorRT-LLM這個可加速和簡化大型語言模型複雜推論工作的軟體,將GPT-J LLM上的NVIDIA Hopper架構GPU效能較六個月前提高近3倍。

在輝達H200 Tensor核心GPU上運行的TensorRT-LLM,在MLPerf 迄今為止最大規模的生成式AI測試中,提供最快的運行推論效能。

新的基準測試使用Llama 2的最大版本,Llama 2是最先進的大型語言模型,包含700億個參數。該模型比9月基準測試中首次使用的GPT-J大型語言模型大10倍以上。

記憶體增強型H200 GPU在MLPerf首次亮相時,使用TensorRT-LLM每秒產生高達31,000個詞元,創下MLPerf的Llama 2基準測試紀錄。

輝達指出,現在已提供 H200 GPU供客戶測試,並將於第2季出貨。H200 GPU很快將由近20家系統製造商和雲端服務供應商提供。H200 GPU包含141GB高頻寬記憶體HBM3e,與H100 GPU相比,記憶體增加76%,運行速度提高43%。

輝達表示,Hopper GPU 在最新一輪MLPerf產業基準測試中,橫掃了所有AI推論測試。MLPerf的測試透明且客觀,因此使用者可以依靠結果做出明智的購買決定。而輝達的合作夥伴參與 MLPerf ,是因為他們知道這對客戶評估AI系統和服務來說是一個很有價值的工具。

這次在NVIDIA AI平台上提交結果的合作夥伴,包括華碩(2357)、思科、戴爾、富士通、技嘉(2376)、Google、慧與科技、聯想、微軟Azure、甲骨文、雲達科技、美超微、VMware和緯穎(6669)。

AI GPU 輝達

延伸閱讀

盼進一步推進生成式AI…AWS砸40億美元 投資OpenAI對手Anthropic

加速企業AI轉型 台灣大哥大繁中語言模型客製化解方

欣興抓住AI浪潮

沒被炒作的小清新高息股

相關新聞

台積電首度發表2奈米強化版A16新型晶片製造技術

台積電在美國當地時間24日舉辦2024年北美技術論壇,會中揭示其最新的製程技術、先進封裝技術、以及三維積體電路(3D I...

魏哲家出席北美技術論壇 台積電2026年完成矽光子整合

台積電於美國時間24日舉辦北美技術論壇,發表A16技術,預計2026年量產,屆時將邁入埃米世代。2025年完成緊湊型通用...

鴻海首部國產電動車上陣 展示完整電動車生態系

「2024 臺北國際車用電子展」17日於南港展覽館1館舉行。鴻海(2317)作為主要參展廠商,圍繞集團智慧電動車平台,進...

台積電下屆董事候選人名單出爐!林全與二外籍女獨董入列

台積電今日宣布十位董事被提名人,包括三位現任董事魏哲家、曾繁城、龔明鑫,四位現任獨立董事彼得‧邦菲爵士、麥克‧史賓林特、...

台版ChatGPT今釋出!國科會TAIDE-LX-7B模型將供產學研以導入生成式AI

因應全球ChatGPT帶來廣泛且巨大的影響,國科會自2023年初即推動可信任生成式AI發展先期計畫(Trustworth...

智慧型手機排名大地震!首季蘋果跌落神壇、三星返第一

根據IDC最新全球手機季度追蹤報告的初步數據統計,今(2024)年第一季全球智慧型手機出貨量年成長7.8%,達到2.89...

商品推薦

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。