輝達發表 Cosmos 3 開源模型 加速實體人工智慧開發

9b014c73 6ccf 4f79 9359 042baaf99563

9b014c73 6ccf 4f79 9359 042baaf99563
圖/本報資料庫

商傳媒|責任編輯/綜合外電報導

輝達(Nvidia)今日宣布推出 Cosmos 3,這是一個專為實體人工智慧(Physical AI)打造的開源世界基礎模型,能夠原生理解並生成文字、圖像、影片、環境音效及動作,同時提供高水準的物理精確度。

輝達指出,Cosmos 3 是首個完全開源的「全能模型」(omnimodel),旨在透過將訓練與評估週期從數月縮短至數天,大幅加速實體 AI 系統的發展。此模型的核心目的在於協助機器人、自動駕駛車輛及其他 AI 驅動系統,更好地理解、模擬並預測真實世界的環境。

根據輝達 Cosmos Lab 副總裁 Ming-Yu Liu 的說法,Cosmos 3 的獨特之處在於其動作資料處理能力,這使其有別於一般的影片生成器,因為它旨在模擬機器的移動方式,而不僅是呈現場景的外觀。該模型是基於 20 兆個多模態 Token 數據進行訓練,其中包括近 10 億張圖像、4 億個真實與合成影片,以及來自人類和機器人的環境音訊、文字和動作資料。

輝達執行長黃仁勳表示:「多模態推理語言、視覺與世界模型的突破,讓實體 AI 的大爆炸即將到來。Cosmos 3 系列的開源先驅全能模型,讓開發者在建構能感知、推理、規劃並在物理世界中行動的機器人、自動駕駛車輛和視覺 AI 方面,實現了世代躍進。」

作為一個開源模型,Cosmos 3 將提供硬體製造商根據自身需求進行客製化,以確保未來版本能更緊密地符合產業所需,這與輝達早期的 Nemotron 系列模型策略相似。此外,輝達也正籌組 Nvidia Cosmos Coalition,推動世界模型建構者與 AI 開發者之間的全球合作。

Cosmos 3 能夠生成難以、昂貴或不安全重複捕捉的罕見或危險場景,例如機器人碰撞或不尋常的道路事件。目前已同步發布兩個版本:適用於需要高物理精確度的「超級」(super)模型,主要用於訓練機器人及自動駕駛車輛;以及可在瞬間產生結果的「奈米」(nano)模型。輝達亦透露,支援本機運行的「邊緣」(edge)模型即將問世。

下週,輝達將與微軟(Microsoft)合作,預計共同發表首批搭載輝達設計處理器的 Windows 電腦。這些新裝置將於台灣的臺北國際電腦展覽會(Computex)以及舊金山的 Microsoft Build 開發者大會上亮相。

9b014c73 6ccf 4f79 9359 042baaf99563

想讓品牌在新聞媒體曝光? 立即點我加入官方LINE@免費諮詢

相關新聞

最新消息