Google發表Gemini 3.5 Flash AI部署成本可望大幅降低

b9b315d6 3865 49a8 bf3c ab9c023b6e3c

b9b315d6 3865 49a8 bf3c ab9c023b6e3c
圖/本報AI製圖(示意圖)

商傳媒|林昭衡/綜合外電報導

Google 於週二(19日)在年度 I/O 開發者大會上,發表一系列人工智慧(AI)創新,其中包含最新且高效能的 Gemini 3.5 Flash 模型,以及多模態視訊生成模型 Gemini Omni,和個人 AI 代理助理 Gemini Spark。這些新模型與服務旨在提升 AI 應用的速度與成本效益,並擴大其在企業和個人生活中的實用性。

Gemini 3.5 Flash:性能卓越且成本優化

Gemini 3.5 Flash 被定位為兼顧智慧與效率的突破性模型,它解決了過去高效能 AI 模型往往速度慢且成本高昂的問題。根據 Google 的內部基準測試及獨立第三方機構 Artificial Analysis 的分析,該模型在編程與代理基準測試(如 Terminal-Bench 2.1、GDPval-AA、MCP Atlas 等)上,性能超越 Google 先前的 Gemini 3.1 Pro 模型。在多模態理解方面,Gemini 3.5 Flash 在 CharXiv Reasoning 上得分達 84.2%,同時生成速度比同級頂尖模型快上四倍。

Google 執行長皮蔡(Sundar Pichai)向媒體表示,對於每日處理約一兆個 token 的 Google Cloud 企業客戶而言,若將 80% 的工作負載轉移到 Gemini 3.5 Flash 及其他新模型上,每年可望節省超過 10 億美元。Google DeepMind 技術長兼 Google 首席 AI 架構師 Koray Kavukcuoglu 更指出,透過 Antigravity 代理開發平台,Gemini 3.5 Flash 的優化版本速度可達 12 倍之快。此模型今日已在全球範圍內成為 Gemini 應用程式和 Google 搜尋 AI 模式的預設模型。

Gemini Omni:任何輸入到任何輸出多模態體驗

同時發表的 Gemini Omni 是 Google 首個原生多模態模型,目標是實現「任何輸入到任何輸出」的生成能力,尤其在視訊生成與編輯方面。該模型能將文字、圖片、音訊及視訊等任何組合作為輸入,並生成高品質的視訊內容,並支援對話式視訊編輯,允許用戶透過指令疊加修改。Google 特別強調,Gemini Omni 在物理模擬(如重力、動能、流體動力學)方面的改進,使生成視訊更具真實感。首發模型 Gemini Omni Flash 今日已在美國的 Gemini 應用程式、Google Flow 和 YouTube Shorts 上線。為確保內容的真實性與安全性,所有 Gemini Omni 生成的視訊都將帶有 Google 的 SynthID 數位浮水印,並擴展 C2PA 內容憑證至其生成工具。

Gemini Spark:全天候個人智慧代理

Google 也推出了個人化 AI 代理助理 Gemini Spark。這款 24/7 全天候運作的 AI 代理助理由 Gemini 3.5 Flash 驅動,能深度整合 Gmail、Google文件、Google簡報、Google試算表等 Google Workspace 應用程式,並支援 Canva、OpenTable 和 Instacart 等第三方服務。Gemini Spark 能夠自主執行複雜任務,例如從電子郵件中整理關鍵截止日期、分析信用卡帳單以發現隱藏費用,甚至根據會議記錄自動生成報告並撰寫後續信件。Josh Woodward,Google實驗室的副總裁兼 Gemini 應用程式負責人,將 Spark 的設計比喻為「給青少年第一張金融卡」,意指其操作會在用戶指導和嚴格限制下進行。Gemini Spark 已於本週啟動向測試者推出,並預計於下週開放給美國的 Google AI Ultra 訂閱用戶。

這些模型與服務的推出,展現 Google 在 AI 領域的雄心,不僅追求模型智慧的提升,更注重實際應用中的速度、成本效益與安全性。這將為全球,包括台灣在內的科技愛好者、AI 從業人員和軟體開發者,帶來更多的創新可能性與應用空間。

b9b315d6 3865 49a8 bf3c ab9c023b6e3c

想讓品牌在新聞媒體曝光? 立即點我加入官方LINE@免費諮詢

相關新聞

最新消息