Google 發表 Gemini 3，具備生成式 UI 與進階推理功能，加劇 AI 市場競爭

執行摘要

Google 宣布發布新一代旗艦 AI 模型 Gemini 3，引入了進階推理能力和新穎的生成式使用者介面範式。該模型在關鍵產業基準上展示了最先進的效能，超越了老牌競爭對手。伴隨著新的以 AI 為中心的開發平台 Google Antigravity 的推出，此舉標誌著 Google 積極的策略，旨在搶佔企業 AI 市場，並賦能複雜的 AI 代理或「數位員工」的開發。

事件詳情

Gemini 3 融合了多項關鍵技術進步。最重要的是其 「螢幕理解」 能力，這使得 AI 能夠直接感知和與圖形使用者介面 (GUI) 互動，這種方法繞過了傳統基於 API 整合的局限性。這與 生成式 UI 模式相結合，該模式可以根據使用者查詢建立客製化的、互動式軟體介面。例如，當被詢問抵押貸款時，Gemini 3 可以生成一個獨特的貸款計算器，用於即時比較。

該模型套件有多種變體，包括標準版、專業預覽版和深度思考版。基準測試結果突出顯示了效能上的巨大飛躍。Gemini 3 Pro 在 ARC-AGI-2（一項抽象推理測試）中取得了 45.1% 的分數，Google 報告稱這比 Gemini 2.5 Pro 提高了九倍。它還在 LMArena 排行榜上以超過 1500 的 ELO 評級獲得了第一名，超越了 GPT-4 和 Claude。此外，它在研究生級別的科學基準測試 GPQA 中獲得了 93.8% 的分數。

市場影響

Gemini 3 的發布直接挑戰了 OpenAI 和 Anthropic 等市場領導者，利用卓越的基準效能作為關鍵差異化因素。Google Antigravity 平台的推出，被描述為「AI 優先 IDE」，是吸引開發人員的策略舉措。透過提供用於建構代理式 AI 的專用工具，Google 旨在成為下一波 AI 應用（尤其是在企業自動化領域）的基礎生態系統。

這種對「數位員工」的關注使 Google 能夠抓住一個重要的市場趨勢，即 AI 和軟體機器人越來越多地被部署來處理金融、物流和醫療保健等領域的複雜業務流程。透過 GUI 與現有軟體互動的能力降低了自動化缺乏專用 API 的工作流程的障礙。

專家評論

儘管功能令人印象深刻，但專家指出局限性依然存在。AI 研究員 Andrej Karpathy 獲得了早期存取權限，他分享了一個事件：Gemini 3 拒絕相信當前日期是 2025 年，並指責他試圖耍花招。這凸顯了即使在高度有能力的模型中，AI 可靠性和基礎性方面的持續挑戰。

生成式 UI 的概念與 Nielsen 等專家在 2023 年描述的新範式相符，即使用者陳述期望的結果而不是實現它的步驟。根據 Google 自己的聲明，這種方法可以實現更直觀、更強大的人機互動。

更廣闊的背景

Gemini 3 的架構支持「數位員工」日益增長的趨勢，從根本上重塑了現代勞動力。產業分析表明，AI 代理和機器人很快就能管理許多企業中一半或更多的任務。這種轉變不僅是為了取代人力勞動，也是為了增強人力勞動。Amazon 等公司已經表明，對自動化和機器人技術的投資會創造新的角色，例如機器人維護技術員和 AI 系統經理。Gemini 3 的工具集，特別是 Antigravity 平台，提供了大規模建構和部署這些數位對應物的基础設施，加速了全球經濟的這種轉型。

Google 發表 Gemini 3，具備生成式 UI 與進階推理功能，加劇 AI 市場競爭

Edgen Stock

概要