Google最新推出的深度研究工具能處理海量資料分析,同日OpenAI強勢發表代號「Garlic」的GPT-5.2模型,兩大科技巨頭同日過招引發熱議。
Google日前推出具備深度推論能力的Gemini Deep Research代理工具,堪稱該公司至今最強大的研究型AI。這款工具不僅能消化超長篇幅的提示內容,更整合了Gemini 3 Pro模型技術,號稱是當前「事實準確度最高」的AI系統,能有效降低執行複雜任務時產生幻覺的可能性。
這對於需要長時間自主決策的深度推理任務至關重要——當大型語言模型需要連續做出數十個判斷時,只要其中一個判斷出錯,就可能導致整個分析報廢。目前金融盡職調查、藥物毒性安全研究等領域已開始採用這項工具。
Google表示將把Deep Research逐步整合至Google搜尋、Google財經、Gemini App及筆記工具NotebookLM等服務,此舉被視為朝「人類不再親自Google搜尋,改由AI代理代勞」的未來邁出關鍵一步。
為驗證技術實力,Google特別開發名為DeepSearchQA的基準測試工具,並在Humanity’s Last Exam與BrowserComp兩項測試中擊敗多數競爭對手。不過有趣的是,OpenAI的ChatGPT 5 Pro在BrowserComp項目仍以些微優勢領先。
就在Google公開測試結果的同日,OpenAI閃電發表代號「Garlic」的GPT-5.2模型,官方宣稱新版模型已在多項基準測試中全面超越競爭對手。業界分析雙方刻意選在同日較勁,意味著AI代理戰爭已進入白熱化階段。
手機巴士






