谷歌Gemini 2.0發(fā)布,我看到了Web的未來(lái)
Napoleon Chan / 2024-12-12 14:3962977OpenAI的超長(zhǎng)發(fā)布會(huì)還沒(méi)結(jié)束,谷歌便火速推出Gemini 2.0系列的第一個(gè)版本——Gemini 2.0 Flash測(cè)試版。
在介紹中,Gemini 2.0 Flash的一些關(guān)鍵性能優(yōu)于Gemini 1.5 Pro,同時(shí),Gemini 2.0 Flash還加入多模態(tài)推理、原生調(diào)用Google搜索、復(fù)雜的指令跟蹤和規(guī)劃等功能。最令人期待的一定是Deep Research,它實(shí)現(xiàn)的功能就是作為“AI代理人”來(lái)做規(guī)劃,重點(diǎn)在于,它將突破次元壁,向通用AI更近一步。

在谷歌介紹中,新發(fā)布的Gemini 2.0將首次涉足「AI代理時(shí)代」,換句話說(shuō),我們可以將一部分網(wǎng)絡(luò)和現(xiàn)實(shí)的控制權(quán)移交給AI處理,它會(huì)代替我們處理許多“現(xiàn)實(shí)問(wèn)題”。比如,你想買(mǎi)新手機(jī),可能會(huì)進(jìn)行很多對(duì)比,還需要考慮促銷(xiāo)、是否缺貨等因素,這些繁瑣的步驟可以全部交由Gemini來(lái)處理。
結(jié)合前段時(shí)間泄露的消息,2025年谷歌可能發(fā)布的Jarvis AI能夠訪問(wèn)網(wǎng)站,甚至可以在用戶(hù)許可下完成在線購(gòu)物,以及填寫(xiě)表格等操作。換句話說(shuō),如果得到用戶(hù)允許,它甚至可以幫你下單,你在家等待新手機(jī)即可。

Gemini團(tuán)隊(duì)的高級(jí)產(chǎn)品經(jīng)理解釋說(shuō):“當(dāng)Gemini Deep Research瀏覽網(wǎng)頁(yè)時(shí),它會(huì)對(duì)發(fā)現(xiàn)的內(nèi)容進(jìn)行推理,以弄清楚下一步要尋找什么。從本質(zhì)上講,這是一種通過(guò)內(nèi)容進(jìn)行探索和學(xué)習(xí)的全新方向。”
在功能上看,Gemini Deep Research是一個(gè)推理模型,最大的不同是,它可以跟互聯(lián)網(wǎng)有完整交互。

在Deep Research上線后,Gemini可以像人類(lèi)一樣瀏覽網(wǎng)絡(luò),通過(guò)搜索、找到有趣的內(nèi)容,然后根據(jù)它所學(xué)到的信息再進(jìn)行新的搜索。它可以多次執(zhí)行此操作,直到確定它有足夠的信息來(lái)根據(jù)用戶(hù)的提示生成最終結(jié)論。
谷歌把Gemini Deep Research描述成“代理人”,這會(huì)讓AI助理突破次元壁,不免讓人擔(dān)心這將打開(kāi)“潘多拉的魔盒”。

針對(duì)這些擔(dān)憂,谷歌現(xiàn)階段的限制原則是,它不適用于付費(fèi)專(zhuān)區(qū)的研究論文或網(wǎng)站,也不適用于需要登錄才能訪問(wèn)的網(wǎng)站,未來(lái)是否開(kāi)放這些限制還不得而知。
現(xiàn)實(shí)是,谷歌的Gemini正在悄悄更新,AI代理的想法讓人擔(dān)憂。試想,當(dāng)谷歌正式解禁Deep Research全部功能后,我們也許會(huì)看到“AI代理人”逐漸成為網(wǎng)絡(luò)社會(huì)的主流,寫(xiě)代碼、預(yù)訂機(jī)票和酒店,甚至連玩游戲都不用親力親為。對(duì)人類(lèi)來(lái)說(shuō),這樣的未來(lái)是更封閉,還是更開(kāi)放?
谷歌Gemini 2.0發(fā)布,我看到了Web的未來(lái)














滬公網(wǎng)安備 31010702005758號(hào)
發(fā)表評(píng)論注冊(cè)|登錄