日本一区二区三区久久-日本一区二区三区久久精品-日本一区二区三区日本免费-日本一区二区三区在线观看视频-国产不卡免费视频-国产不卡视频

關(guān)于ZAKER 合作
虎嗅APP 22小時(shí)前

谷歌的 Deep Research 效果怎么樣?

本文來(lái)自微信公眾號(hào):王智遠(yuǎn),作者:王智遠(yuǎn),題圖來(lái)自:視覺(jué)中國(guó)

去年 12 月,谷歌推出了 Gemini Deep Research。

什么是 Deep Research?它像一個(gè) AI 助理一樣,輸入一個(gè)問(wèn)題,它立馬能搜索、規(guī)劃、推理、最后形成一個(gè)報(bào)告。

今年,它做了大升級(jí)。升級(jí)后能力凸顯在三方面:

1. 它能幫你把一個(gè)大問(wèn)題拆成幾個(gè)小問(wèn)題,一個(gè)一個(gè)解決;

2. 能從很多不同的地方找到信息,分析幾百個(gè)來(lái)源;

3. 特別快,幾分鐘就能做出一個(gè)詳細(xì)的報(bào)告,從計(jì)劃到總結(jié),全都有。而且,它還能處理超過(guò) 45 種語(yǔ)言。

官方說(shuō)的是,目前免費(fèi)試用,我用免費(fèi)賬號(hào)折騰半天不行,后來(lái)用一個(gè) Gemini Advanced 賬號(hào),一下子就能用了。

體驗(yàn)地址是:https://gemini.google.com

打開(kāi) Gemini 的網(wǎng)頁(yè),登錄后,你可以在左上角切換不同的模型,現(xiàn)在有五種。

2.0 Flash 適合快速回答問(wèn)題,處理簡(jiǎn)單任務(wù);2.0 Flash Thinking 能分析復(fù)雜問(wèn)題;Personalization 會(huì)根據(jù)你的習(xí)慣調(diào)整回答;2.0 PRO(Experimental)是還在測(cè)試的高級(jí)版本,適合專(zhuān)業(yè)人士。

最后說(shuō)說(shuō),它的第五個(gè)能力:Deep Research

話(huà)不多說(shuō),直接在 Gemini Deep Research 里輸入了一個(gè)問(wèn)題:幫我寫(xiě)一個(gè)關(guān)于 Gemini Deep Research 的深度研究報(bào)告。

它很快給我擬定了一個(gè)方案。這個(gè)方案列出 7 條主要內(nèi)容。每一條都很清晰,具體是這樣的:

第一條,先整理 Gemini Deep Research 的官方資料。

第二條,分析這個(gè)工具可以用在哪些場(chǎng)景,還有它的主要特點(diǎn)是什么。

第三條,去找一些用戶(hù)對(duì)這個(gè)工具的評(píng)價(jià),看看大家用起來(lái)覺(jué)得哪里好、哪里不好。

第四條,收集一些專(zhuān)業(yè)人士的測(cè)評(píng)和分析,看看專(zhuān)家們是怎么評(píng)價(jià)它的。

第五條,它會(huì)找一些和 Gemini Deep Research 類(lèi)似的工具,做一個(gè)對(duì)比,看看它在競(jìng)爭(zhēng)中有什么優(yōu)勢(shì)或者不足;第六條,研究一些實(shí)際使用過(guò)的案例,看看這個(gè)工具在解決實(shí)際問(wèn)題時(shí)表現(xiàn)如何。

最后一條,也就是第七條,它會(huì)深入探討這個(gè)工具的技術(shù)原理,評(píng)估數(shù)據(jù)是否可靠、準(zhǔn)確;同時(shí),它還會(huì)把工具放在更大的學(xué)術(shù)背景中,看看在整個(gè)領(lǐng)域里的水平如何,未來(lái)發(fā)展?jié)摿υ趺礃印?/p>

方案列完后,它問(wèn)我:你覺(jué)得這個(gè)方案行不行?如果覺(jué)得沒(méi)問(wèn)題,可以直接開(kāi)始研究了。

從整個(gè)研究結(jié)構(gòu)來(lái)看,它確實(shí)比我個(gè)人想得更全面。

至少它不僅提供了背景資料,還給出優(yōu)劣勢(shì)分析、專(zhuān)業(yè)人士的測(cè)評(píng)、工具對(duì)比,以及最后在更大背景下的表現(xiàn)評(píng)估;所以,在我看來(lái),這更像一份簡(jiǎn)單而完整的工具測(cè)評(píng)報(bào)告。

我確認(rèn)方案后,它便開(kāi)始了工作。

一開(kāi)始,它從 7 個(gè)網(wǎng)站中幫我查找資料,這些網(wǎng)站包括 ZDNet、YouTube.com、SearchEngineJournal、Google、播客,以及 WorkspaceUpdates.Google 等。

這些網(wǎng)站可能會(huì)提供有關(guān) Google Gemini 的基礎(chǔ)信息、使用教程、新聞報(bào)道或者用戶(hù)支持等內(nèi)容。

找資料過(guò)程中,我發(fā)現(xiàn)它把核心功能、關(guān)鍵特點(diǎn)、技術(shù)亮點(diǎn)都整理得清清楚楚。

接著,它開(kāi)始了下一步:

從更多地方收集信息。它訪(fǎng)問(wèn)了 Reddit、How-To Geek、SectionSchool、Google 的官方頁(yè)面,以及 SearchEngineJournal。

我覺(jué)得,這些網(wǎng)站選擇,它主要為了獲取幾類(lèi)不同信息。

首先是用戶(hù)的討論和評(píng)價(jià)。它想看看大家實(shí)際用起來(lái)感覺(jué)怎么樣,我還隨機(jī)點(diǎn)開(kāi)了幾個(gè) Reddit 頁(yè)面,發(fā)現(xiàn)它不僅抓取了博主寫(xiě)的文章內(nèi)容,還提取了下面的評(píng)論。

這些評(píng)論往往是用戶(hù)的真實(shí)感受,特別有參考價(jià)值。

第二類(lèi)是教程和學(xué)習(xí)資料。像 How-To Geek 和 SectionSchool 這樣的網(wǎng)站,會(huì)提供詳細(xì)的使用指南或者教學(xué)資源。

第三類(lèi)是官方信息;最后一類(lèi)是專(zhuān)業(yè)分析和評(píng)價(jià)。SearchEngineJournal 這個(gè)網(wǎng)站專(zhuān)注于 SEO 和數(shù)字營(yíng)銷(xiāo),上面有不少專(zhuān)業(yè)人士對(duì)工具的深入分析和評(píng)測(cè)。

所以,我認(rèn)為,這一步,它想全面收集用戶(hù)反饋、專(zhuān)業(yè)解讀、使用教程和官方的公告;這樣的信息組合,確實(shí)能讓人從不同角度了解 Google Gemini。

然后,它總結(jié)了三個(gè)重點(diǎn):

它說(shuō):我看了用戶(hù)對(duì)產(chǎn)品的評(píng)價(jià),發(fā)現(xiàn)體驗(yàn)各不相同。大家普遍贊賞,工具能幫他們節(jié)省時(shí)間,快速了解主題或者寫(xiě)個(gè)初步報(bào)告。

不過(guò),也有人擔(dān)心質(zhì)量問(wèn)題,工具在判斷信息來(lái)源的可靠性上可能不夠好,有時(shí)候,生成的信息太泛泛,不夠深入。還有人提到,工具會(huì)突然中斷,導(dǎo)致研究失敗。

在比較方面,它說(shuō),有些用戶(hù)把 GEMINI Deep Research 和 Perplexity、DeepSeek 做了對(duì)比。

一些人認(rèn)為 Perplexity 在講故事和挖細(xì)節(jié)上做得更好,而 DeepSeek 的新模型在研究質(zhì)量和速度上表現(xiàn)最佳;甚至,ChatGPT 在某些情況下能提供更高質(zhì)量的研究結(jié)果;這些比較顯示,Deep Research 在某些方面可能還有提升的空間。

通過(guò)這一步詳細(xì)拆解,我認(rèn)為細(xì)節(jié)對(duì)我?guī)椭艽蟆.吘梗瑒e人對(duì) Deep Research 的看法,是他們的本地知識(shí),這些有助于做商業(yè)分析用。

第三步研究中,它開(kāi)始尋找更專(zhuān)業(yè)的知識(shí)。

看了看它推薦的 9 個(gè)網(wǎng)站,發(fā)現(xiàn)網(wǎng)站和第二步里的不一樣。它們更關(guān)注怎么提高工作效率的工具、人工智能研究,還有戰(zhàn)略和市場(chǎng)分析這些內(nèi)容。

看起來(lái)這些網(wǎng)站挺權(quán)威,里面有技術(shù)支持文檔、新聞博客、社交討論和專(zhuān)業(yè)教程,各種信息都有。

我覺(jué)得,這些網(wǎng)站是對(duì)之前研究的一個(gè)補(bǔ)充,之前分析了好壞,現(xiàn)在要找更專(zhuān)業(yè)、更深入的信息。

所以,它給我的結(jié)論是:Deep Research 功能很強(qiáng),但在準(zhǔn)確性上還得提高;還有,Gemini 2.0 的深度思考模型是個(gè)重要的升級(jí)。

接下來(lái)第四步、第五步和第六步,步驟都差不多。它找的是些專(zhuān)業(yè)網(wǎng)站。它主要關(guān)注三個(gè)方面:

專(zhuān)家怎么說(shuō),怎么評(píng)價(jià);

看看實(shí)際用起來(lái)怎么樣,有沒(méi)有案例;

再深挖一下技術(shù)原理和數(shù)據(jù)來(lái)源。

這個(gè)過(guò)程,像從不同角度,找問(wèn)題的答案和評(píng)價(jià)。

它給出的結(jié)論也挺清楚。專(zhuān)家們覺(jué)得工具挺有潛力,特別是在升級(jí)到 Gemini 2.0 Flash Thinking Experimental 模型后,規(guī)劃、搜索、推理和報(bào)告的能力都提高了不少。

專(zhuān)家們還說(shuō),它免費(fèi)對(duì)所有人開(kāi)放,這在和 ChatGPT 這些競(jìng)爭(zhēng)對(duì)手比起來(lái),是很大優(yōu)勢(shì)。不過(guò),他們也指出了一些不足,比如:信息來(lái)源的可靠性、準(zhǔn)確性,還有避免生成不符合事實(shí)的內(nèi)容,這些地方還要改進(jìn)。

但是,我個(gè)人有點(diǎn)遺憾的是,在實(shí)際案例這部分,它并沒(méi)有給出具體的應(yīng)用例子,只是提了幾個(gè)問(wèn)題。

比如:處理需要專(zhuān)業(yè)知識(shí)或最新信息的復(fù)雜主題時(shí),表現(xiàn)怎么樣?生成的報(bào)告準(zhǔn)不準(zhǔn)確、深入不深入、有沒(méi)有用?

這些問(wèn)題,它都沒(méi)有回答。

還有,技術(shù)原理和數(shù)據(jù)來(lái)源這部分,也沒(méi)有給出清晰的對(duì)比。我點(diǎn)開(kāi)它給的 9 個(gè)網(wǎng)站,發(fā)現(xiàn)確實(shí)有一些技術(shù)對(duì)比的內(nèi)容,但它沒(méi)有很好地展示這些信息,感覺(jué)有點(diǎn)匆忙。

所以,我理解的是:后面步驟不夠細(xì)致,有些草率。

可能因?yàn)槟芰€有局限,特別是專(zhuān)家分析、實(shí)際案例部分,它應(yīng)該做個(gè)表格,把幾者的對(duì)比都展示出來(lái),這樣可以清楚地展示 Gemini 2.0 深度研究和其他深度研究能力上的對(duì)比,這樣更有說(shuō)服力,也更容易理解。

第七步是:學(xué)術(shù)信息收集。

我注意到,它對(duì)學(xué)術(shù)研究特別感興趣,它搜了 27 個(gè)學(xué)術(shù)網(wǎng)站,想找些和深度研究有關(guān)的文獻(xiàn),還有 AI 在學(xué)術(shù)界的應(yīng)用信息。

但是呢,最后得出的結(jié)論太匆忙了。簡(jiǎn)單說(shuō)了兩句:開(kāi)發(fā)團(tuán)隊(duì)訓(xùn)練的模型能很好地做計(jì)劃,還設(shè)計(jì)了個(gè)任務(wù)管理器;這些是大家一看就知道,我本來(lái)希望能看到更深入的研究結(jié)果。

比如說(shuō):

怎么讓模型更準(zhǔn)確?有哪些具體的改進(jìn)方法?需要哪些技術(shù)能力?甚至怎么優(yōu)化架構(gòu)等等。

還有,做完學(xué)術(shù)信息收集后,它突然又來(lái)了一句:之前用工具時(shí)出了語(yǔ)法錯(cuò)誤,得修正一下,這樣才能拿到最新信息。

這讓我覺(jué)得,它在用搜索工具獲取信息時(shí),可能還有遺漏,不夠完善;換句話(huà)說(shuō),它的表現(xiàn)還不穩(wěn)定,甚至因?yàn)榧夹g(shù)上的小問(wèn)題,影響了最后的結(jié)果質(zhì)量。

最后,我下載了它生成的報(bào)告,一看整整 8700 字。

不過(guò),把不太重要的內(nèi)容去掉,最核心的部分是關(guān)于用戶(hù)體驗(yàn)和反饋。這部分它確實(shí)做得不錯(cuò),不僅做了深入研究,還詳細(xì)列出了優(yōu)點(diǎn)和缺點(diǎn),甚至還用表格進(jìn)行了對(duì)比,非常直觀。

另一部分讓我比較欣賞的是,它把自家工具和其他人工智能研究工具做了詳細(xì)的對(duì)比分析;這部分內(nèi)容挺實(shí)用,能讓人清楚地看到它的優(yōu)勢(shì)和不足。

至于技術(shù)分析和學(xué)術(shù)研究的部分,寫(xiě)得有點(diǎn)太理論化了,像在堆砌術(shù)語(yǔ),實(shí)際參考價(jià)值不大,讀起來(lái)像 " 八股文 " 一樣枯燥。

值得一提的是,8700 字的報(bào)告里,一共引用了 28 個(gè)鏈接,而鏈接加起來(lái)差不多占了 1000 字的篇幅;如果除去這 1000 字,再加上報(bào)告開(kāi)頭和結(jié)尾那些常規(guī)性的內(nèi)容,仔細(xì)算算,真正有價(jià)值的信息還能剩下多少呢?

所以,要我評(píng)價(jià)的話(huà),主要有三點(diǎn):

1. 和國(guó)內(nèi)的產(chǎn)品如 Kimi、Qwen、豆包、夸克相比,它絕對(duì)是領(lǐng)先的;它能生成這么長(zhǎng)的報(bào)告,還能調(diào)動(dòng)多種能力,從用戶(hù)體驗(yàn)上來(lái)說(shuō),國(guó)內(nèi)很多產(chǎn)品目前還做不到這一點(diǎn)。它的綜合表現(xiàn)確實(shí)更勝一籌。

2. 記憶能力和處理長(zhǎng)文本的能力還是很強(qiáng)的。相比之下,國(guó)內(nèi)一些產(chǎn)品在生成報(bào)告時(shí),后半部分會(huì)顯得比較隨意,有些草率。

當(dāng)然,Gemini 的深度搜索也存在類(lèi)似的問(wèn)題,但沒(méi)有國(guó)內(nèi)產(chǎn)品那么嚴(yán)重,整體表現(xiàn)依然更穩(wěn)定。

3. 和 Manus 相比,它在工具調(diào)用方面還有不足。Manus 能生成 PDF,可視化能力也很強(qiáng)。Gemini 深度搜索在這方面就顯得遜色,它最多提供一個(gè)類(lèi)似 Word 文檔的文件,里面帶一個(gè)非常簡(jiǎn)單的表格。

在工具調(diào)用和功能擴(kuò)展上,Gemini 深度搜索顯然還有提升的空間。

值得一提的是,Gemini 本周的密集更新,無(wú)疑讓它的地位在生態(tài)系統(tǒng)里變得更重要的,高頻的優(yōu)化和功能擴(kuò)展,也讓它在競(jìng)爭(zhēng)中占據(jù)了更有利的位置。

今年是 Agent 元年,AI 在 TOC 領(lǐng)域的這波機(jī)會(huì),它自然不能錯(cuò)過(guò);這種加速,無(wú)疑也把壓力傳給了其他競(jìng)爭(zhēng)對(duì)手。

本文來(lái)自微信公眾號(hào):王智遠(yuǎn),作者:王智遠(yuǎn)

相關(guān)標(biāo)簽

相關(guān)閱讀

最新評(píng)論

沒(méi)有更多評(píng)論了
主站蜘蛛池模板: 伊人色综合久久天天网蜜月 | 一国产一级淫片a免费播放口 | 久久精品国产400部免费看 | 三级网站免费看 | 91香蕉国产线观看免 | 亚洲人成网址在线播放a | 99在线精品免费视频 | 九九99re在线视频精品免费 | 在线国产一区 | 欧美日韩一区二区综合 | 99久久精品男女性高爱 | 久久一区二区三区免费播放 | 秀人网私拍福利视频在线 | 久久精品高清视频 | 国产99久久亚洲综合精品 | 国产免费怡红院视频 | 日韩一级在线 | 久久悠| 本道久久综合88全国最大色 | 三级理论手机在线观看视频 | 亚洲国产精品免费在线观看 | 久草免费福利视频 | av在线亚洲男人的天堂 | 在线播放亚洲美女视频网站 | 久在草在线| 这里只有精品国产 | 久久免费高清 | 国产日产欧美a级毛片 | 秘书高跟黑色丝袜国产91在线 | 亚洲欧美激情视频 | 亚洲国产精品综合久久20 | 国产在线视频h | 韩国免费a级毛片 | 欧美大片在线播放 | 久久综合网址 | 新版天堂资源中文在线 | 欧美一级高清在线观看 | 91亚洲综合 | 99久久精品免费观看国产 | 手机在线国产精品 | 欧美一级二级片 |