面對如此冷門的問題,恐怕連最資深的學者都會陷入沉思。既不知道詩人姓名,又不清楚年表名稱,傳統搜索引擎在這里完全失靈,兩個看似毫不相關的信息點就像大海中的兩粒沙子,讓人無從下手。
這不禁讓人震驚:什么時候 AI 已經進化到如此程度?
要知道,就在半年前,Agent 還被普遍認為是玩具屬性大于工具屬性。大部分產品內測名額一票難求,實際表現卻頻頻翻車。
盡管最初效果不如人意,智能體的進化速度卻很快。如今,在營銷、醫療等專業領域,Agent 的表現甚至已超過人類水平。
今天,我們一起來扒一扒上半年有哪些智能體,已經超出了我們以往的想象。
這樣復雜的任務,即使放給市面上最優秀的大模型,也可能一籌莫展。但一款名叫 Shortcut 的智能體卻在短短 10 分鐘內完成了,不僅準確率超 80%,時間比人類快了整整 10 倍。
Excel 世錦賽有多難?
它由微軟官方背書、FMWC 組委會運營,任務涵蓋復雜函數、Power Query、動態數組、蒙特卡洛模擬等,被選手形容為 " 最殘忍的函數修羅場 "。參賽選手來自全球各地,多為投行數據分析師、四大財務建模總監、微軟前 MVP,學歷資歷含金量拉滿。
對此,Shortcut 不僅克服了傳統 AI 模型在數據處理量上的限制,更完美避開了幻覺輸出的痛點。面對海量無序數據和確定性極強的函數規則,它能像經驗豐富的分析師一樣,快速理解任務需求并給出精準解決方案。原本需要人類選手 1~2 小時才能完成的賽題,Shortcut 僅用 10 分鐘就交出了完美答卷。
據開發團隊透露,Shortcut 支持自然語言指令交互,能輕松應對金融建模、5000 行 CSV 數據分析、數據可視化甚至像素畫創作等復雜任務。其核心能力涵蓋智能填充、錯誤自動排查、多表關聯分析等專業功能,堪稱 Excel 領域的六邊形戰士。
看到這樣的財務人員,或許會直呼遇到了救星。
而 Shortcut 的出現則打破局面,給這個痛點帶來了新的可能。
畢竟,5000 行 CSV 數據如果一行一行錄入校對,可將近一周的工作量。現在,盡管 Shortcut 仍存在復雜函數作圖出錯的可能,但就是解決單一的信息整理工作,也能挽救他們日漸稀少的發量了。
竟對公司以為對方請來了高人,客戶認為自己在自主決策?不,他們可能早已掉進 Agent 精心設計的溫柔陷阱。
數據顯示,一個傳統業務員的成單率一般在 10%~15%。而一款叫 Agentforce 的智能體成單率卻達到了 50%。自 2024 年上線以來,成單超過 8000 單。
第一點,要休息的人類拼不過輪軸轉的機器。跨國貿易中流傳著一句話,誰越能熬夜,誰就越能賺錢。時差的存在產生了外貿的白夜班作息,但仍然沒有人能 24h 堅守崗位,在顧客決定下單的那一時間精準說服他。Agentforce 做到了,它像一臺永不疲倦的數字銷售系統,在 7 × 24h 模式下并發處理數千條對話,把人工坐席數減少 30~60%。
第二點,統一刻板的話術比不過八面玲瓏的 " 奉承 "。為什么客戶在下單時常常意識不到是 AI 讓它動心了呢?因為在 21 世紀,真的找不到比 AI 更會阿諛奉承的角色了。傳統銷售依賴人力,業務員靠經驗判斷客戶意向,受個人情緒、疲勞度影響,很難編織出對胃口的話。但 Agentforce 能夠實時分析官網瀏覽、郵件互動等行為痕跡,鎖定高意向目標,并通過情感分析自動調整話術,提升后續轉化率。
我們有理由相信,在未來,Agent 業務員將會進攻到每一個交易領域,不管是大宗商品、還是小本生意,它的成交率將越來越高、成交范圍也會越來越廣。
我們都知道,AI 已經走進了各個領域,醫療也不例外,但對于直接吃 AI 開的藥,或許大部分人還是會膽戰心驚。畢竟,用藥量的微小差異可能導致成癮性,用藥方案的微小偏差也可能引發嚴重的副作用,可謂失之毫厘、謬以千里。
但如果告訴你,AI 醫生的診斷準確率甚至超過了專業醫生,你能相信嗎?
在美國,一款名叫 Polaris 的醫療 Agent 能夠為患者提供真實的用藥意見,醫療建議準確率超過 99%,遠高于美國注冊護士 81% 的平均水平。并且,該智能體推薦的藥品和復診意見,在病人的好評率中趨近于 90%。這意味著,AI 不僅比人準,甚至比人更受患者信任。
Polaris 由三個 Agent 共同出診,而非單一模型獨立決策。例如,當患者詢問某種藥物的副作用時,實驗室 Agent 檢索最新的藥物臨床試驗數據,確保信息基于權威醫學研究;藥物 Agent 核對患者的用藥史、過敏記錄,避免潛在的藥物相互作用風險;主要 Agent 綜合前兩者的分析,生成最終建議,并標注置信度。
為了進一步保證用藥安全和患者福利,超過 6500 名護士、500 名醫生參與了最終安全評估,助力該系統獲得 FDA 認可的醫療 AI 專利。
據悉,在阿聯酋,Polaris 已被整合進 Burjeel 醫療集團的數字系統。在超過 185 萬次真實患者互動測試中,Polaris3.0 臨床準確率高達 99.38%,患者滿意度達 8.95/10。
不難看出,短短一年,智能體已經逐漸超出了人們的想象。從這些智能體的發展軌跡中,我們能清晰地看到一個趨勢:Agent 正在從概念走向實用,從實驗室走進我們的日常工作生活。它們不是冷冰冰的機器,而是逐漸成為各領域專業人士的得力助手。WebSailor 讓研究人員不再被海量文獻淹沒,Shortcut 解放了財務人員的雙手,Agentforce 成為銷售團隊的秘密武器,Hippocratic 則是醫護人員的第二大腦。
這些智能體最可貴之處在于,它們并非要取代人類,而是通過彌補人類在效率、記憶力和計算能力上的局限,讓我們能把更多精力投入到真正需要人類智慧的領域。就像望遠鏡延伸了人類的視野,這些 Agent 工具正在擴展我們的認知邊界。
在可以預見的將來,我們每個人或許都會擁有一個甚至多個智能體作為助手:幫我們學習新知識的 Agent 導師、管理日程的 Agent 秘書、照顧健康的 Agent 醫生、創作內容的 Agent 伙伴……但就像歷史上所有偉大的工具一樣,它們不會取代我們,但會讓我們變得更強,最終成為人類能力的一部分。