這個夏天,一個數據不僅在 AI 圈內引起了關注,更牽動了千萬中國家庭的心:不到一個月,超過 1000 萬份詳盡的高考志愿報告,由一個具備深度研究能力的 Agent 免費生成。
這不是一次技術演示,而是一項直接關系到未來的高風險服務。提供這項服務的,是阿里的夸克。在一次內部技術溝通會上,夸克算法負責人蔣冠軍將志愿報告定義為 " 是夸克深度研究技術的一次重要實踐 " 。
這引出了一個值得探討的問題,當許多 AI 應用還停留在看似萬能但可能不可靠的階段時,夸克是如何在一個零容錯的場景里,實現大規模深度落地的?它的實踐,為我們提供了一個觀察 AI 如何從玩具走向工具再進化為智能助手的真實樣本。
用戶具體是如何與這個 Agent 互動的呢?過程十分簡單,用戶輸入分數等基本信息后,用日常說話的方式告訴 Agent 自己的想法,比如想去哪個城市、對什么專業感興趣。Agent 隨后會生成一份包含完整志愿表的深度報告。用戶可以反復修改想法,多次生成報告,夸克方面提到,有用戶甚至生成了一百多份報告來輔助決策。
每年高考后,志愿填報的復雜性都會被重新討論。近 3000 所高校、超過 2000 個專業,構成了一個巨大的信息迷宮 。近幾年,隨著 " 張雪峰 " 等志愿填報專家的走紅,也反映了市場的核心痛點,考生和家長缺的不僅是信息,更是一個能幫忙做復雜決策的可信顧問,這也催生了一個魚龍混雜的志愿填報服務行業。
AI 能成為這個顧問嗎?蔣冠軍的看法很坦誠," 當前這個階段,AI 肯定是替代不了考生自己的決策 " 。那么,夸克要做的,或者說 AI 現階段能做到的是什么?
答案或許不是替代,而是成為一個靠譜的輔助決策系統。所謂的靠譜,體現在它如何處理現實世界中那些模糊、甚至矛盾的復雜需求上。
比如,當用戶的理想與現實沖突時。一個常見的需求是 " 想留在本省的好城市,但分數只夠得上外省的 985 院校 " 。一個簡單的工具可能會陷入邏輯死循環,但夸克的 Agent 會嘗試像真人顧問一樣權衡,它可能會主動拓寬選項,為你展示 " 省外 985" 和 " 省內頂尖 211" 各自的利弊,將決策權交還給你 。
更有挑戰性的是當用戶的需求本身就自相矛盾。夸克高考算法負責人唐亮提到了一個典型場景," 數學成績差,但想報考計算機 " 。這背后是學生對專業要求的不了解。此時,一個負責任的 Agent 不應盲目執行指令,而是會觸發一個需求澄清流程,溫和地提示其中的風險,并引導用戶探索更適合的選項 。
處理復雜場景的能力讓 AI 從一個冰冷的執行機器,向一個能與人商量、值得參考的顧問角色邁進了一步。而要實現這一切,靠的不是單一的模型技巧,而是在后臺,一套笨重但扎實的系統工程。
" 笨功夫 " 與 " 精細活 "
" 信任 " 是 Agent 在嚴肅場景落地的基石。夸克構建信任的方式,可以歸結為兩種,一種是下笨功夫,另一種是做精細活。
笨功夫下在了數據上。夸克做了幾件臟活累活,他們搜集了 8657 個權威站點進行分級,將超過 10 萬份 PDF、Word 等非標內容數字化,并組織上百人團隊對關鍵數據進行人工校驗,以確保準確率達到 "4 個 9"(99.99%)的水平。
這些工作聽起來沒有算法那么炫酷,但它們共同構成了一個高可信度的知識庫,是模型能做出正確判斷的前提。
而精細活則體現在模型的調校上,必須為其注入垂直場景的靈魂 。夸克為此設計的訓練范式,層層遞進:整個過程始于 SFT(監督微調),讓模型學習上萬條真實專家的推理邏輯,學會像專家那樣去分析問題、組織語言 。
在此基礎上,利用 RLVR(可驗證獎勵強化學習),針對有標準答案的事實性問題進行自動化校驗,這就像給模型配備了一個 24 小時的事實核查員,大幅降低 " 幻覺 " 。
而對于沒有標準答案的開放性問題(如專業前景),則通過 RLHF(基于人類反饋的強化學習),引入大量真實專家對 Agent 生成的方案進行打分,讓模型的 " 品味 " 和 " 策略觀 " 向人類專家看齊 。
正是這套笨功夫加精細活的組合,讓 Agent 的決策不僅基于概率,更基于經過治理的、可信的知識與經驗。
夸克志愿報告的成功,是在一個垂直應用場景的勝利。但在更深的層面,它更像一次路演,展示了深度研究技術落地的一種可能性。
今天的 AI 行業,并不缺少聰明的產品。許多大模型應用能寫詩、繪畫、寫代碼、做復雜的邏輯推理,但在單個具體任務上,卻往往缺乏穩定和可信賴的表現。用戶很難將一項嚴肅、高風險的決策工作完全托付給它們。
夸克的選擇似乎有些逆流而動。它沒有去盲目追求一個無所不能的通用助手,而是像一位手藝人,選中了高考志愿這塊硬骨頭,并投入了長達七年的時間去打磨。其核心,是一種被夸克稱為 " 深度研究 " 的方法論。
所謂的深度并非僅指技術,更指一種能力。它體現在對場景的深刻理解上,團隊沒有把志愿填報看作一個簡單的概率預測問題,而是將其視為一個信息搜集、自我認知、未來規劃高度交織的復雜決策系統。
它也意味著對數據的極致治理,團隊選擇了一條更艱難的路——投入上百人力去做數據的線下搜集和人工校驗,以此來構建 Agent 可信度的地基。此種深度最終落實在對模型的精細對齊上,基于海量專家數據和用戶真實反饋,夸克團隊不斷對模型進行強化學習,讓它從一個概率機器逐漸成長為一個懂得權衡、善于溝通的決策伙伴。
" 志愿報告是我們對深度研究技術的一次重要實踐," 蔣冠軍的這句話很關鍵。高考場景,以其極高的復雜度和零容錯的要求,成為了這套深度研究方法論的最佳試煉場。
如今,這場高難度的路演結束了,夸克也已經推出了面向所有人的通用深度研究功能。這并非簡單的功能上新,而是將那套經過千萬次高壓測試后被驗證有效的方法論,開放給了更廣泛的用戶。它讓普通人處理復雜信息、進行深度分析時,也能擁有一個專家級的 Agent 助手。
在關于 AI 的討論中,我們聽過太多關于顛覆和革命的宏大敘事。但夸克的故事提供了一個更樸素的視角,AI 的價值,或許始于腳踏實地地解決一個真實的、具體的問題。
它不追求成為無所不知的神,而是努力成為一個在特定領域靠譜的專家。它沒有因為技術的復雜而忽視最根本的用戶需求,也沒有因為商業回報的不確定性而放棄對信息普惠的堅持。事實上,夸克已經連續 7 年為高考生和家長提供全免費、無廣告的高考信息搜索和志愿填報服務。
這意味著夸克并非 AI 浪潮下的投機者,而是將技術落地為社會價值的長期主義者,也讓今年的 Agent 應用更像是一場厚積薄發。超過 50% 的用戶來自三線及以下城市 ,以及深入鄉村的公益行動,都讓這項技術多了一份溫度。
或許,未來真正能改變我們生活的 AI,不是那個在云端不斷刷新性能分數的龐然大物,而是一系列像夸克志愿報告這樣,專注、深入、并真正融入我們工作與生活場景的 Agent 助手。
夸克的高考故事,可能只是這個新篇章的開始。