兩大模型連發,核心技術詳解
王海峰介紹,文心大模型 4.5 是多模態基礎大模型,文心 4.5 Turbo 源自文心 4.5,效果更好、成本更低;基于文心 4.5 Turbo,文心 X1 升級到 X1 Turbo,性能提升的同時,具備更先進的思維鏈,問答、創作、邏輯推理、工具調用和多模態能力進一步增強。在 C-Eval、CMMLU、MathVista、Math500 等多個基準測試集中,文心 4.5 Turbo 和 X1 Turbo 跟 DeepSeeK 與 GPT 模型相比,效果在伯仲之間。
大會現場,王海峰從基礎模型、后訓練、深度思考和數據等方面解讀了文心 4.5 Turbo 和 X1 Turbo 的關鍵技術。
文心 4.5 和 4.5 Turbo 都是多模態大模型,實現了文本、圖像和視頻的混合訓練。針對不同模態數據在結構、規模、知識密度上的差異,通過多模態異構專家建模、自適應分辨率視覺編碼、時空重排列的三維旋轉位置編碼、自適應模態感知損失計算等技術,大幅提升跨模態學習效率和多模態融合效果,學習效率提高近 2 倍,多模態理解效果提升超過 30%。
后訓練方面,百度研制了自反饋增強的技術框架,基于大模型自身的生成和評估反饋能力,實現了 " 訓練 - 生成 - 反饋 - 增強 " 的模型迭代閉環,不僅解決了大模型對齊過程中,數據生產難度大、成本高、速度慢等問題,而且顯著降低了模型幻覺,模型理解和處理復雜任務的能力大幅提升。
在訓練階段,研制了融合偏好學習的強化學習技術,通過多元統一獎勵機制,提升了對結果質量判別的準確率,通過離線偏好學習和在線強化學習統一優化,進一步提升了數據利用效率和訓練穩定性,并增強了模型對高質量結果的感知。得益于偏好信號與獎勵信號的融合運用,模型的理解、生成、邏輯和記憶等能力全面提升。
深度思考方面,突破了僅基于思維鏈優化的范式,在思考路徑中結合工具調用,構建了融合思考和行動的復合思維鏈,模型解決問題能力得到顯著提升。同時,結合多元統一的獎勵機制,實現了思考和行動鏈的端到端優化,大幅提升了跨領域的問題解決能力。
數據方面,打造了 " 數據挖掘與合成 - 數據分析與評估 - 模型能力反饋 " 的數據建設閉環,為模型訓練源源不斷地生產知識密度高、類型多樣、領域覆蓋廣的大規模數據。同時,數據建設流程具備良好的可擴展性,能夠輕松遷移到全新的數據類型,實現快速、高效的數據生產。
文心快碼發布 3.5 版本,累計服務 760 萬開發者
基于文心大模型的語言和代碼能力,百度研制了代碼智能體和智能代碼助手——文心快碼。代碼智能體,基于智能體的理解、規劃、反思,以及工具調用能力,用自然語言對話,即可實現應用的自動開發,并支持多輪交互,迭代優化代碼質量,實現了無代碼編程,讓人人都可以成為程序員。
智能代碼助手,幫助專業的程序員更高效地寫出更好的代碼。據介紹,文心快碼 3.5 版主要突破了四大核心能力:一是代碼智能體引擎,支持多模態編程、開發工具調用、應用預覽,實現「需求 - 編碼 - 調試 - 驗證」端到端生成;二是代碼預測改寫引擎,新增光標預測與多行智能改寫,可精準實現復雜的代碼的增加、刪除和修改;三是上下文引擎,結合文心 4.5 和 X1 的推理能力,更懂開發者意圖,回答問題更準確;最后是更開放的研發生態,通過 MCP 接入協議,全面兼容主流開發工具鏈。目前百度每天新增的代碼中,文心快碼生成的代碼占比已超過 40%。最新數據顯示,文心快碼向全社會開放,累計服務 760 萬開發者。
飛槳文心聯合優化,開發者已達 2185 萬
文心大模型的能力拓展和效率提升,得益于飛槳文心的聯合優化。比如,訓練方面,多模態統一的掩碼注意力加速,在不同模態混合計算注意力時,顯著降低掩碼構建和計算開銷,大幅提升訓練性能;推理方面,多模態流式分塊預填充機制,減少首 token 耗時,同時減少推理計算的顯存峰值,提升推理批次大小,提升吞吐性能。通過這些聯合優化技術,文心 4.5 Turbo 訓練吞吐達到文心 4.5 的 5.4 倍,推理吞吐達到 8 倍。
從現場我們了解到,飛槳框架 3.0 既延續了動靜統一、訓推一體的技術特色,更在自動并行、神經網絡編譯器、高階自動微分等方面創新突破。例如,動靜統一自動并行,使得大模型分布式訓練代碼減少 80%;大模型訓推一體,幫助強化學習訓練提速 114%;科學計算高階微分,微分方程求解速度比 PyTorch 快 115%;神經網絡編譯器,提升框架通用性能,模型端到端訓練速度提升 27%;異構多芯適配,飛槳已適配國內外 60 多個系列芯片。
截至目前,飛槳文心開發者數量已超過 2185 萬,服務超過 67 萬家企業,創建的模型達到 110 萬。
大模型讓文博知識觸手可及,首個 " 非遺武術大模型 " 發布
隨著人工智能技術加速進步,大模型在千行百業的應用也越來越深入。例如,在文博領域,百度與中國文物交流中心達成深度合作,增強大模型在文博領域專業知識,并發布首個文博智能體,用 AI 的力量讓文博知識觸手可及,讓每個人都成為文博傳承的參與者與受益者;在非遺武術傳承領域,百度與上海體育大學武術學院、中國武術博物館館聯合發布 " 非遺武術 - 百度文心大模型 ",基于文心大模型,融合上海體育大學武術學院、中國武術博物館的專業積淀,將武術技法與算法結合,通過 3D 動作建模、AI 動態糾錯等技術,將非遺武術技術動作以數字化的形式保存和記錄下來。
活動最后,第十二屆百度獎學金頒獎典禮在現場舉辦。作為國內外 AI 領域資助金額與含金量最高的學術獎學金之一,百度獎學金自 2013 年設立以來,已累計發放超千萬元資金。王海峰為來自全球頂尖高校的 10 位獲獎選手頒發獎學金,每人 20 萬元。這不僅是對獲獎選手學術成果的認可,也彰顯了百度對 AI 人才培養的長期承諾。