日本一区二区三区久久-日本一区二区三区久久精品-日本一区二区三区日本免费-日本一区二区三区在线观看视频-国产不卡免费视频-国产不卡视频

<fieldset id="a6mks"></fieldset>

量子位前天

草稿鏈代替思維鏈，推理 token 砍掉 80%，顯著降低算力成本和延遲

推理 token 減少 80%-90%，準確率變化不大，某些任務還能增加。

Zoom 團隊提出思維鏈替代品 " 草稿鏈 "，顯著降低延遲和算力成本。

原理很簡單，要求模型為每個推理步驟生成簡潔、信息密集的 token。

這一思路受到人類解題過程啟發，人類通常不會詳細闡述每一個細節，只是簡單幾下關鍵的中間結果，作為草稿來輔助思考。

此外，草稿鏈方法簡單且易于實現，不需要修改模型、微調或強化學習，只需更新提示詞中的示例即可，相關代碼和數據已在 GitHub 上開源。

研究團隊認為，與另一種降低延遲和計算成本的方法 " 在連續潛空間推理 " 相比，草稿鏈保留了可解釋性，且可以應用于閉源的黑盒模型。

第三方分析測算，對于每個月處理 100 萬個推理請求的企業，可以將成本從思維鏈的 3800 美元降低到 760 美元，每月節省超過 3000 美元。

實驗遵循原始思維鏈論文，評估 3 類任務：算術推理、常識推理和符號推理。

算數推理任務選擇 GSM8k 數據集，從準確率看，標準提示下 GPT-4o 和 Claude 3.5 Sonnet 的準確率分別僅 53.3% 和 64.6%，思維鏈使兩者均超 95%，草稿鏈也達到 91% 左右。

在 token 使用上，思維鏈生成約 200 個 token/ 響應，草稿鏈僅約 40 個，減少約 80%。

延遲方面，草稿鏈使 GPT-4o 和 Claude 3.5 Sonnet 的平均延遲分別降低 76.2% 和 48.4%。

常識推理選擇 BIG-bench 的日期理解和運動理解任務也取得了相似的結果，特別值得注意的是 Claude 3.5 Sonnet 在草稿鏈下準確率還有所上升。

符號推理選擇拋硬幣任務，由于原數據集未公開，作者合成了 250 個示例的測試集。

草稿鏈在保持 100% 準確率的情況下大幅減少了推理 token 和延遲。

但草稿鏈方法也有一定的局限性：在零樣本設置下有效性會顯著下降。

此外，在參數量小于 30 億的小模型上，雖然草稿鏈仍能有效減少每個回答所需的 token 數并提高準確率，但與思維鏈相比，性能差距更大。

研究團隊推測，可能是由于訓練數據中缺乏草稿鏈風格的推理模式，在不提供 few-shot 樣本指導的情況下，很難生成簡潔而有幫助的 " 草稿 "。

論文地址：

https://arxiv.org/abs/2502.18600v2

參考鏈接：

[ 1 ] https://ajithp.com/2025/03/02/chain-of-draft-llm-prompting/

宙世代

ZAKER旗下Web3.0元宇宙平臺

一起剪

ZAKER旗下免費視頻剪輯工具

相關標簽

abs

女子iPhone16Pro Max 屏幕點不動客服：我的手機也有這種情況

數碼測評昨天

可以放心升級Win11 24H2！微軟解除AutoCAD 2022設備更新限制

快科技昨天

蘋果AI中文版終于來了：iOS 18.4 Beta 3上線

快科技昨天

宇樹科技頭戴式智能裝置專利獲授權：緩解長期佩戴導致的頸椎酸痛

快科技昨天

網易有道完成翻譯底層技術迭代

36氪昨天

雷神推出新款32寸顯示器：4K 240Hz屏到手8999元

快科技昨天

亞馬遜云科技宣布提供完全托管的DeepSeek-R1模型

36氪昨天

小米辟謠人形機器人量產；字節去年欲收購Manus被拒；微信朋友圈上新5分鐘視頻

21世紀經濟報道昨天

拿不到Manus邀請碼？教你體驗幾款開箱即用的computer use智能體

鈦媒體昨天

專家談影視劇分鐘級被盜版上網：大家一起抵制公眾是最大受害者

快科技昨天

傳次世代Xbox后年問世

快科技昨天

財聯社汽車早報

財聯社昨天

曝蘋果屏下Face ID已在路上：折疊iPad Pro首發

快科技昨天

對話像素綻放 PixelBloom (AiPPT.com)與印象筆記，直擊 AI 辦公核心戰場

硅星人昨天

對話澤拓科技趙偉：數據庫公司深陷的“自研軍備競賽”，用戶真的在意嗎？

雷峰網昨天

量子位

覺得文章不錯，微信掃描分享好友

熱門推薦

Blockchain News

<strike id="asucs"></strike>

<ul id="asucs"></ul>

日本一区二区三区久久-日本一区二区三区久久精品-日本一区二区三区日本免费-日本一区二区三区在线观看视频-国产不卡免费视频-国产不卡视频

宙世代元宇宙

元宇宙黨建解決方案

元宇宙文旅解決方案

元宇宙展廳解決方案

元宇宙行業峰會解決方案

元宇宙營銷解決方案

元宇宙會展解決方案

元宇宙演藝節目解決方案

元宇宙博物館解決方案

元宇宙圖書館解決方案

元宇宙校園解決方案

元宇宙企業展廳解決方案

元宇宙藝術展解決方案

元宇宙電商解決方案

融媒體解決方案

ZAKER智慧云

媒體解決方案

黨建解決方案

公檢法解決方案

智慧交通解決方案

高校解決方案

AI視頻剪輯

AI視頻剪輯

AI智能客服

AI工具箱

AI寫稿助手

AI口語陪練

我的訂閱

草稿鏈代替思維鏈，推理 token 砍掉 80%，顯著降低算力成本和延遲

宙世代

一起剪

相關閱讀

女子iPhone16Pro Max 屏幕點不動 客服：我的手機也有這種情況

可以放心升級Win11 24H2！微軟解除AutoCAD 2022設備更新限制

蘋果AI中文版終于來了：iOS 18.4 Beta 3上線

宇樹科技頭戴式智能裝置專利獲授權：緩解長期佩戴導致的頸椎酸痛

網易有道完成翻譯底層技術迭代

雷神推出新款32寸顯示器：4K 240Hz屏到手8999元

亞馬遜云科技宣布提供完全托管的DeepSeek-R1模型

小米辟謠人形機器人量產；字節去年欲收購Manus被拒；微信朋友圈上新5分鐘視頻

拿不到Manus邀請碼？教你體驗幾款開箱即用的computer use智能體

專家談影視劇分鐘級被盜版上網：大家一起抵制 公眾是最大受害者

傳次世代Xbox后年問世

財聯社汽車早報

曝蘋果屏下Face ID已在路上：折疊iPad Pro首發

對話像素綻放 PixelBloom (AiPPT.com)與印象筆記，直擊 AI 辦公核心戰場

對話澤拓科技趙偉：數據庫公司深陷的“自研軍備競賽”，用戶真的在意嗎？

最新評論

量子位

熱門推薦

女子iPhone16Pro Max 屏幕點不動客服：我的手機也有這種情況

專家談影視劇分鐘級被盜版上網：大家一起抵制公眾是最大受害者