作者 | 陳駿達編輯 | 漠影
什么,通義 App 現在長這樣了?
近日,阿里旗下的通義 App 迎來升級,UI、交互體驗到背后接入的模型都全面重塑,整體外觀
大做減法,而內置模型、工具的能力則進一步升級。
進入新版通義 App 首頁,主智能體引入 "鄰家女孩" 這一富有親和力的新形象,能勝任大部分應用場景中的需求。
右滑則是豐富的
智能體生態,將原版通義 App 的工具、角色、頻道等頁面整合,呈現更為直觀。
左滑后,用戶的對話記錄、創作的圖像、視頻與創建的智能體都一覽無余。
值得一提的是,新版通義 App 還接入阿里最新推理模型千問
QwQ-32B,這款模型以 32B 的參數量,在數學推理、編程能力上與 671B 的 DeepSeek-R1 旗鼓相當。此外,在多項通用能力測評中,QwQ-32B 的得分超越 DeepSeek-R1。一經發布,便獲得全球開發者的關注與贊賞。
已經有不少網友體驗了升級后的通義 App,其更快的響應速度、更豐富的交互體驗獲得好評,還有網友感嘆,新版通義讓 "
最強 AI 飛入尋常百姓家"。
通義 App 迎來升級后,智東西第一時間全面體驗了其在交互、模型、工具等方面的新變化,在阿里加碼 AI to C 的大背景下,新版通義有望成為更實用、更貼心的個人 AI 助手。
一、拍照找 bug、解答無厘頭問題,還能給會議畫腦圖
新版通義 App 以超級智能體作為交互中樞,用戶在通義首頁能問、能聊,還能讓智能體進行圖片理解、圖片生成,翻譯、寫作等任務。
此外,通義首頁還會推薦基于其他模型或者具備其他不同功能的智能體。目前,基于 Qwen-QwQ-32B 的被放在了首頁的推薦欄中。用戶只需點擊,就能與這款新模型進行對話。
數學、代碼類問題一直是通義模型家族的強項,實測中,搭載 QwQ-32B 智能體的通義 App 回答了從高考壓軸題到 AIME 真題等不同難度的數學問題,還編寫了一個簡單的游戲。同時,為了避免大模型上網找答案,測試時聯網搜索能力均已關閉。
下方是 2024 年高考全國甲卷理科數學的壓軸題,在先前的測試中,智東西曾讓 DeepSeek-R1 解答,R1 用時 80 余秒,給出了正確答案,但解題流程不符合評分標準中的規范。
測試中,QwQ-32B 在解答這道題目的用時略長于 R1,這主要是因為它在思考過程中
進行了更多的反思、驗算等流程,還嘗試了不同的解題思路。▲ QwQ-32B 的部分思考過程
最終,QwQ-32B 兩個小題的答案都完全正確,解題格式較為規范,不過,它漏掉了一個踩分點,無法拿到滿分。
智東西又讓 QwQ-32B 嘗試了一道 2024 年的 AIME 真題。在面對英文題目時,Qwen-32B 也毫不露怯,會自動用英文思考,不到一分鐘,QwQ-32B 便給出了正確答案,這一次它的證明過程沒有破綻。
測試完新版通義 App 中 QwQ-32B 智能體的數學能力,我們再來看看其編程方面的實力究竟如何。智東西讓 QwQ-32B 編寫了一個基于 HTML 的五子棋小程序,并加入了 " 三三禁手 "、" 長連禁手 " 等限制黑棋的規則。
幾分鐘后,QwQ-32B 用不到 200 行代碼完成了這一任務,還解釋了禁手檢測的實現邏輯。細讀它的思考過程,還能發現它自我迭代了幾版實現方法。
不過,作為一款手機 App,通義在代碼場景中更常見的應用或許是拍照解釋代碼。智東西在先前的程序中埋入了一個 bug,導致游戲無法判斷勝者,無法結束。
由于 QwQ-32B 智能體目前暫時不支持圖片上傳,我們將這一挑戰交給了通義 App 中的主智能體。據了解,在代碼類問題上,
主智能體會調用通義千問的 Qwen-MAX 模型。簡單分析后,通義給出了幾個可能的原因與修復的代碼,復制粘貼后再進行微調,游戲程序便能夠正常運行。
如果說數學、代碼等能力更偏向理科,那接下來的幾道測試題則更側重于文字推理、百科知識的考查。
目前,有許多大模型都在歷史類問題上表現不佳,尤其是在涉及資料較少的國家和民族時。智東西讓 QwQ-32B 智能體分析了 " 南非有沒有鎖甲 " 這一問題。觀察它的思考過程,我們可以發現,QwQ-32B 從不同年代、不同民族的角度條分縷析地回答了這一問題,答案也符合史實。
至于下方這類無厘頭的問題,通義則采取了 " 用魔法打敗魔法 " 的策略。
通義 App 中的 QwQ-32B 智能體引經據典,從經濟學視角、生物學視角邏輯學視角等 5 個不同角度給出了理由,讓人無可辯駁。
通義 App 的一大特色是其專業能力,如實時記錄、拍照講題、健康問答等領域。新版通義 App 中,
實時記錄功能新上線了腦圖功能,錄音后不僅能生成會議紀要,還可以將會議內容生成腦圖,可謂是打工人福音了;拍照講題功能現在不光能給出答案解析,還能
持續追問,允許用戶 " 打破砂鍋問到底 "。
二、高情商有溫度,產品交互全面重塑
接入新模型、功能升級等調整進一步提升了新版通義 App 的實用性,而產品界面、交互體驗的變化則是從設計層面,讓通義 App 更加易用,也更具溫度。
過去的通義 App 同樣具備不俗的實力,但在用戶友好度上仍有優化空間,未能向用戶充分表達、溝通其實力。
以原版通義的主頁面(下圖右 2)為例,可以看到界面以文字為主,并集合了不少其他功能。這種設計雖然可以幫助用戶快速跳轉,但也可能導致用戶在剛開始使用時摸不著頭腦,需要一定的學習成本。
新版通義 App 通過做減法,讓產品設計更加簡潔清爽,突出了核心功能,也擁有了更具親和力的交互體驗。
現在,打開通義 App 后,映入眼簾的是更具親和力的人物形象,通義官方將其稱之為 " 鄰家女孩 "。這一形象可以視作是整個通義智能體生態的代言人,給人以親切、溫暖的感受。
對大多數用戶而言,首頁主智能體是他們與 App 交互的核心入口,這一形象的變化能夠迅速拉近用戶與產品之間的距離,降低使用時的陌生感和距離感。" 鄰家女孩 " 下方的文字還會不斷變化,詢問用戶的心情,或是用表情符號讓文字更為活潑。
在使用通義 App 的過程中,我們也能感受到與這一形象相符合的貼心體驗。通義 App 在 QwQ-32B 智能體中推薦了這樣一個問題:" 如果你是人類,如何過幸福的一生?" 模型給出的回答不僅包括實操建議,還撰寫了鼓勵的話語,既貼心又實用。
新版通義 App 在其他方面的設計和調整,也進一步降低了用戶使用的門檻。例如,保存用戶過去聊天記錄的板塊原本被分為助手、工具和角色,這一頁面還融合了與通義進行語音交互的功能。
而在新版通義中,左滑后進入的對話記錄、個人資產頁面劃分更加易懂,被分為對話記錄、我創建的、我聊過的智能體,用戶能通過這些名稱
更直觀地找到自己所需的信息。使用頻率很高的拍照講題、實時記錄等功能,被調整到主頁輸入框上方,用戶可以一鍵切換。
右滑后,通義 App 將代碼、紀要等生產力工具和視頻生成、繪圖、角色扮演整合到一個統一的智能體生態中,在中心位置呈現用戶最新使用的智能體與其他熱門應用,讓用戶無需過多點擊就能直達目標。
一些趣味的 AI 玩法能讓用戶使用 App 的體驗更加輕松,不過,并不是所有用戶都會高頻使用此類應用。在新版通義 App 中,這些智能體的位置被放在實用工具之后,用戶可以下滑點擊,或是通過搜索直接訪問。
談及這些升級,通義產品負責人認為,他們不僅要通過強大的 AI 技術能力幫助用戶解決實際問題,還要讓用戶在使用中感到更方便、更懂我。AI 應用的未來不僅僅是簡單的提效工具,更是一個能夠理解、陪伴并提升用戶生活質量的貼心 AI 助手。
三、Agent賽道爆火,通義積極布局
新版通義 App 的發布,正值 AI Agent 應用的爆發期。2024 年底,Anthropic 發布了 MCP(模型上下文協議),以統一標準規范了大模型應用程序與外部數據源和工具的集成。
進入 2025 年,OpenAI 發布了 Operator 預覽版本,支持購物、訂票等服務;而 Deep Research 這類深度研究工具,也體現了 Agentic AI 的思想。
在過去,通義已經在基礎模型領域有深厚積累,涵蓋文本、圖像、語音、視頻,開源模型廣受全球開發者認可。此外,通義 App 中積累了大量專業領域智能體,已經擁有一定的用戶認可,但尚未完全破圈。
新版通義 App 主頁面引入的超級智能體,有望憑借新的形象,成為加強用戶與智能體連接的紐帶。
通義 App 的 C 端化轉向,也符合這段時間以來阿里的 AI To C 戰略。去年年底,通義 App 團隊從阿里云分拆,并入阿里智能信息事業群,而原有基礎模型團隊則仍然保留在阿里云體系內。
產品與研究的相對獨立,讓通義 App 與一線用戶離得更近,也能更準確地把握用戶的需求,響應市場變化。
未來,通義 App 會持續上線更多千問大模型新能力,還會把阿里多個先進模型能力融入到產品應用中,為用戶提供更加豐富的智能體驗。
作為潛在的發展方向,現有的主智能體或許能在未來成為智能體分發入口,根據用戶需求智能調用相關智能體,進一步提升用戶體驗。
結語:通義產品理念重塑,阿里 AI To C 進行時
本次通義 App 的全新升級,不僅僅是技術層面的進化,更是產品理念和用戶體驗的全面煥新。
要真正做好一款 To C 產品,技術硬實力僅僅是基礎。如何挖掘、創造用戶的需求,找到用戶的高頻使用場景,創造與用戶的情感連接,是任何一款想要獲得 To C 成功的產品的必答題。在 "Agent 元年 " 推出的新版通義,正探索這些挑戰的最新解題思路。