它是一款支持高自由度運動能力的雙足人形機器人,也是一款搭載情感交互引擎的情感交互機器人,還是一款初步具備通用任務執行能力的具身機器人," 像人一樣靈動 "。
豆豆眼、圓腦袋、大腳板……憨態可掬的外形不禁讓人想到 10 年前那部風靡全球的動畫片《超能陸戰隊》中的治療機器人 " 大白 "。影片中 " 大白 " 被人聲喚醒、睜眼,查看房間的擺設,然后試圖將 " 肥胖 " 的身子從狹小的空間中挪出的舉動,如今已然成真。截至昨晚 7 點,視頻的播放量已達 90 萬,彭志輝也喜提新頭銜——上海 " 鋼鐵俠 "。
運動能力超群,會玩平衡車能縫葡萄皮
靈犀 X2 與 " 大白 " 一樣,使用了親和的柔性材料,摸上去彈力十足。雖然是個身高 1.3 米的 " 小學生 ",但其全身擁有 28 個自由度,運動屬性拉滿。視頻中,靈犀 X2 不僅會騎自行車、滑滑板、玩平衡車,還能絲滑操作縫葡萄皮,讓網友驚呼 " 炸裂 "。值得一提的是,靈犀 X2 的運動能力是自生成的,而非事先設定。
在《超能陸戰隊》上映的 2015 年,主流機器人還需要人為 " 指路 "。卡耐基 - 梅隆大學曾花費 10 年時間造一臺名為 " 漫步者 " 的機器人,每走一步,它都要更新頭腦中的環境輪廓圖。作為頭腦的中央電腦可管理 " 漫步者 " 的激光成像儀、傳感器、氣壓足肢、齒輪箱和電機馬達,接收到不同模塊傳回的信息并計算后," 漫步者 " 才開始漫步。
靈犀 X2 的運動算法與大語言模型一樣,源自強化學習,智能體能從每秒數萬次的環境交互和動作數據中找到突破運動瓶頸的方法。換言之,它的運動能力也是一個 " 黑箱 ",能夠根據指令做出相應動作,但人們并不清楚它經歷了怎樣的思考。這一特性也讓靈犀 X2 個性十足,視頻中有位靈犀 X2" 家族成員 " 經常踩測試人員的腳,被貼上性格暴躁的標簽。
毫秒級交互反應,像親人一樣 " 嘮家常 "
" 如果我的狗和你一起掉進水里,我先救誰?"" 先救狗狗吧,我沒事。"
" 如果給你看《銀翼殺手》,你會不會哭到短路?"" 不會哭,但我會感慨萬千。" 你能想象這是兩段發生在人與機器人之間的實時對話嗎?
彭志輝將靈犀 X2 定義為第一臺真正具備復雜交互能力的 " 靈動機器人 "。基于 " 視覺 - 語言模型 " 的多模態交互大模型 " 硅光動語 " 賦予了它通過視覺理解和認知世界的能力,甚至能通過面部表情和語音語調精準判斷人類的情感狀態,并作出相應回應。
毫秒級的交互反應則源于智元 X 實驗室團隊通過邊緣側大腦、端到端的模型架構,以及大量工程優化。邊緣側大腦是機器人或智能設備中部署在本地(即邊緣端)的人工智能處理單元,可在不依賴云端的情況下完成實時決策、數據分析和任務執行。
靈犀 X2 還實現了通過識別環境與人交互。當彭志輝拿著一瓶牛奶和一瓶咖啡,問它想睡覺的人應該喝哪個時,它很肯定地回答:" 喝牛奶吧。"
泛化能力強,成為家庭的 " 吉祥三寶 "
彭志輝很懂機器人落地的 " 痛點 "。作為一款主打家用的機器人型號,靈犀的發展目標被定義為 " 吉祥三寶 " ——保安、保姆、保潔。事實上,相較于工業和商業場景,家庭場景對機器人的安全性和智能度要求更高。
家庭的工作場景是不固定的,因此需要機器人的泛化能力,也就是機器人對新鮮場景的適應能力。在本體層面,靈犀 X2 可裝配包括靈巧手在內的各種末端;在模型訓練方面,智元開源了業界最大之一的機器人真機和仿真數據集,并提出了大小腦系統架構。全新構架的通用具身智能基座模型 " 啟元大模型 " 也讓其能力更加泛化,一個需要學習數萬條數據才能學會的倒水動作,在新架構下只需學習上千條就會。
盡管業界估計人形機器人進家庭大約還需 5 年,但此次發布的靈犀 X2 讓人們相信 " 一機一戶 " 的日子已然不遠。" 最好的作品永遠是下一個。" 彭志輝在視頻中埋了個彩蛋——會是腳踩風火輪的哪吒機器人完整版嗎?