頂級 AI 人才,正成為 AI 賽道上最稀缺、也最具品牌效應的資產。
在這輪人才流動的風暴中心中,我們發現一個格外顯眼的細節:這群主導過 ChatGPT、Gemini、Claude 等大模型研發的核心成員中,華人科學家的比例出奇地高。
這個這個變化并不是突然出現的,這幾年興起的 AI 浪潮中,美國的頂級 AI 人才中華人占比不斷升高。 根據 MacroPolo 發布的《全球人工智能人才追蹤調查報告 2.0》,來自中國的頂尖 AI 研究人員占比在 2019 年到 2022 年間,從 29% 提升到了 47%。
而在智譜研究發布的《ChatGPT 團隊背景研究報告》,更是發現在 ChatGPT 核心的 87 人團隊中,有 9 人都是華人,占比超過 10%。因此,我們也重新梳理了近期在硅谷頭部公司中廣受關注的華人 AI 研究員畫像,并試圖從中總結出一些特征:
1 頂尖名校出身,學術能力極強
他們大多本科就讀于清華、北大、中科大、浙大等頂尖高校,計算機或數學背景居多;研究生階段普遍進入 MIT、斯坦福、伯克利、普林斯頓、UIUC 等名校深造,幾乎每人都有頂會高引論文傍身(NeurIPS、ICLR、SIGGRAPH 等),
2 年輕高產,爆發周期集中于 2020 年之后
年齡多在 30~35 歲;碩博階段恰逢深度學習的全球爆發期,學術基礎扎實,熟悉工程體系和團隊協作。不少人職業的第一站就是接觸大廠或服務大規模人群的 AI 產品或平臺,起點更高、節奏更快。
3 強多模態背景,攻堅模型后訓練
他們的研究方向普遍著重于跨模態(文本、語音、圖像、視頻、動作)的統一推理系統,包括 RLHF、蒸餾、對齊、人類偏好建模、語音語調評估等具體細節。
4 即便頻繁流動,但基本不會脫離生態
Google、Meta、微軟、英偉達,Anthropic、OpenAI ……他們的流動范圍橫跨 AI 初創與巨頭,但研究主題、技術積累往往保持連貫性,基本不換賽道。
OpenAI → Meta
Shuchao Bi
2013 - 2019 年,他在 Google 擔任技術負責人,主要貢獻包括構建多階段深度學習推薦系統,顯著提升 Google 廣告收益(數十億美元級別)。
2019 - 2024 年,他擔任 Shorts 探索負責人,期間,聯合創建并主導 Shorts 視頻推薦與發現系統,并 組建并擴展大規模機器學習團隊,覆蓋推薦系統、評分模型、互動發現、信任與安全等方向。
2024 年加入 OpenAI 后,他主要領導多模態后訓練組織,是 GPT-4o 語音模式與 o4-mini 的聯合創造者
期間,他主要推進 RLHF、圖像 / 語音 / 視頻 / 文本推理、多模態智能體、多模態語音到語音(VS2S)、視覺 - 語言 - 行動基礎模型(VLA)、跨模態評估系統等,也涉及多模態鏈式推理、語音語調 / 自然度評分、多模態蒸餾與自監督優化,其核心目標是通過后訓練構建更通用的多模態 AI Agent。
Huiwen Chang
早期的文本生成圖像主要依賴擴散模型(如 DALL · E 2、Imagen),這些模型雖然生成質量高,但推理速度慢、訓練開銷大。而 MaskGIT 和 Muse 則采用了「離散化 + 并行生成」 的方式,大幅提升了效率。
此外,她也是擴散模型頂級論文《Palette: Image-to-image diffusion models》的聯合作者之一。
這篇論文發表于 SIGGRAPH 2022,提出了一種統一的圖像到圖像翻譯框架,并在圖像修復、著色、補全等多個任務上超過 GAN 和回歸基線,至今已被引用超過 1700 次,成為該領域的代表性成果之一。
2023 年 6 月起,她加入 OpenAI 多模態團隊,聯合開發了 GPT-4o 圖像生成功能,繼續推動圖像生成、多模態建模等前沿方向的研究與落地。
博士階段,他的研究方向聚焦于模型壓縮、量化、視覺語言模型、稀疏推理等關鍵方向。
在 2023 年加入 OpenAI 之前,他曾在英偉達、Adobe 和 Google 擔任實習研究員,并在 MIT 長期從事神經網絡壓縮與推理加速相關研究,積累了深厚的理論基礎與工程實踐經驗。
他也是 GPT-4o 系統技術文檔的核心作者之一(比如 GPT-4o 系統卡),并憑借 AWQ 論文獲得 MLSys 2024 最佳論文獎。
Hongyu Ren
Hongyu Ren 本科在北京大學獲得計算機科學與技術學士(2014 – 2018)學位,隨后在斯坦福大學獲得計算機科學博士(2018 – 2023)學位。
在加入 OpenAI 之前,他曾在 Google、微軟以及英偉達有過多段實習經歷,比如 2021 年在蘋果擔任實習研究員期間,參與 Siri 問答系統的搭建。
用他的話來說:「I teach models to think faster, harder and sharper.(我教模型更快、更努力、更敏銳地思考。)」
學術領域,他的 Google 學術總引用數超過 17742 次,高被引論文包括:《On the Opportunities and Risks of Foundation Models》(引用 6127 次);《Open Graph Benchmark》(OGB)數據集(引用 3524 次)等。
Jiahui Yu
Jiahui Yu 本科畢業于中國科學技術大學少年班,獲得計算機科學學士學位,隨后在伊利諾伊大學香檳分校(UIUC)獲得計算機科學博士學位。
他的研究重點包括深度學習、圖像生成、大模型架構、多模態推理和高性能計算。
在此之前,他曾在 Google DeepMind 工作近四年,期間是 PaLM-2 架構與建模的核心貢獻者之一,并共同領導了 Gemini 多模態模型的開發,是 Google 多模態戰略中最重要的技術骨干之一。
Jiahui 在 Google 學術上總引用次數超過 34500 次,h 指數達 49,代表性研究成果包括圖文對齊基礎模型 CoCa、文本生成圖像模型 Parti、神經網絡可伸縮設計 BigNAS,以及廣泛應用于 Adobe Photoshop 的圖像修復技術 DeepFill v1 和 v2 等。
Shengjia Zhao
2022 年,他加入 OpenAI,擔任核心研發成員,深度參與 GPT-4 和 GPT-4o 的系統設計工作。曾主導 ChatGPT、GPT-4、所有 mini 模型、4.1 和 o3 的研發工作,還曾領導 OpenAI 合成數據團隊。
他是《GPT-4 Technical Report》(被引超過 1.5 萬次)和《GPT-4o System Card》(被引超過 1300 次)的聯合作者,并參與了多個系統卡(如 OpenAI o1)的撰寫,是推動 OpenAI 基礎模型標準化與公開化的重要貢獻者之一。
Google → Meta
Pei Sun
2009 年,Pei Sun 在清華大學獲得了學士學位,隨后前往卡內基梅隆大學攻讀碩士和博士學位,順利完成碩士階段學習,并在博士階段選擇退學。
他曾在 Google DeepMind 擔任首席研究員,期間主攻 Gemini 模型的后訓練、編程和推理工作,是 Gemini 系列模型(包括 Gemini 1、1.5、2 和 2.5)后訓練、思維機制構建與代碼實現的核心貢獻者之一。
更早些時候,他曾在 Google 擔任軟件工程師五年多,后又加入分布式存儲公司 Alluxio 任職工程師超過一年,參與系統架構研發。
Banghua Zhu
Banghua Zhu 本科畢業于清華大學電子工程系,后赴美國加州大學伯克利分校攻讀電氣工程與計算機科學博士,師從著名學者 Michael I. Jordan 和 Jiantao Jiao。
此外,他還在 RLHF、人類反饋對齊、開源對齊模型等方向有所貢獻。其 Google 學術顯示引用總數超過 3100,h 指數為 23,也是大模型競技場「Chatbot Arena」、「Benchbuilder」、「Starling」等多個熱門開源項目的核心作者之一。
根據其發布內容,他將在英偉達參與模型后訓練、評估、AI 基礎設施和智能代理構建等項目,強調與開發者及學術界的深度協作,并計劃將相關成果開源。
Jiantao Jiao
Jiantao Jiao 是加州大學伯克利分校電氣工程與計算機科學系以及統計系的助理教授。
他于 2018 年獲得斯坦福大學電氣工程博士學位,目前是多個研究中心的聯合負責人或成員,包括伯克利理論學習中心(CLIMB)、人工智能研究中心(BAIR Lab)、信息與系統科學實驗室(BLISS)以及去中心化智能研究中心(RDI)。
和 Banghua Zhu 一樣,他也是 Nexusflow 聯合創始人之一,目前已經正式加入英偉達,擔任研究總監兼杰出科學家。
Jiao 的總引用次數達 7259,h 指數為 34,代表性論文包括《Theoretically principled trade-off between robustness and accuracy》,以及與 Banghua Zhu 等人合作的《Bridging Offline Reinforcement Learning and Imitation Learning: A Tale of Pessimism》,均發表在 NeurIPS 等頂會。
Catherine Wu
Catherine Wu 曾在 Anthropic 擔任 Claude Code 的產品經理,專注于構建可靠、可解釋、可操控的 AI 系統。據 The Information 報道,Catherine Wu 已被 AI 編程初創公司 Cursor 挖角,出任產品負責人一職。
她的職業起點并不在投資圈,而是扎根于一線技術崗位。
更早之前,她在摩根大通實習,并于普林斯頓大學獲得計算機科學學士學位,在校期間還曾赴蘇黎世聯邦理工學院進行交換學習。
特斯拉 | Phil Duan
段鵬飛(Phil Duan)是特斯拉 AI 的首席軟件工程師,現負責 Autopilot 下的 Fleet Learning 團隊,致力于推動特斯拉自動駕駛系統(FSD)中「數據 + 感知」核心模塊的建設。
他本科畢業于武漢理工大學,主修光信息科學與技術,隨后攻讀俄亥俄大學電氣工程博士與碩士學位,研究方向為航空電子,并以博士論文榮獲 2019 年 RTCA William E. Jackson Award,該獎項是美國航空電子與電信領域授予研究生的最高榮譽之一。