獨家丨一位 AI 科學家，拒絕了張一鳴開出的千萬年薪

作者：用戶投稿時間：2023-04-04 09:30 點擊：次

導讀：作者丨李梅編輯丨陳彩嫻AI 科技評論獨家獲悉：字節跳動向知名 AI 青年科學家、深度學習框架 MXNet 作者李沐發出邀請，希望請他加入字節參與大模型研發，開出

作者丨李梅

編輯丨陳彩嫻

AI 科技評論獨家獲悉：字節跳動向知名 AI 青年科學家、深度學習框架 MXNet 作者李沐發出邀請，希望請他加入字節參與大模型研發，開出千萬年薪。盡管條件豐厚，但綜合考慮后，李沐選擇了婉拒。

日前，AI科技評論報道了前亞馬遜機器學習部門首席科學家 Alex Smola 和李沐師徒離職、宣布在大模型賽道創業的消息。李沐與博士導師 Alex Smola 創立了一家公司，叫 Boson.ai，受到行業熱烈關注。

大模型的門檻高，據統計，全球能訓練大模型的 AI 科學家不超過 500 人，華人科學家則更少，搶人成為近日國內大廠的重頭戲。雷峰網得到消息，字節跳動的創始人張一鳴曾親自邀請李沐，不過李沐婉拒了這個年薪千萬的工作機會，最終選擇在硅谷創業。

李沐的選擇出乎當前行業主流觀點的意料之外。大家的共識是：國內能做成大模型的互聯網科技大廠最終不會超過5家，BATH+字節；按照以往的規律，創業公司在大廠的擠兌下沒有生存的空間。但李沐對張一鳴說不的這一舉動，卻給了大模型的小創業團隊一個新的啟示：

大廠并非唯一選擇。

盡管大廠有幾萬人，但最終主導大模型研發的團隊不過幾十人。一方面，大廠有太多來自架構、業務、資源分配等方面的不確定性因素，最終能做成什么樣還是未知數；另一方面，在一個新的、需要搶跑的賽道中，一個有能力、有決心 all in 的平臺，或許更能把握節奏，搶占先機。

最終，大模型做成，技術平臺積淀，再以數億的金額賣給大廠，也不失為一個好的選擇。進可攻，退可守，創業成為明星科學家眼中更「香」的選擇。

（AI科技評論將持續關注大模型創業動態，歡迎添加本文作者微信ExperienceMachine交流爆料、互通有無）

—— 1 ——
李沐的「選擇」

獨家丨一位 AI 科學家，拒絕了張一鳴開出的千萬年薪

李沐

這不是李沐第一次創業。

在上一波深度學習落地潮中，AI人才大規模流向工業界，彼時快要博士畢業的李沐也抓住機遇，選擇與他的兩位導師Alex Smola和Dave Andersen一起創業，成立了一家公司Marianas Labs，李沐出任CTO。起初，公司的項目進展很順利，還被一家上市公司看中，就將公司賣給了對方，但后來還是終止了合作。最后，由于團隊核心人員離開，Alex和Dave分別去了亞馬遜和谷歌，李沐的這次創業便就此終止。

緊接著，又一次重要的選擇來到李沐面前。谷歌的AI掌門人Jeff Dean向李沐發來一封郵件邀請他去谷歌工作。當時Jeff Dean主導的深度學習框架Tensorflow問世，實力非常強，這對李沐而言當然是一個很好的機會。

但李沐還有自家的MXNet要發展，他認為“自己挖的坑，總是要自己填的”。當時李沐也考慮了一些技術性強的小創業公司，但從MXNet的發展來看，還是要找家巨頭來依靠更好，所以去亞馬遜是更優選擇。

于是李沐就先以兼職的身份去了亞馬遜，帶著一些人做MXNet開發和AWS上深度學習的應用。之后李沐于2016年7月正式入職亞馬遜AWS，直接向擔任副總裁級別科學家的Alex匯報。

如今，六年多過去，在新一輪AI大模型熱潮下，李沐面臨著更大的機遇和更多的選擇。如同許多下場創業的AI科學家一樣，李沐也已經瞄準大模型，準備開啟新事業。

獨家丨一位 AI 科學家，拒絕了張一鳴開出的千萬年薪

Boson.ai 官網

—— 2 ——

頂級科學家選擇創業?更能 All in 大模型

字節跳動已經入場語言生成大模型，挖人才進來正是頭等大事。字節現已經攬入一名大將，原達摩院大模型M6帶頭人楊紅霞。而據知情人士稱，張一鳴親自給在國外巨頭工作的華人科學家打電話，邀請他們回國加入字節大模型事業。

像李沐這樣的頂級科學家，選擇自己創業，而對大廠的招攬有所保留，這并不是個別現象，亦有其合理性。大廠固然體量大、資源多，但真要論內部專門投入做大模型的人才密度，恐怕并不高，再加上資源分配等方面可能存在諸多束縛，大廠最終能否做好自己的ChatGPT是一個問號。因此，在頂級科學家眼里，大廠并非是唯一的、最好的去處。

語言生成大模型本身也有很高的技術壁壘，所以，相比去一家聲量大但大模型并非主要方向的公司，建立一支更重視AI、能夠all in大模型的團隊，或許是更聰明的選擇。

這是經過許多歷史驗證的，比如當年的百度少帥之一、曾任字節跳動AI Lab總監的李磊，曾考慮去百度新聞做推薦系統，當時剛離開百度、創立地平線的余凱勸說他，最好去一個推薦系統是核心業務、受重視的地方，哪怕是家小公司。最后李磊便加入了當時規模還不大的今日頭條。

而且，創業如果成功，賣給大廠如亞馬遜后帶來的收益，也并非現在加入大廠拿千萬美元年薪所能相比的。

（預告：2012年后，以余凱為代表的一群華人科學家從硅谷NEC Lab離開回國，直接推動了中國AI產業變革，也影響了包括李沐、李磊在內的一大批AI大牛。雷峰網后續將推出相關文章《硅谷NEC Lab往事》，歡迎添加作者微信ExperienceMachine交流）

另外，從亞馬遜在這一波AI大模型競爭中的位置來看，盡管亞馬遜也已經布局，且內部已經開始測試類GPT工具，但目前在美國戰場占據制高點的，無疑還是微軟與谷歌兩大巨頭。像李沐和其導師Alex Smola這樣的科學家們，有技術、有影響力，也不會缺投資，所以他們要參與這一波競爭，創業的確是一個不錯的選擇。

而在技術優勢方面，ChatGPT目前主要是堆數據、堆參數的方式，其模型效果具有一定的偶然性，在工程優化、降低成本方面還有很大的空間。而李沐正是做系統出身，非常擅長工程優化這一塊，所以他的機會很大。

（公眾號：雷峰網）

打賞

感謝您的支持，我會繼續努力的!

掃碼打賞，你說多少就多少

打開支付寶掃一掃，即可進行掃碼打賞哦

上一篇：認知ChatGPT的過程就是消除偏見的過程
下一篇：魅族、領克與京東合作，京東成核心新品首發地

隨便看看：

天天综合色天天综合色h,欧美一区亚洲一区,亚洲精品成人一区,在线不卡日本v二区707

獨家丨一位 AI 科學家，拒絕了張一鳴開出的千萬年薪