獨家丨一位 AI 科學家,拒絕了張一鳴開出的千萬年薪
作者丨李梅
編輯丨陳彩嫻
AI 科技評論獨家獲悉:字節(jié)跳動向知名 AI 青年科學家、深度學習框架 MXNet 作者李沐發(fā)出邀請,希望請他加入字節(jié)參與大模型研發(fā),開出千萬年薪。盡管條件豐厚,但綜合考慮后,李沐選擇了婉拒。
日前,AI科技評論報道了前亞馬遜機器學習部門首席科學家 Alex Smola 和李沐師徒離職、宣布在大模型賽道創(chuàng)業(yè)的消息。李沐與博士導師 Alex Smola 創(chuàng)立了一家公司,叫 Boson.ai,受到行業(yè)熱烈關注。
大模型的門檻高,據(jù)統(tǒng)計,全球能訓練大模型的 AI 科學家不超過 500 人,華人科學家則更少,搶人成為近日國內大廠的重頭戲。雷峰網(wǎng)得到消息,字節(jié)跳動的創(chuàng)始人張一鳴曾親自邀請李沐,不過李沐婉拒了這個年薪千萬的工作機會,最終選擇在硅谷創(chuàng)業(yè)。
李沐的選擇出乎當前行業(yè)主流觀點的意料之外。大家的共識是:國內能做成大模型的互聯(lián)網(wǎng)科技大廠最終不會超過5家,BATH+字節(jié);按照以往的規(guī)律,創(chuàng)業(yè)公司在大廠的擠兌下沒有生存的空間。但李沐對張一鳴說不的這一舉動,卻給了大模型的小創(chuàng)業(yè)團隊一個新的啟示:
大廠并非唯一選擇。
盡管大廠有幾萬人,但最終主導大模型研發(fā)的團隊不過幾十人。一方面,大廠有太多來自架構、業(yè)務、資源分配等方面的不確定性因素,最終能做成什么樣還是未知數(shù);另一方面,在一個新的、需要搶跑的賽道中,一個有能力、有決心 all in 的平臺,或許更能把握節(jié)奏,搶占先機。
最終,大模型做成,技術平臺積淀,再以數(shù)億的金額賣給大廠,也不失為一個好的選擇。進可攻,退可守,創(chuàng)業(yè)成為明星科學家眼中更「香」的選擇。
(AI科技評論將持續(xù)關注大模型創(chuàng)業(yè)動態(tài),歡迎添加本文作者微信ExperienceMachine交流爆料、互通有無)
—— 1 ——
李沐的「選擇」
李沐
這不是李沐第一次創(chuàng)業(yè)。
在上一波深度學習落地潮中,AI人才大規(guī)模流向工業(yè)界,彼時快要博士畢業(yè)的李沐也抓住機遇,選擇與他的兩位導師Alex Smola和Dave Andersen一起創(chuàng)業(yè),成立了一家公司Marianas Labs,李沐出任CTO。起初,公司的項目進展很順利,還被一家上市公司看中,就將公司賣給了對方,但后來還是終止了合作。最后,由于團隊核心人員離開,Alex和Dave分別去了亞馬遜和谷歌,李沐的這次創(chuàng)業(yè)便就此終止。
緊接著,又一次重要的選擇來到李沐面前。谷歌的AI掌門人Jeff Dean向李沐發(fā)來一封郵件邀請他去谷歌工作。當時Jeff Dean主導的深度學習框架Tensorflow問世,實力非常強,這對李沐而言當然是一個很好的機會。
但李沐還有自家的MXNet要發(fā)展,他認為“自己挖的坑,總是要自己填的”。當時李沐也考慮了一些技術性強的小創(chuàng)業(yè)公司,但從MXNet的發(fā)展來看,還是要找家巨頭來依靠更好,所以去亞馬遜是更優(yōu)選擇。
于是李沐就先以兼職的身份去了亞馬遜,帶著一些人做MXNet開發(fā)和AWS上深度學習的應用。之后李沐于2016年7月正式入職亞馬遜AWS,直接向擔任副總裁級別科學家的Alex匯報。
如今,六年多過去,在新一輪AI大模型熱潮下,李沐面臨著更大的機遇和更多的選擇。如同許多下場創(chuàng)業(yè)的AI科學家一樣,李沐也已經(jīng)瞄準大模型,準備開啟新事業(yè)。
Boson.ai 官網(wǎng)
—— 2 ——
頂級科學家選擇創(chuàng)業(yè)?更能 All in 大模型
字節(jié)跳動已經(jīng)入場語言生成大模型,挖人才進來正是頭等大事。字節(jié)現(xiàn)已經(jīng)攬入一名大將,原達摩院大模型M6帶頭人楊紅霞。而據(jù)知情人士稱,張一鳴親自給在國外巨頭工作的華人科學家打電話,邀請他們回國加入字節(jié)大模型事業(yè)。
像李沐這樣的頂級科學家,選擇自己創(chuàng)業(yè),而對大廠的招攬有所保留,這并不是個別現(xiàn)象,亦有其合理性。大廠固然體量大、資源多,但真要論內部專門投入做大模型的人才密度,恐怕并不高,再加上資源分配等方面可能存在諸多束縛,大廠最終能否做好自己的ChatGPT是一個問號。因此,在頂級科學家眼里,大廠并非是唯一的、最好的去處。
語言生成大模型本身也有很高的技術壁壘,所以,相比去一家聲量大但大模型并非主要方向的公司,建立一支更重視AI、能夠all in大模型的團隊,或許是更聰明的選擇。
這是經(jīng)過許多歷史驗證的,比如當年的百度少帥之一、曾任字節(jié)跳動AI Lab總監(jiān)的李磊,曾考慮去百度新聞做推薦系統(tǒng),當時剛離開百度、創(chuàng)立地平線的余凱勸說他,最好去一個推薦系統(tǒng)是核心業(yè)務、受重視的地方,哪怕是家小公司。最后李磊便加入了當時規(guī)模還不大的今日頭條。
而且,創(chuàng)業(yè)如果成功,賣給大廠如亞馬遜后帶來的收益,也并非現(xiàn)在加入大廠拿千萬美元年薪所能相比的。
(預告:2012年后,以余凱為代表的一群華人科學家從硅谷NEC Lab離開回國,直接推動了中國AI產(chǎn)業(yè)變革,也影響了包括李沐、李磊在內的一大批AI大牛。雷峰網(wǎng)后續(xù)將推出相關文章《硅谷NEC Lab往事》,歡迎添加作者微信ExperienceMachine交流)
另外,從亞馬遜在這一波AI大模型競爭中的位置來看,盡管亞馬遜也已經(jīng)布局,且內部已經(jīng)開始測試類GPT工具,但目前在美國戰(zhàn)場占據(jù)制高點的,無疑還是微軟與谷歌兩大巨頭。像李沐和其導師Alex Smola這樣的科學家們,有技術、有影響力,也不會缺投資,所以他們要參與這一波競爭,創(chuàng)業(yè)的確是一個不錯的選擇。
而在技術優(yōu)勢方面,ChatGPT目前主要是堆數(shù)據(jù)、堆參數(shù)的方式,其模型效果具有一定的偶然性,在工程優(yōu)化、降低成本方面還有很大的空間。而李沐正是做系統(tǒng)出身,非常擅長工程優(yōu)化這一塊,所以他的機會很大。
(公眾號:雷峰網(wǎng))
隨便看看:
- [業(yè)內]新研究:冰河時期人類曾從中國北部沿海地區(qū)遷徙到美洲
- [業(yè)內]我國提供越來越多國際海洋公共產(chǎn)品
- [業(yè)內]電刺激將傷口愈合速度提高三倍
- [數(shù)據(jù)]復盤一次慘淡的運營活動,有效訂單36!
- [業(yè)內]我國金融支持科技創(chuàng)新力度不斷提升
- [業(yè)內]智慧農業(yè)助力移民增收
- [業(yè)內]我國提高集成電路和工業(yè)母機企業(yè)研發(fā)費用加計扣除比例
- [業(yè)內]猴子移植基因編輯豬腎后可存活超兩年
- [科技]邊緣計算,原來早就在你我身邊
- [科技]Nreal CEO 朋友圈分享 Rokid Max 產(chǎn)品體驗
相關推薦:
網(wǎng)友評論:
推薦使用友言、多說、暢言(需備案后使用)等社會化評論插件