▲陸AI天才少女羅福莉。(圖/翻攝極目新聞,下同)
記者魏有德/綜合報導
小米創辦人雷軍持續投入AI領域研發,近日不僅傳出要建立GPU萬卡集群,也耗資千萬(人民幣,下同)挖角來自北大的AI天才少女羅福莉,將其延攬進入小米AI大模型團隊。據悉,羅福莉正是大陸國產大模型DeepSeek「DeepSeek-V2」的關鍵開發者之一。
《極目新聞》報導,雷軍在公開演講時曾表示,小米做大模型的思路和很多公司不太一樣,選擇主力突破的是輕量化和本地部署。對於小米這樣無論在手機還是造車上都講究「性價比」的公司而言,如何在燒錢的大模型業務中平衡成本,無疑是雷軍考慮的核心問題。而這,或許也是擁有DeepSeek-V2研發背景的羅福莉被雷軍看中的原因。
公開資訊顯示,羅福莉為四川人,95後,本科就讀於北京師範大學計算機專業,碩士畢業於北京大學計算語言學專業。她在2019年還在就讀北大讀碩士期間便於人工智能領域頂級國際會議ACL上發表8篇論文(其中2篇一作),一戰成名,被封為AI天才少女。
當時,羅福莉回應稱,「投稿ACL是我近一年的產出,所以我認為自己是付出了足夠的努力的,當然也可能也有運氣成分加持。」
羅福莉研究所畢業後,先進入阿里達摩院做人工智能研究,從事預訓練語言模型相關的工作,負責阿里達摩院AliceMind開源項目,主導開發多語言預訓練模型VECO。
直至2022年,羅福莉加入幻方量化從事深度學習相關策略建模和算法研究,後跳槽至DeepSeek擔任深度學習研究員,參與研發MoE大模型DeepSeek-V2。
羅福莉在2024年5月DeepSeek-V2發表後撰文稱,「單論DeepSeek-V2模型的中文水平,是真實處在國內外閉源模型的第一梯隊...外加1元/百萬輸入Tokens的價格,只有GPT4價格的1/100,性價比之王。」
讀者迴響