給機器人裝大腦,智元又拉來一位技術大拿
2015年,羅劍嵐到柏克萊攻讀博士,此後便一直探索Robotics+AI,也曾在Google X、Google DeepMind擔任研究科學家。在伯克利人工智慧實驗室擔任博士後期間,其領導者開發了世界上首個超人類的真機強化學習系統SERL/HIL-SRL。

羅劍嵐博士近期加入智元機器人,擔任首席科學家,根據揭露,他將全面領導智元具身智慧研究中心。
“已經和智元的團隊共同工作了兩三個月,智元在工程方面、在執行力等各種能力上,給了我很大信心,我覺得我們是有機會做出全球領先的具身智能係統的”,在今天早間時候的溝通會上,羅劍嵐博士對我們表示。

圖|羅劍嵐博士
2015 年,羅劍嵐到柏克萊攻讀博士,同時開始探索Robotics+AI,此後在Google X、Google DeepMind擔任研究科學家。但羅劍嵐也發現,從2016年Google發布第一篇有關robot learning的論文開始,很長一段時間內能夠部署到現實世界的機器人一直是零。
長期以來,其都執著於將強化學習應用於真實機器人操作,解決傳統RL (強化學習)依賴模擬環境、難以適應現實複雜物理互動的問題。
過去十年,羅劍嵐也體會了強化學習從AlphaGo時期的高漲熱情到逐漸平淡,但其始終認為,機器人的真機RL 是一個長期命題,一旦克服、將對機器人學習的突破產生範式般的變革。
這十年間,機器人領域的進步總是與其它技術的重大突破相伴而行, “就像CV 或者NLP 有一些突破,順著這個邏輯,我們看到現在大模型迭代速度很快,大家也開始擁抱強化學習”,羅劍嵐告訴我們,“大模型用大量數據預訓練的知識幫助機器人上手,但它可能有百分之七八十的成功打磨率。
羅劍嵐先前已領導開發了全球首個超人類的機器人真機強化學習系統SERL,使機器人僅需20 分鐘即可在真實環境中學會精密裝配,任務成功率達100%。在此基礎上,他又推出SERL的升級版HIL – SERL,引入人類即時修正,讓機器人能完成雙臂協調、動態操作等更複雜任務,訓練1 – 2.5 小時即可達100%成功率。當時執行的任務,包括組裝家具、顛勺煎蛋、插入U盤等。
此外,4月2日早間,智元機器人也正式宣布了與Physical Intelligence(Pi)達成合作關係。據透露,二者將圍繞動態環境下的長週期複雜任務,在具身智慧領域展開深度技術合作。
在美國,Pi是具身智慧領域的明星創業公司,專注於為機器人造大腦(建構通用AI),去年10月估值已升至24億美元,被產業稱為機器人領域的下一個OpenAI。目前,Pi也已成功研發出π0、Hi Robot等具身模型。
羅劍嵐的另一項重要工作,就是推進智元和Physical Intelligence(Pi)的深度合作。

在今天官宣合作的資訊中,也揭露了一些落地進展,目前基於二者的合作,智元機器人可以實現一個通用模型根據不同的指令輸入執行多個任務,並適配多種末端執行器,如靈巧手、夾爪,同時可以兼容魚眼和針孔相機等感測器。
根據表述,目前機器人保持動作柔順性與位姿穩定性,雙手靈巧配合,可以完成具有生物運動特徵的圍巾佩戴任務,並且還可以透過右手接過左手遞過來的圍巾執行「圍」的螺旋纏繞動作。

上個月,智元機器人完成了新一輪融資,領投方為騰訊,該輪融資有多個產業方及老股東跟投,包括龍旗科技、臥龍電氣、華發集團、藍馳創投等。
當月,愛企查顯示,智元機器人關聯公司上海智元新創科技有限公司發生了多項工商變更,新增廣西騰訊創業投資有限公司、臥龍電驅等為股東。此外,舒遠春卸任法定代理人,由鄧泰華接任。
鳳凰網科技了解到,鄧泰華在智元機器人擔任董事長、CEO。其過去曾擔任華為公司副總裁、計算產品線總裁等職務。
多位投資界人士曾表示,十分看重鄧泰華的履歷,「華為的鯤鵬、昇騰、歐拉,他都重點參與過」。可以說,智元機器人目前集合了多位電腦科學領域的大拿。除此之外,智元機器人也以150億估值進行新一輪融資接洽。