Sam Altman再出手投資了兩位不到20歲的小創業者
Sam Altman又出手了。這次他投資了一個只有5個人的RPA早期團隊Induced AI,兩位共同創辦人Aryan Sharma和Ayush Pathak,一個18歲,一個19歲。不只是Sam Altman,SignalFire、Peak XV 、SV Angel等機構共同參與了Induced AI這一輪230萬美金的種子輪融資。
此次融資,科技加速器AI Grant的兩位創辦人Nat Friedman和Daniel Gross也加入了Induced AI的團隊。這兩位在科技界的大名如雷貫耳,Nat曾任Github的CEO,Daniel創立的搜尋引擎公司Cue則被蘋果收購。
這支團隊及其產品有何過人之處,為何能吸引眾多大佬的橄欖枝呢?
RPA 3.0:開啟瀏覽器,讓AI完成所有工作
Induced AI的兩位創辦人──Aryan和Ayush──別看年紀小,創業經驗相當豐富。這兩位年輕程式設計師的創業履歷遍及醫療、廣告、教育、區塊鏈、web3等領域,甚至還發起創業社群和類似孵化器的組織。
這次創立的Induced AI則是一款釋放企業員工生產力的「RPA 3.0」。用戶只需用簡單的英語輸入工作流程和錄屏視頻,Induced AI就能將其實時轉換為偽代碼,並調取多種相關工具,來執行大量重複性任務。
兩位創辦人|圖源:Linkedln
RPA(Robotic Process Automation,機器人流程自動化)並非新鮮概念,普通人在日常生活中也隨處可見,例如Excel中的“宏”,或者很多人用來搶演唱會門票的小工具“按鍵精靈”,都可以看做RPA的前身。傳統的RPA定義上,軟體記錄人的操作,例如點擊滑鼠、鍵盤輸入、打開資料夾、發送郵件等,並將這些操作固定下來形成規則和套路,批量地自動執行,從而節省人的時間,提升工作效率。隨著AI技術進步,機器辨識影像、理解語言、邏輯思考的能力不斷提升,這些技術也與RPA結合在一起,釋放更大的能量。
如同RPA概念所定義的,迄今為止,市面上的RPA工具需要人工製定好明確的規則,而複雜任務的規則也會耗費大量人力。Induced AI則藉助大語言模型的能力,讓工具有了邏輯推理和判斷的能力。用戶只需說出他的需求,例如“給我建個Jira的ticket”,或者“幫我篩選一波簡歷,給候選人發面試邀請”,Induced AI就可以對要做哪些事情進行實時判斷和拆解,並自動調取相關的工具來完成整個流程。
以篩選履歷這個任務為例,常規的人工操作流程包括:登入你的領英帳號、搜尋履歷、評估履歷、下載履歷、發送邀請等。如果領英沒有提供官方的API接口,過去的RPA很可能就卡在登入這一步了,甚至可能被判定為惡意機器人。Induced AI在Chromium上建立了一個瀏覽器環境,它有自己的記憶體、檔案系統和身份驗證憑證(電子郵件、電話號碼)來執行複雜的流程,因此可以自動完成登入、填寫驗證碼、檔案下載、儲存和重複使用資料等動作,沒有開放API的軟體也攔不住Induced AI。
一波AI Agent正在襲來
讓工具,特別是有智慧的工具替人類工作,是從我們的老祖宗開始就產生的夢想。從木牛流馬到Siri,人們始終覺得這些「助手」還欠點火候。直到ChatGPT和AutoGPT橫空出世,AI Agent似乎即將成為可能。
OpenAI的研究員Lilian Weng撰文定義了基於大語言模型的AI Agent:大語言模型、記憶、任務規劃、使用工具,四個模組缺一不可。儘管Induced AI團隊將自己定位成“RPA 3.0”,但從其產品特性來看,他們更像一個AI Agent,這也是為什麼Sam Altman等AI大佬一致看好這個年輕的團隊。
在目前的AI熱潮下,Induced AI不是第一個、也絕對不是最後一個AI Agent團隊。
暫且不提那些訂票、點外賣的小而美Agent,或者AutoGPT、HuggingGPT等幾乎人盡皆知的項目,與Induced AI有同樣打造AI員工野心的團隊就有不少。
例如今年三月完成3.5億美元B輪融資的Adept,自己訓練了一個ACT-1,這個模型專門用來在電腦上回應使用者的自然語言指令並執行操作。它可以使用現有的所有軟體工具、API和網站。ACT-1同樣基於瀏覽器工作,使用者可以在和AI的聊天框裡輸入自己的指令,例如在Salesforce裡建立一條銷售線索,或是在GoogleSheet裡計算一些資料。
Adept的ACT-1|圖源:Brigade Web
無獨有偶,科技公司Rabbit也研發了自己的大模型LAM(Large Action Model),並基於它推出了一套完整的「個人作業系統Rabbit OS」解決方案。LAM能夠觀察人機互動的介面,形成“概念藍圖”,從而在使用者的自然語言指令不那麼明確的時候理解並實現人類的潛在意圖。基於LAM,Rabbit還專門設計了一套軟體平台,使其Agent能夠更人性化地完成任務。今年10月,Rabbit獲得Khosla Ventures領投、老股東跟投的2,000萬美元融資。
未來已來嗎?
當然,除了創業團隊,傳統的RPA、低程式碼、無程式碼等公司,幾乎無一不在擁抱大語言模式和AI Agent,畢竟在今天,只要一提這兩個概念就能讓投資人和客戶眼前一亮,忍不住多看一眼。
今年以來,AI Agent的幾個爆款應用和幾次出圈,讓人工智慧的呼聲一次次被推向高潮。但我們仍然不禁要問,未來已來嗎?眼前的熱鬧是改變還是泡沫?
如果拿自動駕駛來做個比喻,我們更為熟悉的Copilot和Midjourney這樣的產品類似L3級別的自動駕駛,即機器是人類的“助手”和“副駕”,而Agent對應著L4級別的自動駕駛,人類只要設定目標、監督結果,機器自己完成決策執行。今天,L3級的AI副駕仍然處於落地應用的早期,無論是技術能力還是商業價值,尚有大量值得探討的問題,未能全面推廣。
以此看來,L4等級的AI Agent大規模應用可能就更遠了。那麼,目前的AI熱又是一波割韭菜的炒作嗎?它是否會想幾年前的區塊鏈、VR、元宇宙一樣,只是曇花一現?
Adept的ACT-1|圖源:DEV
可以肯定的是,生成式AI以及相關的概念熱度正在消退。
無論是媒體關注或是市場反應都已經暗暗證實了這一點。Gartner今年發布的技術成熟度曲線上,生成式AI和AI增強的軟體工程都放在了膨脹期,意味著這兩項技術在未來2-5年都即將進入幻滅期低谷——一如曾經的自動駕駛和上述技術概念。不過,正是在熱度衰減、噪音安靜的幻滅期,才有更多有意義的經驗和知識沉澱下來,為接下來的啟蒙期奠定基礎。
在變革性技術的發展歷程中,每一次波峰波谷都有意義。
從圖靈機到IBM的超級電腦深藍,從機器學習到神經網絡,從AlphaGo到ChatGPT,每個里程碑之間都充滿失望、懷疑和寒冬,將視線拉長,人類走到今天已經取得了長足的進步。無論是否有泡沫,未來永遠是由樂觀者和實幹者創造的。