OpenAI的文本生成系統GPT-3現在每天要產生45億個字符
目前機器學習的最大趨勢之一是文本生成。AI系統通過吸收從互聯網上爬取的數十億字來學習,並根據各種提示生成文本。這聽起來很簡單,但這些機器可以被投入到各種各樣的任務中–從創作小說,到編寫糟糕的代碼,再到讓你與機器偽裝的歷史人物聊天。
最著名的人工智能文本生成器是OpenAI的GPT-3,該公司最近宣布,現在有300多個不同的應用被”數以萬計”的開發者使用,每天產生45億字。對於OpenAI來說,這可能是一個值得慶祝的里程碑,但它也是一個有用的指標,表明人工智能文本生成的規模、影響和商業潛力不斷增長。
OpenAI以非營利性公司的身份起家,但在過去的幾年裡,它一直在嘗試以GPT-3作為其第一個可銷售產品來賺錢。該公司與微軟簽訂了一份排他性協議,使這家科技巨頭可以獨享該程序的底層代碼,但任何公司都可以申請使用GPT-3的通用API,並在其基礎上構建服務。
正如OpenAI熱衷於宣傳的那樣,現在有數百家公司正是這樣做的。一家名為Viable的初創公司正在使用GPT-3來分析客戶反饋,從”調查、服務台票據、即時聊天記錄、評論等中識別出主題、情緒和情感”;Fable Studio正在使用該程序為VR體驗創建對話;Algolia正在使用它來改進其網絡搜索產品,而它又將這些產品賣給其他客戶。
所有這些對OpenAI(以及微軟,其Azure雲計算平台為OpenAI的技術提供了支撐)來說都是好消息,但並不是每個初創公司領域的人都熱衷於此。許多分析師指出,在你實際上並不擁有的技術上建立公司是愚蠢的。使用GPT-3創建一家創業公司簡單得令人啼笑皆非,但對你的競爭對手來說也會簡單得令人啼笑皆非。雖然有辦法通過品牌和UI來讓你的GPT創業公司與眾不同,但沒有哪家公司能像OpenAI本身一樣,站在使用這項技術的立場上獲得那麼多好處。
關於文本生成系統崛起的另一個擔憂主要與輸出質量問題有關。像許多算法一樣,文本生成器有能力吸收和放大有害的內容。在對一個使用GPT-3構建的醫療聊天機器人的測試中,該模型對一個”有自殺傾向”的病人的反應居然是鼓勵他們自殺。這些問題並非不可克服,但在一個算法已經在製造錯誤的逮捕、不公平的學校成績和有偏見的醫療賬單的世界裡,這些問題當然值得被指出來。
不過,正如OpenAI的最新里程碑所表明的那樣,GPT-3只會不斷地說話,我們需要為一個充滿機器人生成的聊天的世界做好準備。