阿里版ChatGPT上線,誰會是大模型生態的下一個卷王?
阿里雲官方宣布,上線自研大模型聊天AI“通義千問”,並定向邀請企業用戶進行測試。不過此後不久,阿里雲官微就刪除了上線測試的公告,通義千問的首頁也刪除了邀請用戶測試的按鈕。不過目前,拿到了邀請碼的用戶仍可登陸通義千問,並進行實測。
在通義千問上線測試之前,阿里雲已經對該款產品進行過一波預熱。4月4日,國內脫口秀演員鳥鳥就在微博秀出了“鳥鳥分鳥”的聊天AI分身,並與這個數字分身進行了多輪對話。鳥鳥在視頻中介紹稱,該分身採用了阿里的類ChatGPT語音助手,能夠模仿她的音色、語氣以及文本風格。
測試版的通義千問與目前市面上的大型語言模型(LLM)產品的界麵類似,都是左邊對話列表,右邊對話窗口的佈局,對話也是採用一問一答的形式。通義千問在單純的對話模式之上,製作了9款稱為“百寶袋”的小應用。
答題一般,但似乎更好玩
相比當前上線的大模型應用,通義千問多了一個“百寶袋”功能。
通義千問的“百寶袋”中一共有9款小應用。其中包括,效率類:寫提綱、SWOT分析、商品描述生成;生活類:會放飛的菜譜、小學生作文、然後呢;娛樂類:彩虹屁專家、寫情書、為你寫詩。
設定場景對於普通用戶來說是一個非常友好的體驗類功能,給用戶提供了更強的可玩性。
“我們曾經對ChatGPT的測試用戶做過問題收集,一開始用戶並不知道怎麼對ChatGPT提問,多數問題都是’你是誰?OpenAI是誰?’。”某國內大模型研發機構專家告訴虎嗅,普通用戶玩ChatGPT的上手速度很慢,使用之初很難感受到基於大模型的對話機器人與傳統NLP有什麼差別,因此在之後的使用中,很難保持熱度——用一段時間就沒什麼問題可問了。
而像通義千問這樣,提供了設定場景的對話,可以在一定程度上提高用戶的試玩興趣,保持使用粘性。
“留住用戶對一款大型語言模型來說非常重要,用戶的真實問答和反饋,可以說是大模型生存發展的根基。”前述大模型專家對虎嗅說,對於大模型,算法的可延展性很高,但這仍需要基於足夠的數據進行優化,只要有大量不斷的數據輸入,算法是可以持續改進的。
OpenAI的算法優勢最為明顯,這源自於其先發優勢,真正壁壘實際上是GPT前三個版本的持續迭代。在ChatGPT上線後的3個月中,OpenAI就根據用戶反饋的數據對ChatGPT進行了兩次升級。
對於國產大型語言模型來說,現階段的研發工作固然重要,但留住真實的測試用戶,收集他們的反饋數據,對於大模型的迭代和後續的研發工作來說,更加關鍵。
大模型只是基礎,生態為王
事實上,應用不僅是現階段積累用戶的手段,更是大模型的未來。
在ChatGPT的插件功能上線之後,AI大模型的商業化路線,在公眾的視野中,開始逐漸清晰:AI通用大模型可能就是未來的Window、iOS、Android。
無論通義千問還是ChatGPT,任何一款問答機器人產品都只是它背後的大型語言模型能力的體現,單純的操作系統是沒法賺錢的,生態才是最關鍵的。真正在iOS和Android上創造價值,賺到錢的還是抖音、美團、滴滴這樣的產品以及它們背後廣闊的應用場景。
對於通義千問未來的應用方向,虎嗅從阿里內部人士處得到的回答是“皆有可能”。該人士表示,阿里巴巴集團的業務範圍很廣,數字化產品線豐富,通義千問的AI能力在很多場景和產品中均有施展空間。
與海外先行者微軟、Google相比,阿里巴巴的業務不僅覆蓋了互聯網、軟件服務,還包括了大量的在線購物、生活服務、物流,以及文娛產業。
“淘寶、天貓的客服,肯定是AI大模型最直接的應用場景。”某淘寶店主告訴虎嗅,目前淘寶的AI客服對於店家和賣家來說,體驗都很一般。免費的機器人明顯“不太聰明”,高級的付費機器人對於很多中小型賣家來說,不僅操作複雜,而且還會多出一筆“不必要的開支”。
在這方面,ChatGPT類的大模型產品明顯可以提升體驗,不過在成本方面或許還有長期優化的空間。目前,國外已經有一些基於ChatGPT等LLM模型,給網站構建聊天機器人的服務上線,例如一家名為Chatbase的網站。
“辦公軟件和SaaS行業現在是最有動力’卷’大模型的行業,畢竟微軟已經公佈了GPT-4版本的Microsoft Copilot,現在不追上,以後可能就連追的機會都沒有了。 ”某阿里雲研發人員對虎嗅表示,釘釘在SaaS辦公軟件行業的市場份額在國內相當領先,這也給應用落地提供了很強的市場基礎,“目前國內用戶試用慾望很強,但是它們對產品要求也很高。 ”
達摩院研發的通義千問最先實踐的場景很可能會直線對接在阿里雲的業務當中,釘釘無疑是最佳落地場景之一。在3月28日,阿里巴巴官宣分設六大業務集團,併計劃各自獨立上市,這或許能促進通義千問在阿里雲業務中更快推廣。
通義千問,源自阿里達摩院在2022年9月發布的“通義”大模型。而阿里對大模型的研究可以追溯到2019年的PLUG,以及10萬億參數的多模態大模型M6。
隨著OpenAI發布ChatGPT,微軟、Google、Meta等矽谷互聯網巨頭紛紛宣布加入大型語言模型戰局,中國廠商也不甘示弱,密切跟進。這些大廠們都在競相開發自己的大模型,試圖在大模型研發中爭奪生態的主導權。在這樣的背景下,如何打造大模型的生態成了互聯網大廠需要考慮的問題。
如今,各家大廠都在秀肌肉。微軟與OpenAI直接達成合作,Google公佈了L AMD A、PaLM等大模型和聊天機器人Bard,Meta發布了開源大模型LLaMA系列並在多個測試中取得了出色成績。
國內廠商如阿里、百度和華為也在加緊佈局,阿里達摩院發布通義千問之前,百度剛剛推出了基於文心大模型的聊天機器人“文心一言”。4月8日,華為雲人工智能領域首席科學家田奇在人工智能學會的人工智能大模型技術高峰論壇上,更新了一些盤古大模型的最新進展,並展示了盤古大模型在多個專業領域的應用場景,以及模型能力。在此之前不久,華為雲盤古AI 大模型中的NLP 大模型、CV 大模型、多模態大模型以及科學計算大模型均已被標記為即將上線狀態。
目前,國外的深度學習框架如TensorFlow(Google開發)、PyTorch(Facebook開發)、Keras(基於TensorFlow或Theano的高級API)和MXNet(亞馬遜開發)已經聚攏了一眾開發者。國內,百度有飛槳PaddlePaddle社區,阿里有魔搭ModelScope社區,華為有昇思MindSpore社區。圍繞這些社區,各大廠商也在打造自己的開發者生態。誰能率先在生態上佔據有利地位,就能夠在這場AI之爭中拔得頭籌,這不僅意味著應用,也意味著擁有更多的訓練數據。“中國的AI大模型,先不管好不好用,先要有。”一位AI芯片企業創始人對虎嗅說。