中國OpenAI們“狂飆”200天:一面PPT造模一面落地應用難
美國OpenAI公司研發的一款ChatGPT的人工智能(AI)聊天機器人產品破土而出。OpenAI可能也沒想到,原本ChatGPT只是向消費者展現GPT能力的產品,卻能在過去200天裡引發從投資人到創業者、從獨角獸到大廠、從業界到學術界、從經濟學家到科技部部長的廣泛關注。與此同時,Google、微軟、阿里等超30家科技大廠、創業公司、機構相繼下場,一時間討論四起,全球展開了一場AI 大模型“軍備賽”。
《中國人工智能大模型地圖研究報告》顯示,截至今年5月28日,中國10億參數規模以上的大模型已發布79個。而美國、中國占全球已發布大模型總量的80%以上。
當下行業內達成的一個基本共識是,ChatGPT的出現標誌著通用AI 的起點和強AI 的拐點,是AI 領域科技創新和成果應用的一次重大突破,也是新時代數字化的“發電廠”。
利用ChatGPT,以SaaS(軟件即服務)服務的方式接入到干行百業,所有數字化系統和各個行業都值得用ChatGPT重做一遍。更多人未來期望ChatGPT使企業數字化業務流程更快、更高效、更智能。
不過,相比OpenAI和微軟公佈包括摩根士丹利、Stripe等公司使用ChatGPT的商業案例,國內“百模大戰”中卻出現了一個怪現象:
技術和產品能力似乎都很強,但一到客戶手裡卻出現各種bug,公佈對話大模型的公司都在談自身的技術能力強、場景化方案,部分還公佈合作信息,但都極少在公開場合談商業落地案過程。
一位行業人士向鈦媒體App透露,某家上市公司在一次電話溝通會上吐槽,其使用某互聯網大廠研發的千億AI 大模型產品,儘管聲稱實現3分鐘製作PPT、全球大廠中第一個同類型級別產品,但該上市公司最終將大模型接入公司係統時,卻出現“一連接就死機”的情況。
近日在上海的一場AI大模型產業應用論壇上,一位AI 大模型創業者甚至直言,過去幾個月內發布的十幾個大語言模型都大同小異,現狀是全球只有OpenAI能夠達到通用AI 的商業化,且有絕大部分用戶的市場。除此以外,國內AI 大語言模型遠沒有達到可商用化程度。
PPT式大模型能做千行百業
商業應用時卻漏洞百出
“在我看來,ChatGPT這波AI 2.0能否真正發展起來,取決於是否有商業模式,是否有客戶來買單。GPT這類大模型無論怎樣去訓練,如果沒有應用、沒有場景、沒有買單、沒有商業模式,它就不可能成功。”6月2日上海臨港的一場圓桌上,云網一體化雲計算上市公司首都在線執行總裁姚巍直言,AI 大模型的商業化對於行業發展極為重要。
從客戶方面,企業也急需生成式AI 帶來業務變革。
創業者服務平台GoDaddy日前對全美1003家小型企業的調查數據顯示,ChatGPT以70%的應用率成為美國小型企業應用最多的生成式AI產品;
38%的受訪者,在過去幾個月裡嘗試過生成式AI;營銷、內容創作、商業建議是企業應用生成式AI最多的3個用例;75%受訪者非常滿意生成式AI在業務中的表現。
隨著海外大模型快速更迭OpenAI推出每月20美元的付費試點訂閱服務ChatGPT Plus,以及ChatGPT/GPT-4 向開發者開放API且價格下探,全面帶動了大模型在應用層面持續落地。
與此同時,國內眾多大模型也陸續發布,基於2000億美元生成式AI 前景市場、50萬億數字經濟產業規模,AI 大模型有望在中國得到最大範圍的商業化開發。
創新工場董事長兼CEO李開復曾表示,AI 2.0時代進入提升生產力的應用井噴期,存在巨大的平台式機會,而且將是中國在AI領域的第一次參與平台角逐的機會。
具體來說,結合大模型相關企業研發信息以及券商研究報告,還有微軟最近對外公佈的應用場景,鈦媒體App以下梳理出ChatGPT類產品在七大行業裡面主要的商業化應用:
企業運營:日常辦公文檔材料撰寫整理;營銷對話機器人,市場分析,銷售策略諮詢;法律文書起草、案例分析、法律條文梳理;人力資源簡歷篩選,預招聘,員工培訓。
教育:協助評估學生學習情況,為職業規劃提供建議;針對學生情況以及興趣定制化學習內容;論文初稿搭建及論文審核;幫助低收入國家/家庭通過GPT獲得平等的教育資源。
遊戲/媒體:定制化遊戲,動態生成NPC互動,自定義劇情,開放式結局;出海文案內容生成,語言翻譯及輔助廣告投放和運營;數字虛擬人直播;遊戲平台代碼重構;AI自動生成副本。
零售/電商:輿情、投訴、突發事件監測及分析;品牌營銷內容撰寫及投放;自動化庫存管理;自動生成或完成SKU類別選擇、數量和價格分配;客戶購物趨勢分析及洞察。
金融/保險:個人金融理財顧問;貸款信息摘要及初始批复;識別並檢測欺詐活動風險;客服中心分析及內容洞察;保險理賠處理及分析;投資者報告/研究報告總結。
製造業/汽車:生產計劃、供應鏈計劃狀態查詢;產線預測性維保輔助;產品質量分析與溯源;自動駕駛全場景模擬訓練及虛擬汽車助手;線上購車品牌、配置對比分析。
生命科學:研發階段靶點發現及產品成藥性;醫學文獻內容檢索,重點摘要提取,相關法規整理;醫藥代表培訓及知識庫建立;分診導診助理、診療助理、術後護理及復建輔助。
不僅如此,ChatGPT大模型以及生成式AI 技術還將在圖片、視頻、數字人等領域的各種複雜場景中落地,利用海量的數據資源和算法實現商業化應用與迭代更新。
OpenAI曾做過一份研究估算,美國19%的崗位,至少50%的工作內容會被影響;80%的崗位至少有10%的工作內容被或多或少地波及,數學家、會計師和審計師、新聞分析師、法律秘書和行政助理、報稅員等職業最容易受到GPT大模型影響。
不過,上述內容更多屬於“紙上談兵”,用PPT暢想AI 前沿技術將場景智能化升級。最終在落地的時候,參數規模“競賽”很是熱鬧,但真正走到規模化產業部署的還寥寥無幾,後續的模型修正和迭代進化也進展緩慢。
不論是數據出現“一本正經胡說八道”,還是中英語言翻譯不准、算力不夠、價格昂貴等因素,AI 全面輔助購物、金融與製造業的觀點是片面的,提交到客戶應用時並非易事,可能會出現矛盾和問題。
例如,在雲知聲發布會現場演示中,當詢問醫療領域專業問題“治療閉角型青光眼的治療藥物應選擇什麼?”的時候,ChatGPT回答的是阿托品。鈦媒體App也嘗試了這個問題的回复,基本上是錯誤信息或不屬於國內藥品法規下能買到的藥物,而正確答案則是毛果芸香鹼。
同時,由於大模型背後大量採用英文數據語料,而非中文互聯網數據,因此會出現語言不通的現象。比如輸入“魚香肉絲”,會出現一個被切成絲的活魚圖片這種“尷尬”情況,所以在商業化過程中會出現一些問題。
一家金融領域企業高管此前告訴鈦媒體App,由於ChatGPT在數學計算方面能力較差、一些信息無法實時更新,因此國內大模型產品在金融領域效果並不佳,尤其會出現匯率和貸款信息錯誤,而且會產生信息不對稱情況。
今年4月AI 公司第四範式舉行的發布會上,一位銀行公司代表提到,在金融行業因為信息不對稱可能會導致更高息的信貸產品或者存款利率,但其實就算信息都給你,也可能做出的選擇並不是最優的。
“我們是做金融的,面向公眾服務,我傳遞的任何信息必須是準確的。”上述代表認為,大模型在企業落地時面臨挑戰主要就三點:內容可信風險、數據安全風險、落地成本高昂。
在製造業中,內容問題可能會產生更嚴重的影響。因為人工的瑕疵與錯誤會被嚴格限制,一些高精尖工藝需要分毫不差,一旦AI 系統出現錯誤,可能會引發一場事故。
清華大學惠妍講席教授、AI 公司銜遠科技創始人周伯文對鈦媒體App表示,現在像ChatGPT這樣的大模型進展很快,但問題在於它可能一本正經的“胡說八道”。尤其在專業領域,外行看它像內行,內行看它像外行。同時,內容的原作者視其剽竊,但普通用戶則視其在創造,實際它尚不具備原創性的思想。
此外,語言問題也需要得到重視。
據Wired報導,今年至少有15篇arXiv研究論文探討了大模型的多語言性。但研究人員發現,包括ChatGPT在內的AI 系統更擅長將其他語言翻譯成英語,而很難將英語重寫成其他語言,尤其是韓語、非拉丁文字等。不僅如此,ChatGPT在回答事實性問題或總結非英語複雜文本方面的表現要差得多,更有可能是偽造信息。
今年5月舉行的美國國會聽證會上,OpenAI CEO山姆·奧特曼(Sam Altman)表示,ChatGPT研發團隊正採取措施來縮小語言差距。他希望與政府和其他組織合作獲取數據集,以增強ChatGPT 的語言技能和回答正確內容。
商業案例極少談及
部分大模型落地遇阻
有行業人士向鈦媒體App直言,目前GPT已經實現了真正的智能化,下一步的成功點就是在大模型的產品化、商業化、工程化和應用場景化當中。
根據灼識諮詢的報告,2022年,全球AI市場的規模達1997億美元,複合年增長率為29.4%,預計2027年將達到5624億美元,2022年至2027年的複合年增長率為23.0%。
“今天AI 技術能力和5個月之前有天翻地覆的差別。我們把一個能力更強的產品放在系統平台上,至於銷售和服務,從商業角度來說,今天才剛剛開始,從接觸新技術到最終(採購)是需要時間的。”雲知聲創始人、CEO黃偉對鈦媒體App坦言,大模型才剛剛發布,尚未有規模化商業案例。
商業案例極少談及,是這輪國內大模型熱潮至今的一個重要特點。即便是AI 行業巨頭商湯,最近僅最新披露10+大模型客戶這一數字,鈦媒體App了解到其中大部分並非是垂直頭部企業。
5月30日,生成式AI(AIGC)公司出門問問向港交所提交招股書。
報告顯示,2022年出門問問總營收5億元,前五大客戶基本上是AIoT(物聯網)領域公司,大部分採購出門問問手錶等智能物聯網方案,客戶合作超過三年,而非其AIGC業務服務。
早在4月下旬,出門問問宣布推出AI 大模型“序列猴子”,並開啟內測探索。出門問問創始人兼CEO李志飛告訴鈦媒體App,出門問問不需要外部融資也能支撐研發投入。除大模型外,公司其他業務並不太燒錢。“(大模型)可能就是我最後一次All in幹的一件事情”。不過在招股書中,鈦媒體App並沒有看到大模型的商業化具體收入。
這意味著,包括ChatGPT大模型在內的AIGC行業,目前來看很難產生大規模的營收。
當然,過去幾年AI 技術落地應用時,商業客戶也很難實名披露,更多原因並不是由於客戶處於保密性很高的行業,而是AI 太廣泛了,人人都想蹭上“數字經濟”。
例如,去年10月,鈦媒體App實地探訪了浙江台州的一家全球市銷第一的縫紉機設備製造龍頭,該公司目前在A股上市。其中AI 技術龍頭曠視科技作為了該公司物流機器設備和AI 技術供應商,合作建成了“智能密集庫”。
不過鈦媒體App實地探訪完這次AI 技術真實的商業化落地後卻被告知,這家製造龍頭不想對外披露與曠視科技的合作,原因並不是因為上市公司的披露要求,而是該公司董事長希望對外聲稱,是他們自研的AI 智能技術的落地應用,而不是曠視。根據其在上交所的披露,他們籌資了超過10億元投資自建智能化工廠。
因此,鈦媒體App今年3月與曠視科技CEO印奇談及這件事時,他坦言,AI 這個詞被每個人都用爛了,而且AI 平民化情況導致AI公司有時候很難宣傳,有些東西早就被別人三年前講完了,“我們需要接受現狀。”
“我完全不介意我們的客戶不講是曠視做的。舉個例子,華為幫運營商做了那麼多事情,但早期大家只知道華為是個很棒的公司,並非知道華為做的是什麼事情。華為後來又做了To C的產品,所以才開始做一些品牌宣傳。客戶自己願意講,說明他從這個角度也認為這個事情很重要。中國面向資本市場各方面也需要有些話題性,連一些O2O公司都說AI,就說明了無論相關不相關,所有人都在做AI。”印奇對鈦媒體App 表示。
多家傳統製造領域的企業創始人告訴鈦媒體App,他們要與大模型、做AI 技術研發公司來合作,主要還是創業公司受限於算力、數據、電力等高昂成本,無法自煉大模型。而透過AI 公司團隊進行一定的數據合作,之後一旦懂得這個技術秘訣,就自己搭建團隊做。
“我們絕對不會在一家AI 公司上長期合作,因為價格太貴了。”一位供應商告訴鈦媒體App。
根據第四範式4月公佈的招股書顯示,儘管2022年公司同比增長52.7%,但整個客戶來源比較多樣化,最近三年排名前五的客戶中幾乎沒有重複的,客戶群不是十分固定。
第四範式創始人、CEO戴文淵隨後向鈦媒體App解釋稱,前十大客戶變化不代表每年客戶都在變化,客戶留存率很高,每年甚至能在90%。
企業如何解決大模型落地難問題?
解決大模型落地問題,總結來說主要有三方面:提高內容可信;解決算力成本高、訓練重複和資源緊缺的問題;大模型價格需要不斷降低,或使用垂直領域模型落地。
首先是提高內容可信問題。
周伯文對鈦媒體App表示,我們應該做一個具備通用能力的大模型,能夠解決不同用戶的實際問題,而且需要不斷通過商業交付去應用、反饋,甚至需要評測以解決內容可信問題。
中國科學院院士、清華大學人工智能研究院名譽院長張鈸認為,ChatGPT沒有解決的就是自我學習的能力,這是ChatGPT最致命的地方,因此需要把更多數據去優化以進一步解決實際應用問題。
“不要認為ChatGPT能解決全部的人工智能問題,沒有重新學習的能力,不可能應對變化。國內、國外都一樣,我問美國的ChatGPT也是這樣來答的,問中國的ChatGPT,有的做得比較好,有的也是錯誤的。這就給我們提出一個問題,我們要把它用到這些決策問題上面去,這個重大問題需要進一步解決。”張鈸表示。
曠視科技物流業務事業部的負責人徐慶才在最近一次交流中提到,目前大模型需要走向垂直化,可以結合場景用一個模型和一個框架下統一去提高內容精準度。
“目前依然有一定差距,這個差距來自於現在技術上的不可實現,來自於現在沒有找到一個好的方式實現這個東西,這就是我們現在需要來看,現在新技術到底能不能夠彌合這個點,我們判斷這些問題很快都會被解決。”徐慶才表示。
其次是解決算力成本高、訓練重複資源卻緊缺的問題。
一家AI 算力公司聯合創始人張新(化名)對鈦媒體App提到,以GPT-3模型為例,現有千卡集群訓練一個月,單次訓練週期一個月,總成本超過1200萬美金。今年上半年,全行業(訓練卡)在漲價,持續漲價超過25%。但在這樣一個情況下,今天仍然沒有人能夠用商業化的國產芯片去做大模型的訓練。
數據、算力、算法三要素當中,算力是基礎,也是大模型競爭力,但國產芯片在軟件適配度、穩定性方面仍顯不足。張新認為,國產芯片與英偉達顯卡之間的解耦能力較弱,他們相信可能未來的幾個月內逐步用國產芯片去做百億,甚至更大體量的模型的訓練,但算力的累積依然是重要挑戰。
礪算科技聯合創始人、聯席CEO孔德海認為,可以從四方面來解決算力矛盾問題:一是協同化,把很多運算可以跑在雲端,並根據需求進行協同;二是模型小型化,在高質量數據前提下,小型模型可以在單機上運行;三是再訓練,在有限條件下,反複訓練有助於提升用戶體驗;四是融合計算。
目前,AI 大模型算力主要在訓練、推理兩個部分,其中成本最高部分是前期的模型訓練,大部分採用智能計算中心、自費買英偉達A800/H800顯卡組成服務器運行、或者是用價格更為實惠的服務器雲來訓練。而推理部分算力需求較少、價格不高,大部分模型應用都需要同時建立公有云、私有云兩種混合模式,而且需要購買一定的雲服務,以更好做大模型應用。
最後是價格問題。
價格是大模型商業化最重要的因素。由於訓練成本高、數據篩選難度大,因此,千億參數模型的報價高達數十萬元,而高昂的售價讓很多客戶望而卻步。
戴文淵向鈦媒體App表示,不是所有的場景、客戶都能接受千億參數的成本,這個需要客戶選擇,即便是千億、萬億的參數只是代表你的最高能力,但最後給到客戶的時候,就不一定所有的場景都能技術釋放。而垂直大模型的數據生成規模會小一些,場景更易用,Chat的思維能力更高。
比如,彭博此前發布了金融領域的大模型BloombergGPT,應用於其所在的垂直領域;醫聯則發布發佈內首款醫療大語言模型MedGPT,可在真實醫療場景中發揮實際診療價值。無論是醫療、金融、電商等領域,都需要垂直性大模型產品。
多位AI 行業人士向鈦媒體App指出,從產業角度來看,通用模型就是“百科全書”,能夠有問必答,能夠適用不同的產業土壤,而垂直模型類似於單領域的專家,雖然專業,但受眾注定是少數人。但垂直大模型的發展對各個領域的模型性能持續提升。
今年6月16日,OpenAI進行了更新,GPT模型的價格降低了75%,GPT-3.5-turbo的輸入代幣價格降低了25%最新價格,每1k token,0.0001美金。奧特曼還曾提到,OpenAI正在開發新的技術,將可以使用更少的數據、更低廉的價格來訓練模型。
“當模型足夠大之後,它可以把問題泛化成一個通用問題自然輸出,可能未來常見的99%以上的物體或事件用一個模型自己就可以去做了。帶來的好處就是,很可能就會非常快的加速商業化落地,帶來更好的技術能力。比起原來方式,可能會更快地縮短產業應用的周期。” 商湯科技聯合創始人、大裝置事業群總裁楊帆對鈦媒體App表示。
360公司創始人、董事長周鴻禕近日表示,ChatGPT的出現,代表著超級AI 時代的來臨。大模型屬於通用人工智能,在很多維度上已經超越了人類。同時,大模型是工業革命級的生產力工具,將會帶來一場新工業革命,能賦能百行千業,就能在實體經濟轉型數字化、智能化過程中發揮重要作用。
“我認為中國發展大模型沒有不可逾越的技術障礙,要感謝OpenAI的成功給我們指明了技術方向,點明了技術路線,中國科技公司在產品化、場景化、商業化上有很大的優勢,我對我們能打造這個大模型深信不疑。”周鴻禕表示,未來中國不會只有一個大模型。
不過從投資角度,嘉禦資本董事長兼創始合夥人衛哲最近提到,“我們不碰大模型。”
衛哲認為,多年互聯網從業下來告訴人們,一定是頭部佔據60%、70%的份額,搜索引擎、電子商務無一例外,這次人工智能也是如此,勝出的大模型在中國很難超過2個,在中國以外的世界包括美國,也很難超過2個。
大模型是典型贏家通吃領域。需要更多的錢,需要更多的算力,以及更優秀人才。因為更好的算力意味著更多人用,更多人用意味著更多數據,更多數據意味著更好的算力結果。大模型必然是巨頭必爭之地,巨頭有錢,有技術,更重要是有數據。
就目前“百模大戰”來說,正如周鴻禕所說,大模型關鍵在於讓更多人去使用,將大模型能力與更多場景相結合,打造更多落地應用。
所以總結來看,大模型必然是只有極少數公司能做起來,給創業公司的機會很少。甚至可以說,如果不能把大模型商業化,這家企業一定會輸在這輪賽道比拼中。
因此,擺在大模型企業面前的問題非常嚴峻,如何將大模型更快落地應用,將技術能力釋放並與更多場景相結合,真正產生新一輪科技革命和產業變革,是當前緊要的關鍵問題。而關於大模型的落地,我們還有很長的路要走,需要時間、需要機會、需要生態。