文心一言來了ChatGPT的壓力李彥宏接住了嗎
“十月懷胎,一朝分娩。”研發近5年,提前一個月宣傳造勢,備受關注的百度文心一言終於揭開神秘面紗。3月16日,百度基於文心大模型技術打造的生成式對話產品——文心一言正式亮相。據百度創始人、董事長兼CEO李彥宏介紹,文心一言在文學創作、商業文案創作、數理推算、中文理解、多模態生成等方面有突出能力。
作為國內少有擁有大模型技術的企業,百度從2019年開始進行大模型探索,打造文心大模型家族,包含PLATO、ERNIE 3.0等多個NLP大模型,其中PLATO主打對話交互。從技術出發,文心過往在NLP模型上的實踐,成為百度打造“文心一言”的基礎。
“從這個意義上說,文心一言的發布只是我們過去多年努力的自然延續。”李彥宏表示。
為什麼要在此時發布文心一言?百度真的ready了嗎?針對這個高頻問題,李彥宏回答:“因為市場需求。”
“我自己在內測過程中體驗到,(文心一言的)能力確實談不上完美。”李彥宏坦誠,但是包括搜索、智能雲、自動駕駛和小度在內的百度各個產品線都在等著使用這項技術。尤為重要的是,百度的客戶也在等著這項技術的發布。
在半個小時的介紹裡,李彥宏介紹了文心一言的實用功能。不過因為現場打字不方便,發布會現場並沒有實時演示文心一言的各項功能,而是使用了提前錄好的demo視頻。
在百度發布文心一言的前一天,OpenAI發布了GPT-4,被冠以“作為迄今為止規模最大、功能最強大的多模態預訓練模型”。
作為同類型產品,文心一言自然免不了被拿來做對比。李彥宏認為,“ChatGPT的門檻還是很高的”,而文心一言“還是有很多不完美的地方”。
“全球大廠中,百度是第一個發布的,大家都知道微軟是直接調用OpenAI,其它的大廠現在都沒有真正發布同類型、同級別的產品。百度是第一個。”李彥宏說,文心一言這樣的大語言模型,會成為每個人必不可少的生產力工具。
自2月份百度官宣“文心一言”以來,已有超過650家企業宣布接入文心一言生態。
發布會尾聲,百度公佈了文心一言的邀請測試方案——3月16日起,首批用戶即可通過邀請測試碼,在文心一言官網體驗產品,後續將陸續開放給更多用戶。此外,百度智能雲即將面向企業客戶開放文心一言API接口調用服務。
根據百度提供的數據,發布會後一小時內,排隊申請文心一言企業版API調用服務測試的企業用戶已達3萬多家,申請產品測試網頁多次被擠爆,百度智能雲官網流量飆升百倍。
但資本市場對此卻有不同的表現。在文心一言發布的同時,百度股價盤中一度大跌10%。
不完美”小孩”
發布會現場,李彥宏展示了文心一言在文學創作、商業文案創作、數理推算、中文理解和多模態生成等五個使用場景方面的表現。
文學創作場景中,文心一言根據對話問題將科幻小說《三體》的核心內容進行了總結,並提出了五個續寫《三體》的建議角度;在商業文案創作場景中,文心一言完成了給公司起名、寫Slogan、寫新聞稿的創作任務;面對“雞兔同籠”這類涉及推理等相對複雜的任務,文心一言也給出了正確解題思路及答案。
作為紮根於中國市場的大語言模型,文心一言在中文語言和中國文化上有更好的表現。現場展示中,文心一言正確解釋了成語“洛陽紙貴”的含義、“洛陽紙貴”對應的經濟學理論,還用“洛陽紙貴”四個字創作了一首藏頭詩。
不過,李彥宏也承認,文心一言對英文語種、代碼場景的訓練還不夠多,表現還不夠好。“接下來我們還要加緊訓練,不斷完善這些能力。”
在多模態生成能力上,文心一言沒有落後於GPT-4。
現場,李彥宏展示了文心一言生成文本、圖片、音頻和視頻的能力。文心一言不僅能夠生成四川話等方言語音,還能通過一段文字自動生成視頻。
不過,視頻生成能力因成本較高,現階段還未對所有用戶開放,未來會逐步接入。
“多模態是生成式AI一個明確的發展趨勢。”李彥宏稱,未來,隨著百度多模態統一大模型的能力增強,文心一言的多模態生成能力也會不斷提升。
儘管從某種程度上,文心一言具有了對人類意圖的理解能力,回答的準確性、邏輯性、流暢性也還算令人滿意。但整體而言,這類大語言模型還遠未到發展完善的階段。
李彥宏說:“它們有時候會有很驚豔的表現,但不少場景下,細究起來還有明顯的bug,進步空間很大。”
雖然多次提到產品還不完美,但百度仍將自己定位為:全球大廠中第一個做出對標ChatGPT產品的企業。
在李彥宏給出的論據中,百度獨具的四層技術棧優勢佔據重要地位。
人類進入人工智能時代,IT技術的技術棧發生了根本性變化,從過去三層到“芯片-框架-模型-應用”四層。
“而當前,百度是全球為數不多、在這四層進行全棧佈局的人工智能公司。從高端芯片崑崙芯,到飛槳深度學習框架,再到文心預訓練大模型,到搜索、智能雲、自動駕駛、小度等應用,各個層面都有領先業界的自研技術。”李彥宏表示。
在他看來,百度AI全棧佈局的優勢在於,可以在技術棧的四層架構中實現端到端優化,大幅提升效率。尤其是框架層和模型層之間,有很強的協同作用,可以幫助構建更高效的模型,並顯著降低成本。
“無論是哪家公司,都不可能靠突擊幾個月就能做出這樣的大語言模型。深度學習、自然語言處理,需要多年的堅持和積累,沒法速成。”李彥宏說。
據全天候科技了解,大約在一個多月前,百度對外釋放即將發布文心一言之時,在其內部已成立了相關“項目組”。由CTO王海峰帶隊,李彥宏深度參與,並從多個業務線進行了人員和資源調配。
該項目組在內部被評價為“相當神秘”,未到最後一刻,甚至內部員工也無法得知文心一言的具體進展。
但對於今天的發布,李彥宏依然認為文心一言是一個“不完美小孩”,“之後,文心一言將建立起真實用戶反饋、開發者調用和模型迭代之間的飛輪,效果會迅速提升,給你’士別三日,當刮目相看’的驚喜。”
對標ChatGPT?
趕在百度發布文心一言的前一天,OpenAI發布了GPT-4,令AI達到了“歷史上前所未有的新高度”。
相較前一代,GPT-4是一個超大的多模態模型,可接受的文字輸入長度增加到3.2萬個token(大約2.4萬單詞)。同時,它可以接受圖像輸入並理解圖像內容。
升級之後,GPT-4在多項基准考試中表現出的水平和人類相當甚至更高。比如:在美國律師資格考試Uniform Bar Exam、法學院入學考試LSAT、“美國高考”SAT數學部分和證據性閱讀與寫作部分的考試中,它的得分高於88%的應試者。
不過,GPT-4也提高了使用門檻,目前還沒有免費版本,其訪問權限僅面向ChatGPT Plus的付費訂閱用戶及企業和開發者開放。而且,目前GPT-4每4小時只能回答100個問題。
不過,隨著GPT-4能力的增強和更穩定不易出錯的性能,也為此後落地商業化提供了更多的可能性。
在眾多國內佈局生成式對話產品的公司中,百度被認為是最有希望與OpenAI媲美的一家。文心一言是否夠得上與ChatGPT一戰?
李彥宏在發布會上的表現稱得上謙遜:ChatGPT的門檻還是很高的。文心一言仍算不上完美。
根據發布會傳遞的信息,從功能角度出發,二者均具備文學創作、數理推算、語義理解、多模態生成等能力。不過,GPT-4之前宣傳的圖片輸入生成文本仍未向公眾開放,生成圖片及視頻能力也僅僅停留在展示頁面。而文心一言可生成圖片及視頻內容。
一位AIGC領域創業者對全天候科技說:“文心一言不需要碾壓ChatGPT,如果滿分是100分,百度的文心一言只要能做到超過及格線,就很不錯了。”
在這位創業者看來,AIGC太重要了,無論國內做得如何,都得先推出一個產品。“就像搜索引擎,國外有Google,國內就得有百度。”
李彥宏預測,大語言模型將帶來三大產業機會:第一類是新型雲計算公司,其主流商業模式從IaaS變為MaaS;第二類是進行行業模型精調的公司;第三類是基於大模型底座進行應用開發的公司,即應用服務提供商。
即便如此,百度仍然未提及關於文心一言可行的、清晰的商業模式及變現方式。然而從可能落地的商業化場景看,OpenAI已經有明確的商業化模式和變現路徑。
“我們當然希望文心一言能更好,因為任何東西得有競爭,價格才能打下來。我們公司現在調用的是OpenAI的接口,調用頻率還蠻高的。現在我要給OpenAI這筆錢,是因為我沒得選。”前述AIGC領域創業者表示。