文心一言來了ChatGPT的壓力李彥宏接住了嗎

2023-03-17 Comments 0 Comment

“十月懷胎，一朝分娩。”研發近5年，提前一個月宣傳造勢，備受關注的百度文心一言終於揭開神秘面紗。3月16日，百度基於文心大模型技術打造的生成式對話產品——文心一言正式亮相。據百度創始人、董事長兼CEO李彥宏介紹，文心一言在文學創作、商業文案創作、數理推算、中文理解、多模態生成等方面有突出能力。

作為國內少有擁有大模型技術的企業，百度從2019年開始進行大模型探索，打造文心大模型家族，包含PLATO、ERNIE 3.0等多個NLP大模型，其中PLATO主打對話交互。從技術出發，文心過往在NLP模型上的實踐，成為百度打造“文心一言”的基礎。

“從這個意義上說，文心一言的發布只是我們過去多年努力的自然延續。”李彥宏表示。

為什麼要在此時發布文心一言？百度真的ready了嗎？針對這個高頻問題，李彥宏回答：“因為市場需求。”

“我自己在內測過程中體驗到，（文心一言的）能力確實談不上完美。”李彥宏坦誠，但是包括搜索、智能雲、自動駕駛和小度在內的百度各個產品線都在等著使用這項技術。尤為重要的是，百度的客戶也在等著這項技術的發布。

在半個小時的介紹裡，李彥宏介紹了文心一言的實用功能。不過因為現場打字不方便，發布會現場並沒有實時演示文心一言的各項功能，而是使用了提前錄好的demo視頻。

在百度發布文心一言的前一天，OpenAI發布了GPT-4，被冠以“作為迄今為止規模最大、功能最強大的多模態預訓練模型”。

作為同類型產品，文心一言自然免不了被拿來做對比。李彥宏認為，“ChatGPT的門檻還是很高的”，而文心一言“還是有很多不完美的地方”。

“全球大廠中，百度是第一個發布的，大家都知道微軟是直接調用OpenAI，其它的大廠現在都沒有真正發布同類型、同級別的產品。百度是第一個。”李彥宏說，文心一言這樣的大語言模型，會成為每個人必不可少的生產力工具。

自2月份百度官宣“文心一言”以來，已有超過650家企業宣布接入文心一言生態。

發布會尾聲，百度公佈了文心一言的邀請測試方案——3月16日起，首批用戶即可通過邀請測試碼，在文心一言官網體驗產品，後續將陸續開放給更多用戶。此外，百度智能雲即將面向企業客戶開放文心一言API接口調用服務。

根據百度提供的數據，發布會後一小時內，排隊申請文心一言企業版API調用服務測試的企業用戶已達3萬多家，申請產品測試網頁多次被擠爆，百度智能雲官網流量飆升百倍。

但資本市場對此卻有不同的表現。在文心一言發布的同時，百度股價盤中一度大跌10%。

不完美”小孩”

發布會現場，李彥宏展示了文心一言在文學創作、商業文案創作、數理推算、中文理解和多模態生成等五個使用場景方面的表現。

文學創作場景中，文心一言根據對話問題將科幻小說《三體》的核心內容進行了總結，並提出了五個續寫《三體》的建議角度；在商業文案創作場景中，文心一言完成了給公司起名、寫Slogan、寫新聞稿的創作任務；面對“雞兔同籠”這類涉及推理等相對複雜的任務，文心一言也給出了正確解題思路及答案。

作為紮根於中國市場的大語言模型，文心一言在中文語言和中國文化上有更好的表現。現場展示中，文心一言正確解釋了成語“洛陽紙貴”的含義、“洛陽紙貴”對應的經濟學理論，還用“洛陽紙貴”四個字創作了一首藏頭詩。

不過，李彥宏也承認，文心一言對英文語種、代碼場景的訓練還不夠多，表現還不夠好。“接下來我們還要加緊訓練，不斷完善這些能力。”

在多模態生成能力上，文心一言沒有落後於GPT-4。

現場，李彥宏展示了文心一言生成文本、圖片、音頻和視頻的能力。文心一言不僅能夠生成四川話等方言語音，還能通過一段文字自動生成視頻。

不過，視頻生成能力因成本較高，現階段還未對所有用戶開放，未來會逐步接入。

“多模態是生成式AI一個明確的發展趨勢。”李彥宏稱，未來，隨著百度多模態統一大模型的能力增強，文心一言的多模態生成能力也會不斷提升。

儘管從某種程度上，文心一言具有了對人類意圖的理解能力，回答的準確性、邏輯性、流暢性也還算令人滿意。但整體而言，這類大語言模型還遠未到發展完善的階段。

李彥宏說：“它們有時候會有很驚豔的表現，但不少場景下，細究起來還有明顯的bug，進步空間很大。”

雖然多次提到產品還不完美，但百度仍將自己定位為：全球大廠中第一個做出對標ChatGPT產品的企業。

在李彥宏給出的論據中，百度獨具的四層技術棧優勢佔據重要地位。

人類進入人工智能時代，IT技術的技術棧發生了根本性變化，從過去三層到“芯片-框架-模型-應用”四層。

“而當前，百度是全球為數不多、在這四層進行全棧佈局的人工智能公司。從高端芯片崑崙芯，到飛槳深度學習框架，再到文心預訓練大模型，到搜索、智能雲、自動駕駛、小度等應用，各個層面都有領先業界的自研技術。”李彥宏表示。

在他看來，百度AI全棧佈局的優勢在於，可以在技術棧的四層架構中實現端到端優化，大幅提升效率。尤其是框架層和模型層之間，有很強的協同作用，可以幫助構建更高效的模型，並顯著降低成本。

“無論是哪家公司，都不可能靠突擊幾個月就能做出這樣的大語言模型。深度學習、自然語言處理，需要多年的堅持和積累，沒法速成。”李彥宏說。

據全天候科技了解，大約在一個多月前，百度對外釋放即將發布文心一言之時，在其內部已成立了相關“項目組”。由CTO王海峰帶隊，李彥宏深度參與，並從多個業務線進行了人員和資源調配。

該項目組在內部被評價為“相當神秘”，未到最後一刻，甚至內部員工也無法得知文心一言的具體進展。

但對於今天的發布，李彥宏依然認為文心一言是一個“不完美小孩”，“之後，文心一言將建立起真實用戶反饋、開發者調用和模型迭代之間的飛輪，效果會迅速提升，給你’士別三日，當刮目相看’的驚喜。”

對標ChatGPT？

趕在百度發布文心一言的前一天，OpenAI發布了GPT-4，令AI達到了“歷史上前所未有的新高度”。

相較前一代，GPT-4是一個超大的多模態模型，可接受的文字輸入長度增加到3.2萬個token（大約2.4萬單詞）。同時，它可以接受圖像輸入並理解圖像內容。

升級之後，GPT-4在多項基准考試中表現出的水平和人類相當甚至更高。比如：在美國律師資格考試Uniform Bar Exam、法學院入學考試LSAT、“美國高考”SAT數學部分和證據性閱讀與寫作部分的考試中，它的得分高於88%的應試者。

不過，GPT-4也提高了使用門檻，目前還沒有免費版本，其訪問權限僅面向ChatGPT Plus的付費訂閱用戶及企業和開發者開放。而且，目前GPT-4每4小時只能回答100個問題。

不過，隨著GPT-4能力的增強和更穩定不易出錯的性能，也為此後落地商業化提供了更多的可能性。

在眾多國內佈局生成式對話產品的公司中，百度被認為是最有希望與OpenAI媲美的一家。文心一言是否夠得上與ChatGPT一戰？

李彥宏在發布會上的表現稱得上謙遜：ChatGPT的門檻還是很高的。文心一言仍算不上完美。

根據發布會傳遞的信息，從功能角度出發，二者均具備文學創作、數理推算、語義理解、多模態生成等能力。不過，GPT-4之前宣傳的圖片輸入生成文本仍未向公眾開放，生成圖片及視頻能力也僅僅停留在展示頁面。而文心一言可生成圖片及視頻內容。

一位AIGC領域創業者對全天候科技說：“文心一言不需要碾壓ChatGPT，如果滿分是100分，百度的文心一言只要能做到超過及格線，就很不錯了。”

在這位創業者看來，AIGC太重要了，無論國內做得如何，都得先推出一個產品。“就像搜索引擎，國外有Google，國內就得有百度。”

李彥宏預測，大語言模型將帶來三大產業機會：第一類是新型雲計算公司，其主流商業模式從IaaS變為MaaS；第二類是進行行業模型精調的公司；第三類是基於大模型底座進行應用開發的公司，即應用服務提供商。

即便如此，百度仍然未提及關於文心一言可行的、清晰的商業模式及變現方式。然而從可能落地的商業化場景看，OpenAI已經有明確的商業化模式和變現路徑。

“我們當然希望文心一言能更好，因為任何東西得有競爭，價格才能打下來。我們公司現在調用的是OpenAI的接口，調用頻率還蠻高的。現在我要給OpenAI這筆錢，是因為我沒得選。”前述AIGC領域創業者表示。

一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

WONGCW 網誌

記錄生活經驗與點滴

文心一言來了ChatGPT的壓力李彥宏接住了嗎

2023-03-17 Comments 0 Comment

相關

發表迴響取消回覆

分享此文：

相關

發表迴響取消回覆