史丹佛2024 AI報告:中國AI專利全球第一頂級AI模型主要來自美國
近日,由李飛飛共同領導的史丹佛大學以人為本人工智慧研究所(Stanford HAI)發布了《2024 年人工智慧指數報告》(Artificial Intelligence Index Report 2024)。這份長達300 多頁的報告是Stanford HAI 發布的第7 份AI Index 研究,追蹤了2023 年全球人工智慧的發展趨勢。
Stanford HAI 官方介紹道,’這是我們迄今為止最全面的報告,而且是在人工智慧對社會的影響從未如此明顯的重要時刻發布的。 ‘
Stanford HAI 研究計畫主任Vanessa Parli 表示,’我認為最令人興奮的人工智慧研究優勢是將這些大型語言模型與機器人或智慧體(agent)結合,這標誌著機器人在現實世界中更有效地工作邁出了重要一步。 ‘
附上《2024 年人工智慧指數報告》下載地址:
與往年不同,Stanford HAI 今年擴大了研究範圍,更廣泛地涵蓋了人工智慧的技術進步、公眾對該技術的看法等基本趨勢。新報告揭示了2023 年人工智慧產業的10 大主要趨勢:
1.人工智慧在某些任務上勝過人類,但並非在所有任務上
人工智慧已在多項基準測試中超越人類,包括在圖像分類、視覺推理和英語理解方面。然而,它在競賽級數學、視覺常識推理和規劃等更複雜的任務上依然落後於人類。
2.產業界持續主導人工智慧前沿研究
2023 年,產業界產生了51 個著名的機器學習模型,而學術界只貢獻了15 個。 2023 年,產學合作也產生了21 個著名模型,創下新高。此外,108 個新發布的基礎模型來自工業界,28 個來自學術界。
3.前沿模型變得更加昂貴
根據AI Index 的估算,最先進的人工智慧模型的訓練成本已經達到了前所未有的水平。
例如,OpenAI 的GPT-4 估計使用了價值7,800 萬美元的運算資源進行訓練,而Google 的Gemini Ultra 的運算成本則高達1.91 億美元。
相較之下,幾年前發布的一些最先進的模型,即原始transformer 模型(2017 年)和RoBERTa Large(2019 年),訓練成本分別約為900 美元和16 萬美元。
4.美國成為頂級人工智慧模型的主要來源國
2023 年,61 個著名的人工智慧模型源自美國的機構,超過歐盟的21 個和中國的15 個。
美國也仍然是人工智慧投資的首選之地。 2023 年,美國在人工智慧領域的私人投資總額為672 億美元,是中國的近9 倍。
然而,中國仍是美國最大的競爭對手,中國的機器人安裝量居世界首位;同樣,全球大多數人工智慧專利(61%)都來自中國。
5.嚴重缺乏對LLM 責任的可靠和標準化評估
AI Index 的最新研究顯示,負責任的人工智慧嚴重缺乏標準化。包括OpenAI、 Google 和Anthropic 在內的領先開發商主要根據不同的負責任人工智慧基準測試他們的模型。這種做法使系統地比較頂級人工智慧模型的風險和局限性的工作變得更加複雜。
6.生成式人工智慧投資激增
儘管去年人工智慧私人投資整體下降,但對生成式人工智慧的投資激增,比2022 年(約30 億美元)成長了近八倍,達到252 億美元。
生成式人工智慧領域的主要參與者,包括OpenAI、Anthropic、Hugging Face 和Inflection,都獲得了一輪可觀的融資。
7.數據顯示,人工智慧讓打工人更有生產力,工作品質更高
2023 年,多項研究評估了人工智慧對勞動力的影響,顯示人工智慧可以讓打工人更快地完成任務,並提高他們的產出品質。
這些研究還表明,人工智慧有可能縮小低技能和高技能工人之間的技能差距。還有一些研究警告說,在沒有適當監督的情況下使用人工智慧可能會起到負面作用。
8.得益於人工智慧,科學進步進一步加速
2022 年,人工智慧開始推動科學發現。然而,2023 年,與科學相關的更重要的人工智慧應用啟動——使演算法排序更有效率的AlphaDev、促進材料發現過程的GNoME、可在一分鐘內提供極其準確的10 天天氣預報的GraphCast、成功對7,100 萬種可能的錯義突變中的約89% 進行分類的AlphaMissence。
如今,人工智慧現在可以完成人類難以完成的、但對解決一些最複雜的科學問題至關重要的粗暴計算。在醫療方面,新的研究表明,醫生可以利用人工智慧更好地診斷乳癌、解讀X 光和檢測致命的癌症。
9.美國的人工智慧法規數量急劇增加
2023 年,全球立法程序中有2,175 次提及人工智慧,幾乎是前一年的兩倍。美國人工智慧相關法規的數量在過去一年大幅增加。 2023 年,與人工智慧相關的法規有25 項,而2016 年只有1 項。
光是去年,人工智慧相關法規的總數就增加了56.3%。其中一些法規包括生成式人工智慧材料的版權指南和網路安全風險管理框架。
10.人們對人工智慧的潛在影響有了更深刻的認識,同時也更焦慮
來自市場研究公司Ipsos 的一項調查顯示,在過去一年中,認為人工智慧將在未來3-5 年內極大地影響他們生活的人,比例從60%上升到66%。此外,52% 的人對人工智慧產品和服務表示焦慮,比2022 年上升了13 個百分點。
在美國,皮尤研究中心(Pew)的數據顯示,52% 的美國人表示對人工智慧的擔憂多於興奮,這一比例比2022 年的38% 有所上升。
附:來自AI Index 聯合主任Ray Perrault 的一封信
十年前,世界上最好的人工智慧系統也無法以人類的水平對影像中的物體進行分類。人工智慧在語言理解方面舉步維艱,也無法解決數學問題。如今,人工智慧系統在標準基準上的表現經常超過人類。
2023 年,人工智慧進步加速。 GPT-4、Gemini 和Claude 3 等先進模型展示出了令人印象深刻的多模態能力:它們可以生成數十種語言的流暢文本,處理音頻,甚至可以解釋備忘錄。
隨著人工智慧的進步,它也越來越多地進入我們的生活。公司競相打造以人工智慧為基礎的產品,一般大眾也越來越多地使用人工智慧。但是,目前的人工智慧技術仍然存在重大問題。它無法可靠地處理事實、進行複雜的推理或解釋其結論。
人工智慧面臨兩個相互關聯的未來。第一個,技術不斷改進,應用日益廣泛,對生產力和就業產生重大影響。人工智慧的用途有好有壞。第二個,人工智慧的應用受到技術限制的限制。
無論是哪一種,政府都越來越重視。政府正在積極參與,鼓勵人工智慧的發展,例如資助大學研發和激勵私人投資。政府也致力於管理潛在的不利因素,如對就業的影響、隱私問題、錯誤訊息和智慧財產權。
在技術方面,今年的AI Index 報告稱,2023 年全球發布的新大型語言模型數量比前一年翻了一番。三分之二的模型是開源的,但性能最高的模型來自擁有封閉系統的行業參與者。
Gemini Ultra 成為首個在大規模多任務語言理解(MMLU)基準上達到人類水準的LLM;自去年以來,模型在該基準上的效能表現提高了15 個百分點。此外,GPT-4 在綜合語言模型整體評估(HELM)基準上取得了令人印象深刻的0.97 平均勝率分數。
雖然全球對人工智慧的私人投資連續第二年減少,但對生成式人工智慧的投資卻急劇上升。財富500 強企業財報電話會議中提及人工智慧的次數比以往任何時候都多,而且新的研究表明,人工智慧明顯提高了打工人的生產力。
在政策制定方面,全球在立法程序中提及人工智慧的次數前所未有。美國監管機構在2023 年通過的人工智慧相關法規比以往任何時候都多。儘管如此,許多人仍對人工智慧生成深度偽造等能力表示擔憂。大眾對人工智慧有了更多的認識,研究表明,他們的反應也是焦慮的。