斯坦福2022AI指數報告出爐 北郵、清華、位元組表現搶眼
近日,斯坦福大學發佈了《人工智慧指數2022》(Artificial Intelligence Index Report 2022)報告,這是斯坦福大學連續第五年發佈該類型的報告,該報告旨在成為世界上最可信、最權威的AI數據和洞察來源。 今年的報告分為五個章節,包括最新的研究進展、技術、AI倫理、投資與教育、AI政策。
本期的智慧內參,我們帶來《人工智慧指數2022》的要點翻譯總結,從權威機構角度分析全球人工智慧行業的最新進展。
一、研究進展
研發是推動人工智慧 (AI) 快速發展的不可或缺的力量。 每年學術界、工業界、政府和⺠間組織通過大量論文、期刊文章、人工智慧會議等為AI研發做出貢獻。 從 2010 年到 2021 年,人工智慧出版物的總數翻了一番,從 2010 年的 162,444 篇增長到 2021 年的 334,497 篇。
▲2010-21年全球 AI 出版物數量
其中,2021年這些出版物的51.5% 是期刊文章,21.5% 是會議論文,17.0% 來自存儲庫。 細分領域方面,自2015 年以來,模式識別和機器學習方面的出版物增加了一倍多。 其他受深度學習影響較大的領域,如計算機視覺、數據挖掘和自然語言處理,增幅較小。
▲2010-21年按研究領域的 AI 出版物數量
按論文來源的部門來分,教育機構仍是AI研究的主力,而美國和歐盟的公司參與研發的程度也很高。 值得一提的是,中國是唯一一個教育比重不斷上升的國家(地區)。 而且,迄今為止,過去12年中美國和中國之間的合作數量最多,自2010年以來增加了五倍。 其次是英國與美國和中國之間的合作,增加了自 2010 年以來增長了 3 倍多。 2021 年,美國和中國之間的合作數量是英國和中國之間的 2.7 倍。
▲2010-21年按行業分列的AI出版物(佔總數的百分比)
▲美國和中國在人工智慧出版物方面的合作,2010-21
按地區來看,2021年,東亞和太平洋地區以42.9%的期刊發文量領先,其次是歐洲和中亞(22.7%)和北美(15.6%)。 此外,南亞、中東和北非的增⻓最為顯著,在過去 12 年中,它們的 AI 期刊出版物數量分別增 長了約 12 倍和 7 倍。
▲2010-21 年按地區分列的 AI 期刊出版物(佔世界總數的百分比)
按地理區域來分,中國保持領先地位,2021 年為 31.0%,其次是歐盟和英國,為 19.1%,美國為 13.7%。
▲2010-21 年按地理區域劃分的 AI 期刊出版物(佔世界總數的百分比)
在論文的被引次數上,中國的份額逐漸增加,而歐盟以及英國和美國的被引次數減少。 這三個地理區域的總引用量佔全球總引用量的 66% 以上。
▲2010-21 年按地理區域劃分的 AI 期刊引用次數(佔世界總數的百分比)
在專利方面,2021年提交的專利數量是 2015 年的 30 倍以上,複合年增⻓率為 76.9%。 中國的專利數已經佔了世界一半,並獲得約 6% 的授權。
▲AI 專利申請數量,2010\U201221 年
▲2010-21年按地理區域劃分的人工智慧專利申請(佔世界總數的百分比)
AI開源軟體庫方面,TensorFlow 仍最受歡迎的,GitHub 累計星數約為 161,000,比2020 年略有增加,遠高於排名第二的OpenCV。
▲AI LIBRARY 的 GITHUB STARS 數量(超過 40K STARS),2014\U201221
二、技術表現
今年技術性能這一章節對AI各個子領域的技術進步進行了比以往更多的分析,包括計算機視覺、語言、強化學習等技術的趨勢。
1、計算機視覺
圖像分類:圖像分類是指機器對圖像中看到的內容進行分類的能力。 過去十年圖像識別系統技術取得了巨大的進步,特別是研究人員已經採用了更多的機器學習技術。 截至 2021 年底,頂級圖像分類系統在 Top-1 準確度上每10 次分類嘗試平均產生 1 個錯誤,相比之下, 2012 年底 每 10 次嘗試平均 4 次 錯誤 。 2021年,最頂級的預訓練系統是 CoAtNets,由谷歌研究人員製作。
圖像生成:圖像生成是生成與真實圖像無法區分的圖像的任務。 如下圖所示,2021年,AI已經可以合成非常難以區分的人臉照片。
▲GAN 在人臉生成方面的進展
深度偽造檢測:許多人工智慧系統現在可以生成與真實圖像無法區分的假圖像,例如通過換臉來實現所謂的”深度偽造”。 近幾年,研究人員一直試圖通過製作更強大的深度偽造檢測演算法來跟上偽造步伐。 FaceForensics++ 是一個深度偽造檢測基準測試,。 2012年, 最強的AI技術可以在四個 FaceForenics++ 數據集中正確識別 69.9% 的深度偽造。 2021 年, 這個數位增加到 97.7% 。
醫學圖像分割:醫學圖像分割是指AI系統在醫學圖像中分割感興趣物件(例如器官、病變或腫瘤)的能力。 目前,AI能夠在 CVC-ClinicDB 數據集上以 94.2% 的正確率識別結腸鏡檢查息肉,相比2015年提高了 11.9 個百分點。
人臉檢測:雖然目前的一些面部識別演算法的成功率接近100%,但因為疫情的影響,戴口罩面部識別成為了AI技術新的挑戰。 2021年,北京郵電大學的研究人員發佈 了6000張蒙面人臉的人臉識別數據集,以應對大規模戴口罩帶來的新識別挑戰。 研究人員在各種面部識別數據集上運行了一系列現有的最先進的檢測演算法,結果表明,與未蒙面相比,頂級方法在蒙面面孔上的表現要差 5 到 16 個百分點。
▲北郵MLFW資料庫
▲最新AI MLFW資料庫檢測準確性
2、語言理解
目前的英文語言理解用的最新基準測試為SuperGLUE,於2019年5月發佈。 在測試中,AI系統在八種不同的任務上進行測試。 截至目前最先進的系統為SS-MoE模型,在SuperGLUE上的得分為91.0,已經超過了人類。
▲SuperGLUE得分
在另一項斯坦福問答數據集(SQuAD)中,AI最新得分為95.7和93.2,也超過了人類的表現。
▲SQUAD 1.1 和 SQUAD 2.0得分
但是,對於需要邏輯推理的問題上AI貌似仍力不從心。 在由新加坡國立大學科學家創建的數據集ReClor中,困難問題的最好表現只有69.3%的準確率。
▲需要邏輯推理的閱讀理解數據集(RECLOR):準確性
自然語言推理方面,目前斯坦福自然語言推理 (SNLI) 數據集表現最好的模型是 FacebookAIUSA 的 EFL,其在 2021 年 4 月的得分為 93.1%。
3、強化學習
強化學習的測試標準是2013年推出的Arcade Learning Environment(Atari-57),2019 年末,DeepMind 的 MuZero 演算法在 Atari-57 上 實現了最先進的性能。 到了2021年,來自清華大學和位元組跳動的研究人員開發出了 GDI-H3 模型,該模型在 Atari 上的性能超過了MuZero -57的近一倍。
▲ATARI-57得分
4、機器人
調查結果顯示在過去七年中,機器人手臂的價格有明顯的下降趨勢。 2017年,價格中位數機器人手臂的價格是42,000美元。 從那時起,價格已經下降了 46.2%,大致達到了2021年的22,600美元。
▲2017-21年機器人手臂的平均價格
並且,現在機器人相關的AI技術的普及率也出現了大幅提升。
▲機器人教授使用的人工智慧技能比例
三、AI投資和教育1、工作
紐西蘭的人工智慧招聘增⻓最快——2021 年是 2016 年的 2.42 倍,其次 是香港(1.56)、愛爾蘭(1.28)、盧森堡(1.26)和瑞典(1.24)。 此外,從 2020 年到 2021 年,許多國家或地 區的 AI 招聘增⻓率有所下降
▲2021年按地理區域劃分的相對人工智慧招聘指數
在 2021 年所有職位發佈中,人工智慧職 位發佈的份額最大的是機器學習技能(佔所有職位發佈的 0.6%),其次是人工智慧(0.33%)、神經網路(0.16%)和自然語言處理(0.13%) )。
美國資訊部⻔的所有職位發佈中有 3.30%與 AI 相關,其次是科學和技術服務(佔所有清單的2.59%)、製造(2.02%)和金融和保險(1.81%)。
▲2021 年按行業分列的美國 AI 職位發佈(佔所有職位發佈的百分比)
AI的滲透率方面,印度在人工智慧技能滲透率方面領先世界——2015年至 2021 年全球平均水準的 3.09 倍——緊隨其後的是美國(2.24)和德國(1.7)。 之後是中國(1.56)、以色列(1.52)和加拿大(1.41)。
▲2015-21年按地理區域劃分的相對AI技能滲透率
2、投資
目前,私人投資仍是AI投融資的主流,其次是併購、公開發行和少數股權。 2021年,全球對人工智慧的私人投資總額約為935億美元,是2020年私人投資總額的兩倍多。
▲按投資活動劃分的全球企業對人工智慧的投資,2013-21 年
在披露融資金額的公司中,與 2020 年相比,2021 年 1 億 美元至 5 億美元的 AI 融資輪數增加了一倍多,而 5000 萬 美元至 1 億美元的融資輪數也增加了一倍多。
▲2013-21年人工智慧領域的私人投資
2021年,美國在獲得資助的 AI 公司的總體私人投資方面居世界首位,約為 529 億美元,是排名第二的國家中國(172 億美元)的三倍。 排在第三位的是英國(46.5億美元),其次是以色列(24 億美元)和德國
(19.8 億美元)。 2021年,美國有299 家新投資的AI公司,其次是中國,有119家,英國有49家,以色列有28家。
▲2021年按地理區域劃分的 AI 私人投資
行業領域方面,2021 年人工智慧領域最大的私人投資是數據管理、處理和雲(約 122 億美元)。 在過去五年中,醫療和保健 類別獲得了全球最大的私人投資(289 億美元);其次是 數據管理、處理和雲計算(269億美元);金融科技(249億美元);和零售(219.5億美元)。
3、教育
在北美,大多數與人工智慧相關的課程都是作為本科階段CS 課程的一部分提供的。 從 2010 年到 2020 年,北美博士機構的新 CS 本科畢業生 數量增⻓了 3.5 倍。 2020年,超過31,000名本科生完成了計算機科學學位,比2019年增加了11.60%。 並且,2020 年每 5 名 CS 學生中就有 1 名獲得了 AI/ML 博士學位。
▲2010-20 年北美博士機構的新 CS 本科生人數
▲2020 年按專業劃分的美國新 CS 博士(佔總數的百分比)
四、AI政策
從 2016 年到 2021 年, 共有 25 個國家通過了 55 項與人工智慧相關的法案,其中美國以 13 項法案佔據榜首,其次是俄羅斯、比利時、西班牙和英國。 2021年頒布的法律數量上,西班牙、英國和美國領先,各超過三項。
▲2021 年與 AI 相關的法案數量國家排名
美國2015年只有一項聯邦法案與人工智慧相關,2021年提升到了130項。
▲2016年以來典型的國家人工智慧相關立法
在 2021 財年 (FY),非國防美國政府機構共為 AI 研發支出分配了 15.3 億美元,約為 2018 財年支出的 2.7 倍。 預計2022 財年這一數位將增⻓ 8.8%,申請總額為16.7億美元。
▲美國聯邦非國防人工智慧研發預算,2018-22 財年
而美國國防部2021年在500個人工智慧研發專案中撥款92.6億美元,比2020年的86.8億美元增加6.68%。 國防部在人工智慧上的支出也是最多的,2021 年,它在與人工智慧相關的合同上花費了 11.4 億 美元,大約是第二高的部⻔衛生與公眾服務部(2.34 億美元)花費的五倍。
▲國防部前五名資金最多的專案
▲2021 年美國政府部⻔和機構在 AI 上的最高合同支出
智東西認為,雖然2021年是個多事之秋,但人工智慧的發展仍然一路高歌猛進,私人投資翻一番,新技術不斷突破都給這個行業的發展打了強心劑。 尤其值得欣慰的是,在中美國家關係日趨複雜的現在,AI行業的中美合作仍很緊密,這是人類科學技術在衝突與鬥爭大環境下的一絲慰藉。