中國AI期刊論文被引量世界第一都在研究什麼?
編者按:人工智能正像電力一般賦能各個產業,深刻地改變人類社會。中國正處於全球人工智能發展第三次浪潮的時代潮頭,在2021年世界人工智能大會於上海召開之際,澎湃新聞與上海人工智能研究院聯合推出《算法周刊》,將聚焦中國人工智能高地建設,並持續關注全球AI最前沿。
在人工智能(AI)研究上,中國是當前熱度最高的國家。
今年清華大學人工智能研究院、北京智源人工智能研究院等聯合發布的《人工智能全球2000位最具影響力學者報告》指出,美國早期有領先優勢,但近年來中國的研究熱度已經赶超美國。
人工智能的研究論文就反映出了這種熱度。
中國AI 期刊論文被引量首超美國
2020年,中國AI 期刊論文全球引用量首次超過了美國。
這是美國斯坦福大學《2021年人工智能指數報告》(以下簡稱“報告”)高亮的9大發現之一。報告指出,在期刊論文總數超過美國的若干年後,中國終於在被引量上也拿下了世界第一。在學術研究界,論文引用量是衡量一篇科研文獻被其他機構學者認可的數據。
但報告也指出,在會議論文(conference paper)的被引量上,美國還是保持著領先地位。和期刊論文相比,
會議論文相對更短,發表得更快,注重介紹研究的創新思想
,同時也更容易被同行引用。
2020年,中國研究機構比美國少發了近1400篇會議論文,但被引量相差了一萬多次。
中國優秀AI論文,研究基礎和技術的偏多
人工智能技術,指的是用計算機程序使人造機器呈現類人類智能的技術。按照產業,這些專業術語分為三類:基礎層,指算法、軟件和平台,以及支撐運算的硬件;技術層,指針對目標而研發的具體技術,比如語音識別圖像識別;應用層,指進入市場的落地產品,比如無人駕駛、推薦引擎等。
那我國的AI論文,大多在研究哪些方面?澎湃新聞(www.thepaper.cn)選取39所中國頂級人工智能研究院校2017到2021年被IEEE收錄的9903篇會議論文作為樣本,計算了這些論文的高頻關鍵詞。
下圖每個點是一個關鍵詞。一個點的連線越多,表示這個詞和越多其他詞共同出現在了論文中。點與點之間的連線越粗,則表示這兩個關鍵詞的共現頻率越高。
圖中共50個高頻關鍵詞。其中,出現最多的是基礎層術語,共23個,比如機器學習、卷積神經網絡。第二則是技術層術語,有16個,包括自然語言學習、計算機視覺等等。這就表示,我國頂級院校的AI 研究,集中在這兩個層面的偏多。