Google Cloud 發布COVID-19 數據集可構建AI模型來對抗疫情
Google正式宣布啟動一項名為新型冠狀病毒公共數據集(COVID-19 Public Datasets)的項目,該項目將託管一個與疫情相關的公共數據資料庫,並將它們開放,以便外界自由訪問和分析。
Google 方面表示,這樣做的目的是消除障礙,並為研究人員提供快速,便捷的關鍵信息訪問途徑,而無需搜索和攜帶大型數據文件。
在這個所謂的公共數據集項目中,其數據包括約翰·霍普金斯大學系統科學與工程中心(JHU CSSE)數據集、來自世界銀行的全球健康數據和OpenStreetMap 數據,所有這些都將免費存儲在Google Cloud 上——Google 也表示將與這些數據集背後的的組織提前接觸。
按照Google 的安排,這些數據集將帶有“ COVID-19” 標籤,一個說明和幾個示例查詢,可以從Google Cloud Console Market 和BigQuery 用戶界面中進行索索,其中在BigQuery 中被標記為“freebqcovid” 。
值得一提的是,研究人員可以使用Google 的BigQuery ML 服務,該服務使用戶可以使用SQL 查詢在BigQuery(完全託管的數據倉庫)中創建和執行機器學習模型,從而在COVID-19 數據集上訓練機器學習模型。
基於這個項目的公共屬性,用戶在查詢時是完全免費的,並且查詢免費政策一直持續到直到9 月15 日。但是Google 指出,如果將任何數據集與非COVID-19 數據集結合在一起,則處理的字節將計入BigQuery Sandbox 中,每月有10GB 的存儲空間和1TB 的查詢限制——然後然後按量收費,以防止濫用。
Google BigQuery 產品經理兼GIS負責人Chad W. Jennings 和開發者倡導者Shane Glass 在博客中表示:
這些數據集的內容僅嚴格出於教育和研究目的而向公眾提供,Google Cloud小組衷心希望COVID-19公共數據集項目將能夠更好、更快地賦能研究,以阻止疾病的蔓延。
除了COVID-19公共數據集計劃,Google 也進行了許多其他對抗新型冠狀病毒的努力。
比如說,Google 向與該病毒作鬥爭的組織捐贈了8 億美元的廣告和貸款,添加了新型冠狀病毒提示Google Assistant 快捷方式,並與Microsoft 和Palantir 合作,為英國國家衛生局(National Health Service)建立了信息發布台。
另外,Google 還推出了專門的頁面和搜索門戶來整理有關COVID-19 的資源,這家科技巨頭的母公司Alphabet 也加大了灣區疾病篩查計劃的力度,
本文參考鏈接:
https://cloud.google.com/blog/products/data-analytics/free-public-datasets-for-covid19