Google正測試乒乓球機器人i-Sim2Real 已能連續對打340次

據TechCrunch報導，Google日前正在測試一個乒乓球機器人項目。這個項目被稱為i-Sim2Real，不僅僅是關於乒乓球，而是關於建立一個機器人系統，可以與快節奏和相對不可預測的人類行為一起工作。乒乓球，具有相當嚴格的限制（相對於打籃球或板球而言）和復雜與簡單的平衡的優勢。

“Sim2Real”是描述人工智能創造過程的一種方式，其中機器學習模型被教導在虛擬環境或模擬中做什麼，然後在現實世界中應用這些知識。當需要多年的試驗和錯誤才能得出一個有效的模型時，這是很有必要的–在模擬中進行，可以在幾分鐘或幾小時內完成多年的實時訓練。

但是，在模擬中做一些事情並不總是可能的；例如，如果一個機器人需要與人互動呢？這不是那麼容易模擬的，所以你需要真實世界的數據來開始。你最終會遇到一個雞和蛋的問題：你沒有人類的數據，因為你需要它來製造人類將與之互動的機器人，並首先產生這些數據。

Google的研究人員通過簡單的開始和製造一個反饋迴路來解決這個難題。

[i-Sim2Real]使用一個簡單的人類行為模型作為近似的起點，在模擬訓練和在現實世界中部署之間交替進行。在每次迭代中，人類行為模型和政策都會得到完善。

從人類行為的近似值開始是可以的，因為機器人也只是剛剛開始學習。每場比賽都會收集到更多真實的人類數據，從而提高準確性，讓人工智能學習更多。

這種方法足夠成功，該團隊的乒乓球機器人已能夠連續對打340次。

它還能夠將球送回不同的區域，當然不是準確的數學精度，但是好到可以開始執行策略。

該團隊還嘗試了一種不同的方法，以實現更多的目標行為，比如從不同的位置將球返回到一個非常具體的地方。同樣，這並不是要創造終極乒乓球機（儘管這很可能是一個結果），而是要找到有效訓練人類互動的方法，而不是讓人們重複成千上萬次的相同動作。

WONGCW 網誌