開源AI機器人完勝大理石迷宮技能遊戲甚至還會作弊
一個簡單的人工智慧控制機器人在數小時內就完全掌握了大理石迷宮的謎題,看著CyberRunner 機器人從搖搖晃晃的初學者迅速成長為流暢老練的專家,真是令人嘆為觀止–和人類一樣,它甚至還能找到作弊的方法。這令人信服地證明了人工智慧掌握複雜現實世界技能的能力。
就在我們看到人工智慧駕駛的無人機在一場電路比賽中絕對壓倒人類世界冠軍幾個月後,蘇黎世聯邦理工學院的研究人員又揭示了人工智慧驚人的學習能力在現實世界中的物理演示。
這項研究的目標是:滾動大理石迷宮遊戲。你一定玩過這種遊戲;當你在木製迷宮中滾動大理石時,一對旋鈕可以讓你傾斜棋盤,試圖避免掉進洞裡。
CyberRunner 人工智慧機器人配備了兩個電動馬達來驅動旋鈕,一個攝像頭來觀察木板,還有一個運行”深度強化學習系統”的人工智能大腦,每秒能發送多達55 條控制指令。它被告知了練習的目標,並自行進行實驗。
當然,早期的嘗試是生澀和搖擺不定的,但經過6.06 小時的訓練後,人工智能打破了”極其熟練的人類選手”的最快記錄,比之前的記錄高出6%,表現出了一種流暢、練習有素的自信,令人目不暇給:
值得注意的是,人工智慧很快就發現了它可以用來切斷迷宮整個部分的捷徑,並以更快的速度前進–研究人員不得不進入迷宮,並特別告訴它不要作弊。
CyberRunner團隊表示,他們很快就會將整個專案開源,讓任何人都可以在家中建立和訓練它。
「我們相信,這是真實世界機器學習和人工智慧研究的理想試驗平台,」拉斐爾-安德烈教授在一份新聞稿中說。”在CyberRunner 出現之前,只有擁有巨額預算和定制實驗基礎設施的機構才能在這一領域開展研究。現在,只需花費不到200 美元,任何人都可以從事應用於物理世界的尖端人工智能研究。此外,一旦成千上萬的CyberRunners 出現在現實世界中,就有可能進行大規模實驗,在全球範圍內進行並行學習。公民科學的終極目標!”
這只是一個可愛的小遊戲,但卻展現了更大的意義。2023 年絕對是人工智慧系統的分水嶺和臨界點,而它們與機器人世界的融合也推動了具身世界同樣令人震驚的進步。看著這些機器即時學習,無論是從零開始還是透過觀察他人,都能變得越來越能幹,越來越快地掌握新技能,這感覺就像一種可怕的特權。
2023 年即將過去,一場影響深遠的科技革命似乎已成定局。人類被淘汰的種子已經播下,現在就看人類智慧和人類勞動的價值會以多快的速度趨近於零。我不覺得這離我們還有20 年的時間,即使是以這種瘋狂加速的速度發展10 年也顯得太漫長了。
這是一個多麼不尋常的時代。