MIT研究人員利用人工智慧將倉庫改造成高效樞紐
麻省理工學院的一組研究人員利用人工智慧來緩解交通擁堵,他們將這一領域的想法應用於解決倉庫中多個機器人的問題。透過將難以解決的問題分解成更小的區塊,一種深度學習技術確定了倉庫中疏導流量的最佳區域。
在一個巨大的機器人倉庫裡,數百個機器人在地面上來回穿梭,抓取物品並交付給人類工人包裝和運輸。這種倉庫正日益成為從電子商務到汽車生產等許多行業供應鏈的一部分。
然而,要讓800 個機器人有效率地往返目的地,同時又要防止它們相互碰撞,並非易事。這個問題非常複雜,即使是最好的路徑搜尋演算法,也很難跟上電子商務或製造業的快速發展。
人工智慧驅動的高效解決方案
從某種意義上說,這些機器人就像是試圖在擁擠的市中心穿梭的汽車。因此,一群利用人工智慧緩解交通擁堵的麻省理工學院研究人員運用了這一領域的理念來解決這個問題。
他們建立了一個深度學習模型,對倉庫的重要資訊(包括機器人、計畫路徑、任務和障礙物)進行編碼,並利用這些資訊預測倉庫的最佳疏導區域,以提高整體效率。
他們的技術將倉庫中的機器人分成若干組,因此這些較小的機器人可以用協調機器人的傳統演算法更快地消除擁塞。最終,與強隨機搜尋法相比,他們的方法疏導機器人的速度快了近四倍。
除了簡化倉庫作業,這種深度學習方法還可用於其他複雜的規劃任務,例如電腦晶片設計或大型建築的管道佈線。
尖端的神經網路架構
“我們設計了一種新的神經網路架構,它實際上適用於這些倉庫這種規模和複雜程度的即時操作。它可以對數百個機器人的軌跡、出發地、目的地以及與其他機器人的關係進行編碼,而且能以一種高效的方式在各組機器人之間重複使用計算,”土木與環境工程(CEE)專業吉爾伯特-W-溫斯洛職業發展助理教授、資訊與決策系統實驗室(LIDS)和數據、系統與社會研究所(IDSS)成員凱西-吳(Cathy Wu)說。
該技術論文的資深作者Wu 和第一作者、電子工程和電腦科學專業研究生Zhongxia Yan 共同完成了這項研究。這項研究成果將在學習表徵國際會議(International Conference on Learning Representations)上發表。
機器人俄羅斯方塊
從鳥瞰圖上看,機器人電子商務倉庫的地面有點像快節奏的”俄羅斯方塊”遊戲。
當顧客下訂單時,機器人會前往倉庫的某一區域,抓起放置所需物品的貨架,然後將其交給人類操作員,由其揀選和包裝物品。數百個機器人同時進行這項工作,如果兩個機器人在穿越巨大的倉庫時發生路徑衝突,就可能會撞車。
傳統的搜尋演算法可以避免潛在的碰撞,方法是保持一個機器人的運行軌跡,並為另一個機器人重新規劃軌跡。但由於機器人數量眾多,可能發生碰撞,問題很快就會呈指數級增長。
「由於倉庫是在線上運行的,機器人大約每100 毫秒重新掃描一次。也就是說,每秒鐘,機器人要重新掃描10 次。因此,這些操作必須非常快速,」Wu 說。
由於在重新規劃過程中時間非常關鍵,麻省理工學院的研究人員利用機器學習將重新規劃的重點放在最有可能減少機器人總行駛時間的擁擠區域。
Wu 和Yan 建立的神經網路架構可同時考慮較小的機器人群群。例如,在一個擁有800 個機器人的倉庫中,網路可能會將倉庫地面切割成更小的群組,每組包含40 個機器人。
然後,如果使用基於搜尋的求解器來協調該組機器人的軌跡,它會預測哪一組最有可能改進整體解決方案。整個演算法是一個迭代過程,先用神經網路選出最有希望的機器人組,再用基於搜尋的求解器解散機器人組,然後用神經網路選出下一個最有希望的機器人組,依此類推。
簡化複雜系統
神經網路能有效推理機器人群,因為它能捕捉到單一機器人之間存在的複雜關係。例如,即使一個機器人一開始離另一個機器人很遠,但它們在行進過程中的路徑仍有可能交叉。
此技術還能簡化計算,只需對約束條件進行一次編碼,而無需對每個子問題重複編碼。例如,在一個擁有800 個機器人的倉庫中,要消除一組40 個機器人的擁堵,就需要將其他760 個機器人作為約束條件。其他方法則需要在每次迭代中對每組所有800 個機器人推理一次。相反,研究人員的方法只需要在每次迭代中對所有小組的800 個機器人進行一次推理。
她補充說:”倉庫是一個大的環境,因此這些機器人群組中的很多都會在更大的問題上有一些共同點。我們設計的架構就是為了利用這些共同的信息。”
研究人員在幾個模擬環境中測試了他們的技術,包括一些像倉庫一樣的環境,一些帶有隨機障礙物的環境,甚至還有模擬建築物內部的迷宮設置。透過辨識出更有效的疏導群組,他們基於學習的方法疏導倉庫的速度比強大的、非基於學習的方法快四倍。即使考慮到運行神經網路的額外計算開銷,他們的方法解決問題的速度仍然快3.5 倍。
未來方向與同業認可
未來,研究人員希望從他們的神經模型中獲得簡單、基於規則的見解,因為神經網路的決策可能不透明,難以解讀。更簡單、基於規則的方法也更容易在實際機器人倉庫環境中實施和維護。
“這種方法基於一種新穎的架構,在這種架構中,卷積和注意力機制能夠有效地相互作用。令人印象深刻的是,它能夠考慮到所構建路徑的時空成分,而無需針對具體問題進行特徵工程。結果非常出色。”康奈爾理工學院安德魯-H.和安-R.-蒂施教授Andrea Lodi 說:”我們不僅能在求解質量和速度方面改進最先進的大型鄰域搜尋方法,而且該模型還能很好地推廣到未見過的案例中。”
編譯來源:ScitechDaily