Skip to content
WONGCW 網誌
  • 首頁
  • 論壇
  • 微博
  • 壁紙下載
  • 免費圖床
  • 視頻下載
  • 聊天室
  • SEO工具
  • 支援中心
  • 表格製作
  • More
    • 在線名片
    • 網頁搜索
    • 天氣預報
    • 二維碼生成器
  • Search Icon

WONGCW 網誌

記錄生活經驗與點滴

25分鐘訓練機器人學會6個動作伯克利開發高效機器人操縱框架

25分鐘訓練機器人學會6個動作伯克利開發高效機器人操縱框架

2021-01-03 Comments 0 Comment

這個機械臂正在完成夠、拿、移、推、點、開等6個動作。而且動作嫻熟,還不存在失誤。更令人意外的是,訓練這個機械臂,只花了短短25分鐘。即使有人為乾擾,它也能夠成功完成抓取動作。還能抓起以前沒有見過的物體形狀。

這就是來自加州大學伯克利分校的一項新研究——高效機器操作框架Framework for Efficient Robotic Manipulation(FERM),專門對機械臂進行高效率操作的算法訓練。

FERM為什麼比其他方法效率高?

目前來看,大多數針對機器人訓練的的RL算法效率都不是很好。

採用稀疏獎勵的方法訓練Dota5遊戲的人機操作,使之成為達到人類玩家的高手水平,需要花180年的遊戲時間。

訓練一個機械臂的手勢,則需要上千萬的模擬學習的樣本和兩週的訓練時間。

Sim2Real和模擬學習這兩個方法稍微好點。Sim2Real需要接受模擬訓練,再將訓練結果運用到現實事例中。

模擬學習則需要通過一系列的專業訓練示範案例和監督學習,才能得出最後的訓練策略,實驗結果非常依賴於輸入示範案例的質量。

FERM優勢在於,既沒有依靠模擬訓練轉換到現實,也不用高度依賴於輸入的示範案例的質量。

而是基於非監督性表徵學習和數據擴張技術,使用了pixel-based RL。

因此,它僅僅需要10個Demo,25分鐘的訓練時間,就可以讓機器人學會六個動作。

FERM具體怎麼訓練?

FERM採用了基於像素的強化學習(pixel-based RL)方法。

具體而言,先收集小部分演示數據,並且將這些數據存放在“回放緩衝區”上。

然後,用觀察結果結合對比損失量,來對編碼器進行預訓練。

而後,編碼器和“回放緩衝區”運用一種線下的數據來加強RL算法,對RL智能體進行訓練。

在論文中,研究人員總結了FERM主要優點:

1、高效率:FERM可以學習6種不同操作任務的最優策略,在15-50分鐘的訓練時間內完成每項任務。

2、簡單統一的框架:框架結合現有的組成部分,將無監督的預訓練和在線RL與數據擴充成一個單一高效的框架。

3、常規輕量設置:實施起來只需要一個機器人、一個GPU、兩個攝像頭、幾個演示,以及稀疏獎勵函數等等。

具體的實驗結果如何?

實驗結果

這項實驗採用像素觀察的方法執行了一系列任務。下圖的每一欄顯示了初始、中間、結果等三個狀態。只有當機器人完成任務時,才會獲得稀疏獎勵。

這個訓練算法的效率可謂很高了。具體完成時間如下圖表格所示,在30分鐘左右,它就可以讓機器人學習操作任務。而簡單的“夠”(Reach)動作,則只需要三分鐘。

實驗結果稱,它不需要很多的Demo,也不需要到大量的設備,首次完成任務的平均時間為11分鐘,並且可以在25分鐘內訓練出6個機械動作。

所以研究人員驕傲地說:

“據我們所知,FERM是第一個能在不到一小時的時間內,能通過像素點直接完成來自不同組、採用稀疏獎勵方法的機器操作任務。”

而根據相關報告,未來十年,製造業將需要460萬個崗位。許多製造商也都在轉向自動化生產,機械自動化將佔比越來越高。FERM這樣的高效訓練框架,可謂是製造業福音。

參考鏈接:

New framework can train a robotic arm on 6 grasping tasks in less than an hour

論文地址:

https://arxiv.org/abs/2012.07975

源代碼:

https://github.com/PhilipZRH/ferm

分享此文:

  • 按一下即可分享至 X(在新視窗中開啟) X
  • 按一下以分享至 Facebook(在新視窗中開啟) Facebook
  • 分享到 WhatsApp(在新視窗中開啟) WhatsApp
  • 按一下以分享到 Telegram(在新視窗中開啟) Telegram
  • 分享到 Pinterest(在新視窗中開啟) Pinterest
  • 分享到 Reddit(在新視窗中開啟) Reddit
  • 按一下即可以電子郵件傳送連結給朋友(在新視窗中開啟) 電子郵件
  • 點這裡列印(在新視窗中開啟) 列印

相關


網絡資訊

Post navigation

PREVIOUS
華為P50外形首度曝光:第一次採用居中挖孔、後置鏡頭類似Mate40
NEXT
再見Flash:與閃客、小遊戲的青春記憶告別

發表迴響取消回覆

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

More results...

Generic filters
Exact matches only
Search in title
Search in content
Search in excerpt
Filter by 分類
網站公告
Featured
限時免費
Windows 軟件下載
系統軟件
辦公軟件
圖像處理
影音媒體
網絡軟件
應用軟件
Mac 軟件下載
安卓軟件下載
網絡資訊
Mac資訊
Linux資訊
VPS資訊
NASA資訊
WordPress資訊
WeChat資訊
PHP資訊
教學資源
開源程序
網頁工具
SEO工具
醫療健康
其他資訊
Content from
Content to
2021 年 1 月
一 二 三 四 五 六 日
 123
45678910
11121314151617
18192021222324
25262728293031
« 12 月   2 月 »

分類

  • 網站公告
  • 限時免費
  • Windows 軟件下載
  • 系統軟件
  • 辦公軟件
  • 圖像處理
  • 影音媒體
  • 網絡軟件
  • 應用軟件
  • Mac 軟件下載
  • 安卓軟件下載
  • 網絡資訊
  • Mac資訊
  • Linux資訊
  • VPS資訊
  • NASA資訊
  • WordPress資訊
  • WeChat資訊
  • PHP資訊
  • 教學資源
  • 開源程序
  • 網頁工具
  • SEO工具
  • 醫療健康
  • 其他資訊

彙整

近期文章

  • 微軟裁員風暴:軟體工程崗位成重災區AI搶走程式設計師飯碗? 2025-05-15
  • 星巴克據悉已啟動出售龐大中國業務部分股份的進程 2025-05-15
  • 資料外洩後Valve向Steam用戶保證其係統沒有被入侵 2025-05-15
  • 小米盒子5系列今日開賣:299元起支援4K 2025-05-15
  • 假期3天不調休端午假期火車票即將開售 2025-05-15
  • 網友在馬耳他偶遇劉強東夫婦打扮顯眼被認出 2025-05-15
  • 智慧仿生魚已投入長江保護:模仿魚類遊動進行生態資料採集 2025-05-15
  • 華為折疊PC將在5月19日正式發布 2025-05-15
  • 小鵬全新純電轎跑官宣:還叫P7 2025-05-15
  • DeepMind放出新AI大招:竟能自我糾錯但有致命弱點 2025-05-15

熱門文章與頁面︰

  • 您可以在Windows 11 24H2 中找回WordPad
  • 假期3天不調休端午假期火車票即將開售
  • Waymo透露第六代無人駕駛計程車細節:成本更低、功能更強
  • 76%美國汽車高層認為中國電動車登陸美國是遲早的事
  • 華為折疊PC將在5月19日正式發布
  • NVIDIA對川普的迎合促成了AI技術擴散限制的逆轉以及對華為的進一步壓制
  • 黃仁勳將出席台北電腦展成焦點更多AI合作曝光
  • 英偉達CEO黃仁勳:不會使用人工智慧的人將失業
  • 動視正式起訴《決勝時刻》外掛開發者
  • 騰訊第一季營收1800億元微信及WeChat月活突破14億

投遞稿件

歡迎各界人士投遞稿件到admin@wongcw.com

請提供以下資料:

1.你的名字

2.你的電郵

3.分類目錄

4.文章標題

5.文章摘要

6.文章內容

7.文章來源

 

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

快帆

MALUS

極度掃描

DMCA.com Protection Status

WONGCW 網誌

  • 免責聲明
  • 捐助我們
  • ThemeNcode PDF Viewer
  • ThemeNcode PDF Viewer SC
  • Events

服務器提供

本站使用之服務器由ikoula提供。

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

© 2025   All Rights Reserved.