Skip to content
WONGCW 網誌
  • 首頁
  • 論壇
  • 微博
  • 壁紙下載
  • 免費圖床
  • 視頻下載
  • 聊天室
  • SEO工具
  • 支援中心
  • 表格製作
  • More
    • 在線名片
    • 網頁搜索
    • 天氣預報
    • 二維碼生成器
  • Search Icon

WONGCW 網誌

記錄生活經驗與點滴

AI大戰進入實體化階段谷歌剛發布的PaLM-E模型有哪些亮點?

AI大戰進入實體化階段谷歌剛發布的PaLM-E模型有哪些亮點?

2023-03-09 Comments 0 Comment

過去幾個月裡,由ChatGPT引發的AI熱潮向人類展現了通用語言模型的生產力前景。就在聊天機器人逐漸變成生產力工具之時,利用通用語言模型驅動真正的機器人也已經提上日程。本周老牌AI大廠谷歌與柏林工業大學的研究人員聯合發布PaLM-E視覺語言模型,通過同時處理圖像和語言文本,解鎖人類與機器人交互的新篇章。

(預印本論文,來源:谷歌、柏林工業大學)
(預印本論文,來源:谷歌、柏林工業大學)

顧名思義,PaLM-E模型源自於谷歌的大型語言模型PaLM,E指的就是具象化(Embodied)。通過將通用語言模型與視覺轉換模型ViT相結合,PaLM-E成功實現讓AI同時具備“理解文字”和“讀懂圖片”的能力,不僅能夠輸出文字,還能輸出指令使得機器人的智能化躍上一個新的台階。

研究人員介紹稱,PaLM和ViT的結合,使得PaLM-E的參數量最高可達5620億組,也是全球已知的最大視覺語言模型。

回歸到資本市場最關心的問題,這個聽上去很厲害的AI模型,到底能幹什麼事情呢?對此研究人員也給出一系列案例,幫助外界理解這個模型的妙處。

(PaLM-E模型的案例,來源:谷歌、柏林工業大學)
(PaLM-E模型的案例,來源:谷歌、柏林工業大學)

首先,具備視覺屬性的AI模型將擁有解讀圖片並進行思維推理的能力。例如可以通過一張禁行交通標誌(除自行車外)的圖片,來解答“我能否在這條馬路上騎自行車”;通過OCR識別餐館的手寫菜單,能進行賬單的計算;或是通過識別一系列烘焙材料的照片,向機器人傳達“製作蛋糕胚”的流程。

在AI模型與機器人結合的實驗演示中,機器人得到“從抽屜裡拿出米餅”的指令後,能夠順利地從十多個開放式抽屜中找到米餅,拿給研究人員。

(來源:谷歌、柏林工業大學)

在後續的實驗中,研究人員還要求機器人“將所有色塊按顏色堆放到不同角落”的指令,以及將“綠色色塊推到烏龜旁邊”的指令,即便機器人之前沒有見過這只烏龜擺件,也能順利地完成任務。

(來源:谷歌、柏林工業大學)

雖然從演示視頻中來看,受限於演示機器人較為簡單的設計,執行指令的時候仍顯得“笨手笨腳”。但隨著PaLM-E模型賦予機器思考如何執行人類指令的能力,工業應用和工業設計上的突破也指日可待。或許在不久的將來,就會出現一款風靡全球的智能機器人硬件。

值得一提的是,作為AI大戰的老對手,微軟也已經在“圖像+語言模型”的路數上有所佈局。在今年2月底發表的研究中,微軟就展現瞭如何使用ChatGPT為大疆Tello無人機編寫“找飲料”程序的案例。

(來源:微軟)

分享此文:

  • 按一下即可分享至 X(在新視窗中開啟) X
  • 按一下以分享至 Facebook(在新視窗中開啟) Facebook
  • 分享到 WhatsApp(在新視窗中開啟) WhatsApp
  • 按一下以分享到 Telegram(在新視窗中開啟) Telegram
  • 分享到 Pinterest(在新視窗中開啟) Pinterest
  • 分享到 Reddit(在新視窗中開啟) Reddit
  • 按一下即可以電子郵件傳送連結給朋友(在新視窗中開啟) 電子郵件
  • 點這裡列印(在新視窗中開啟) 列印

相關


網絡資訊

Post navigation

PREVIOUS
日本公佈H3火箭發射失敗初步調查結果
NEXT
天文學家發現缺失的環節:地球上的水有可能比太陽更古老

發表迴響取消回覆

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

More results...

Generic filters
Exact matches only
Search in title
Search in content
Search in excerpt
Filter by 分類
網站公告
Featured
赫思醫美
限時免費
Windows 軟件下載
系統軟件
辦公軟件
圖像處理
影音媒體
網絡軟件
應用軟件
Mac 軟件下載
安卓軟件下載
網絡資訊
Mac資訊
Linux資訊
VPS資訊
NASA資訊
WordPress資訊
WeChat資訊
PHP資訊
教學資源
開源程序
網頁工具
SEO工具
醫療健康
其他資訊
Content from
Content to
2023 年 3 月
一 二 三 四 五 六 日
 12345
6789101112
13141516171819
20212223242526
2728293031  
« 2 月   4 月 »

分類

  • 網站公告
  • 赫思醫美
  • 限時免費
  • Windows 軟件下載
  • 系統軟件
  • 辦公軟件
  • 圖像處理
  • 影音媒體
  • 網絡軟件
  • 應用軟件
  • Mac 軟件下載
  • 安卓軟件下載
  • 網絡資訊
  • Mac資訊
  • Linux資訊
  • VPS資訊
  • NASA資訊
  • WordPress資訊
  • WeChat資訊
  • PHP資訊
  • 教學資源
  • 開源程序
  • 網頁工具
  • SEO工具
  • 醫療健康
  • 其他資訊

彙整

近期文章

  • 【美學小課堂】臉部輪廓解析:外輪廓×內輪廓×T區立體感|一次搞懂輪廓固定關鍵 2025-07-15
  • 美國商務部正在調查無人機和多晶矽進口 2025-07-15
  • 女子網購未殺菌現擠鮮奶直接喝感染布魯氏菌病反覆發燒咳嗽 2025-07-15
  • 索尼手機縮減歐洲市場業務已撤出芬蘭 2025-07-15
  • 特斯拉Robotaxi服務區域形狀引質疑媒體:迎合馬斯克惡趣味 2025-07-15
  • 深圳地鐵配送機器人首跑自己會搭地鐵送貨 2025-07-15
  • 格陵蘭居民一覺醒來看到一座冰山豎在門口 2025-07-15
  • Google 確認計劃將ChromeOS 合併到Android 中 2025-07-15
  • Google Chrome 將終止對macOS 11 Big Sur 的支持 2025-07-15
  • 馬來西亞擬要求高級AI晶片出口需申請許可防止轉售給中國 2025-07-15

熱門文章與頁面︰

  • 無3C行動電源禁止登機一文看懂到底什麼是3C認證、如何分辨真偽
  • 您可以在Windows 11 24H2 中找回WordPad
  • 美國FAA擬收"天空過路費" 馬斯克發射火箭一年或多交上百萬美元
  • CCleaner全家桶激活密鑰
  • Photon Matrix:針對蚊子的“防空系統”
  • 鳥寶寶有多內捲?為了讓父母投餵自己長出恐怖的嘴巴
  • 研究發現在街道上植樹可以導致當地死亡率的下降
  • 睡眠呼吸中止症病例增加45% 全球氣溫因素是罪魁禍首
  • 視頻轉換器Any Video Converter Ultimate v7.0.5
  • Anduril 宣布與Meta 合作為美國軍方開發XR 產品

投遞稿件

歡迎各界人士投遞稿件到admin@wongcw.com

請提供以下資料:

1.你的名字

2.你的電郵

3.分類目錄

4.文章標題

5.文章摘要

6.文章內容

7.文章來源

 

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

赫思醫美

快帆

MALUS

極度掃描

DMCA.com Protection Status

WONGCW 網誌

  • 免責聲明
  • 捐助我們
  • ThemeNcode PDF Viewer
  • ThemeNcode PDF Viewer SC
  • Events

服務器提供

本站使用之服務器由ikoula提供。

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

© 2025   All Rights Reserved.