Skip to content
WONGCW 網誌
  • 首頁
  • 論壇
  • 微博
  • 壁紙下載
  • 免費圖床
  • 視頻下載
  • 聊天室
  • SEO工具
  • 支援中心
  • 表格製作
  • More
    • 在線名片
    • 網頁搜索
    • 天氣預報
    • 二維碼生成器
    • WordPress 插件及主題下載
  • Search Icon

WONGCW 網誌

記錄生活經驗與點滴

人工智能模型消化80小時的視頻以學習手語

人工智能模型消化80小時的視頻以學習手語

2023-05-24 Comments 0 Comment

對於聾人和重聽者來說,像Alexa和Siri這樣的語音識別技術反而可能是有效溝通的障礙。研究人員利用人工智能開發了一種將手語轉換為文本的工具,可能會增加聾人社區的包容性和可及性。

翻譯手語需要精確理解手語者的姿勢,以產生準確的文字轉寫。巴塞羅那超級計算中心(BSC)和加泰羅尼亞理工大學(UPC)的研究人員利用人工智能開發了一種改進手語翻譯的工具,這是允許聾人和重聽者與技術互動並獲得為口語設計的數字服務的重要一步。

研究人員使用了一個轉化器式的機器學習模型,與ChatGPT等其他人工智能工具背後的模型類似。變壓器之所以有用,主要有兩個原因。第一,這些模型特別善於學習如何應用上下文,這是因為架構中存在自我注意機制–自我注意是神經網絡如何通過查看文本中的其他詞彙來確定詞彙的上下文。其次,當從訓練實例中學習時,它們允許更快的吞吐量,使更多的訓練數據在特定時間內被使用。

這裡的訓練數據集來自How2Sign,這是一個公開可用的大規模、多模態和多視圖數據集,包括80小時的美國手語教學視頻和相應的英語文字記錄。

該研究的主要作者Laia Tarrés說:”所開發的新工具是以前同樣由BSC和UPC發布的名為How2Sign的出版物的延伸,在那裡,訓練模型所需的數據(超過80小時的視頻,其中美國手語翻譯人員翻譯了烹飪食譜或DIY技巧等視頻教程)被公佈。有了這些已經可用的數據,該團隊開發了一個新的開源軟件,能夠學習視頻和文本之間的映射。”

XdwtKdyZ.jpg

用於訓練人工智能的How2Sign視頻數據集的一個例子,以及該工具做出的預測How2Sign/巴塞羅那超級計算中心

對於研究人員來說,使用連續簽名的視頻而不是孤立的簽名是很重要的,因為它更真實地反映了說話者是如何自然地使用一連串的詞(連接)來構建句子的,這對確定一個句子的含義是至關重要的。

研究人員面臨的一個挑戰是手語的多變性和復雜性,它可能受到諸如手語者的背景、背景和外表的影響。為了在這方面有所幫助,他們使用膨脹式三維網絡(I3D)對數據進行了預處理,這是一種視頻提取方法,對視頻進行三維過濾,允許直接從視頻中獲取時空信息。

研究人員發現,文本預處理也大大改善了簽名到文本的翻譯。為了預處理原始文本,他們將其全部轉換為小寫字母,從而降低了詞彙的複雜性。

總體而言,他們發現他們的模型能夠產生有意義的翻譯,但並不完美。”研究人員說:”雖然我們的工作顯示出有希望的結果,但仍有改進的餘地。

由於該模型仍處於實驗階段,研究人員將繼續努力創建一個工具,使聾人和重聽者能夠獲得與無聽力損失者相同的技術。

Tarrés說:”這個自動手語翻譯的開放工具是對關注無障礙環境的科學界的寶貴貢獻,它的發表代表了向為所有人創造更具包容性和無障礙的技術邁出的重要一步。”

該研究報告在線發表在arXiv上。

分享此文:

  • 分享到 Twitter(在新視窗中開啟)
  • 按一下以分享至 Facebook(在新視窗中開啟)
  • 分享到 WhatsApp(在新視窗中開啟)
  • 按一下以分享到 Telegram(在新視窗中開啟)
  • 分享到 Pinterest(在新視窗中開啟)
  • 分享到 Reddit(在新視窗中開啟)
  • 按一下即可分享至 Skype(在新視窗中開啟)
  • 按一下即可以電子郵件傳送連結給朋友(在新視窗中開啟)
  • 點這裡列印(在新視窗中開啟)

相關


網絡資訊

Post navigation

PREVIOUS
外媒:中國公司率先證實城市無人機配送可行性
NEXT
已熄滅的近海死火山可能儲存了多達86億噸的二氧化碳

發表迴響 取消回覆

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

More results...

Generic filters
Exact matches only
Search in title
Search in content
Search in excerpt
Filter by 分類
網站公告
Featured
限時免費
ESET NOD32
WINDOWS 10 &11 INSIDER PREVIEW
Windows 軟件下載
系統軟件
辦公軟件
圖像處理
影音媒體
網絡軟件
應用軟件
Mac 軟件下載
安卓軟件下載
網絡資訊
Mac資訊
Linux資訊
VPS資訊
NASA資訊
金融資訊
WhatsApp Stickers教學
WordPress資訊
WeChat資訊
PHP資訊
Plesk資訊
TensorFlow
教學資源
開源程序
網頁工具
SEO工具
醫療健康
旅遊及消閒
其他資訊
Content from
Content to
2023 年 5 月
一 二 三 四 五 六 日
1234567
891011121314
15161718192021
22232425262728
293031  
« 4 月    

分類

  • 網站公告
  • 限時免費
  • ESET NOD32
  • WINDOWS 10 &11 INSIDER PREVIEW
  • Windows 軟件下載
  • 系統軟件
  • 辦公軟件
  • 圖像處理
  • 影音媒體
  • 網絡軟件
  • 應用軟件
  • Mac 軟件下載
  • 安卓軟件下載
  • 網絡資訊
  • Mac資訊
  • Linux資訊
  • VPS資訊
  • NASA資訊
  • WhatsApp Stickers教學
  • WordPress資訊
  • WeChat資訊
  • PHP資訊
  • Plesk資訊
  • TensorFlow
  • 教學資源
  • 開源程序
  • 網頁工具
  • SEO工具
  • 醫療健康
  • 旅遊及消閒
  • 其他資訊

彙整

近期文章

  • 國產大飛機C919商業航班今天首飛:經濟艙156座餐食叫“五福臨門” 2023-05-28
  • 東航C919商業首航順利起飛後續將逐步投放更多航線 2023-05-28
  • 工信部部長金壯龍親歷東航開啟C919首次商業飛行 2023-05-28
  • 一理想車主雨天高速路躺平開車:用飲料瓶欺騙汽車“自動駕駛” 2023-05-28
  • AI搶飯碗?雷亞遊戲回應用AI創作後解僱美工:用了但沒解僱 2023-05-28
  • 蘋果公司將從6月5日開始接受Mac Studio和M2 MacBook機型以舊換新 2023-05-28
  • 華為捐贈中國移動完成1050套歐拉操作系統遷移上線 2023-05-28
  • 打擊外來物種日本6月起禁止出售或放生小龍蝦:最高罰款15萬 2023-05-28
  • 印度一官員為找手機抽空210萬升水庫 2023-05-28
  • 把廣告牌識別為真人後剎停理想客服回應:具體原因需做分析診斷 2023-05-28

熱門文章與頁面︰

  • 打車叫到特斯拉不會開門很尷尬?官方介紹開關門方法
  • DP vs HDMI 誰才是遊戲玩家最佳選擇?
  • ESET NOD32 LICENSE KEY (UPDATED 2023-01-17)
  • 世界上有多少個國家
  • 天翼網盤免登陸高速下載,直鏈解析不限速
  • REG007 – 你註冊過哪些網站?一搜便知
  • 印度一官員為找手機抽空210萬升水庫
  • 真人版《小美人魚》北美首日票房超越《阿拉丁》
  • 暴雪副總裁調侃《暗黑破壞神4》和《芭比》都有足部特寫:應該聯動
  • 韓國電子競技協會局長:要應對杭州亞運會的不公正待遇

投遞稿件

歡迎各界人士投遞稿件到admin@wongcw.com

請提供以下資料:

1.你的名字

2.你的電郵

3.分類目錄

4.文章標題

5.文章摘要

6.文章內容

7.文章來源

 

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

快帆

MALUS

極度掃描

DMCA.com Protection Status

WONGCW 網誌

  • 免責聲明
  • 捐助我們
  • ThemeNcode PDF Viewer
  • ThemeNcode PDF Viewer SC
  • Events

服務器提供

本站使用之服務器由ikoula提供。

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

© 2023   All Rights Reserved.