Mozilla為本地音訊到文字翻譯開發Whisperfile引擎
Mozilla Ocho 小組正進行Mozilla 的”創新和實驗”。 Llamafile 用於將大型語言模型以單一檔案的形式發布,以便在不同的硬體/軟體間輕鬆執行。 Whisperfile 是一項將音訊輕鬆轉化為文字的新引擎。
正如其名稱所暗示的,Whisperfile 是圍繞著OpenAI 的Whisper 模型構建的,用於本地音訊/語言翻譯。 Whisperfile 基於Whisper.cpp 來源,在轉錄過程中還能將非英語音訊翻譯成英文。
Whisperfiles 可在Linux、Windows、macOS、FreeBSD、OpenBSD 和NetBSD 系統中運作。 Whisperfiles 目前可在x86_64 和AArch64 上運行。
想了解有關Whisperfile 的更多信息,請訪問HuggingFace 上的Mozilla/whisperfile:
https://huggingface.co/Mozilla/whisperfile
Mozilla 曾開發DeepSpeech 作為開源離線語音到文字引擎。 DeepSpeech 利用了TensorFlow 和百度的Deep Speech 研究論文。遺憾的是,DeepSpeech 的開發隨著Mozilla 之前的裁員而停止,其GitHub 儲存庫已經有三年沒有任何提交了。