最好的 語音辨識 AI工具

Discover the most powerful 語音辨識 AI tools, including DefinedCrowd、MiMo、Transkriptor、ELSA Speak、Lingvanex、AssemblyAI、SoundHound AI、Speak、iFlytek Spark、Krater.ai, and other 語音辨識 AI tools.

TongueType

TongueType

TongueType 是一款完全本地化、離線運行的 macOS 語音輸入應用程式。它使用 Whisper AI 模型在 Apple 晶片上運行,無需聯網、無需帳戶、無需訂閱。只需按住快捷鍵說話,文字即刻出現。永久免費,可選擇一次性購買 Pro 版。

2.9K
MiMo

MiMo

MiMo是小米推出的先進大型AI工具,旨在透過深度理解語言和感知物理世界來重新定義智能。它作為智能夥伴,提供預測性協助、創意生成,並促進人機無縫協作。

1.2M
免費
AlphaKhoj

AlphaKhoj

AlphaKhoj是一款由神經科學家設計的AI驅動應用程式,旨在幫助5-15歲兒童提高閱讀流暢性,尤其適用於閱讀障礙兒童和印度語言學習者。它透過遊戲化、互動式練習,利用主動回憶和個性化學習路徑,建立自動單詞識別能力,提升閱讀速度。

3.5K
Hello Nabu

Hello Nabu

一款由人工智能驅動的語言學習平台,透過個人化的故事驅動課程幫助使用者學習英語、法語、西班牙語等語言。它配備了人工智能導師、即時回饋、語音辨識以及從A1到C1級別的CEFR對齊內容。

3.0K
Models

Models

Hathora 的 Models 提供精選的低延遲 ASR、TTS 和 LLM 模型目錄,專為語音 AI 和即時應用優化。開發者可以快速探索、測試和部署生產就緒模型,透過互動式沙盒和直接 API 存取,無縫整合到語音代理和其他應用中。

3.4K
OneNine

OneNine

OneNine是面向AI的數據供應鏈,專注於為領先的AI公司提供高品質、文化真實、人工標註的低資源語言數據集。它彌合了語言鴻溝,使全球AI模型更具包容性和準確性。

2.7K
Gabber

Gabber

Gabber是一個強大的平台,用於構建能夠看、聽、說的實時多模態AI應用程式。它為視覺語言模型(VLM)、文本轉語音(TTS)和語音轉文本(STT)提供低延遲推理,並結合基於圖的編排系統,實現快速開發和部署。

4.8K
VoiceGecko

VoiceGecko

VoiceGecko 是一款桌面應用程式,提供即時、高精度的語音轉文字聽寫功能。它幾乎相容所有應用程式,允許用戶透過語音進行輸入,從而節省時間、減少拼寫錯誤並改善工作流程,尤其適合開發人員和 AI 用戶。

2.9K
Ello

Ello

Ello是一款針對幼稚園至三年級兒童的AI驅動閱讀教練和陪伴應用程式。它利用先進的語音辨識和自適應學習技術,傾聽、教導並幫助孩子們以有趣和引人入勝的方式成為自信、獨立的閱讀者。

2.7K
DefinedCrowd

DefinedCrowd

DefinedCrowd是一家領先的高品質AI訓練資料提供商。它利用全球眾包力量為機器學習模型收集、標註和豐富資料,專注於語音、自然語言處理和電腦視覺領域。它提供全託管服務,幫助企業大規模建構穩健且無偏見的AI應用。

2.0B
Speech Studio

Speech Studio

Speech Studio 是微軟 Azure 提供的一套功能全面的 AI 工具,使開發人員能夠建構具有進階語音功能的應用程式。它提供高精度的語音轉文字、聽感自然的文字轉語音、即時語音翻譯和說話人識別功能。使用者可以建立自訂語音模型和對話式介面,使其成為適用於各種語音解決方案的多功能平台。

154.6K
Luca.ai

Luca.ai

luca.ai是一款人工智能驅動的閱讀導師,旨在提高兒童的閱讀技能和參與度。它根據孩子的興趣和閱讀挑戰創建個人化故事,利用先進的語音識別技術來識別和解決特定困難,例如與閱讀障礙相關的困難。該平台提供適性學習計劃,以培養年輕讀者的讀寫能力和自信心。

6.6K
Lingostar

Lingostar

Lingostar 是一個由人工智能驅動的語言學習平台,旨在透過逼真的對話練習幫助使用者實現流利口語。它能針對發音、語法和詞彙提供個人化的即時回饋。憑藉角色扮演、自適應學習路徑和智慧詞彙建構等功能,Lingostar 為旅行、工作或個人成長提供了一種沉浸式且高效的語言學習方式。

3.9K
免費
OpenVoiceOS

OpenVoiceOS

OpenVoiceOS 是一個由社群驅動的開源語音 AI 平台,用於創建自訂、私密且安全的語音控制介面。它可在樹莓派和 Linux 桌上型電腦等各種硬體上運行,為開發者和 DIY 愛好者提供了一個靈活的、基於外掛程式的架構。

16.9K
Literably

Literably

Literably 是一款針對 K-12 學校的人工智慧驅動的讀寫能力評估工具。它能聽學生朗讀,自動轉錄其閱讀內容,並為教師提供關於流利度、準確性和理解力的詳細數據,從而節省數小時的人工評估時間。

52.2K
Vocol.ai

Vocol.ai

Vocol.ai 是一款一體化的人工智慧語音協作平台,可將口頭對話轉化為可行的見解。它提供高精度的多語言(英語、中文、日語)轉錄、AI 生成的摘要、關鍵主題和行動項目。該平台專為團隊設計,透過自動化會議、訪談和講座的筆記與分析等手動工作,簡化工作流程、加強協作並提高生產力。

20.0K
voice_vector

voice_vector

voice_vector 是一個功能強大的人工智慧語音平台,提供高保真聲音克隆、富表現力的文字轉語音(TTS)和精準的語音辨識功能。憑藉其獨特的「按量付費」與訂閱混合模式,它為內容創作者、開發者和企業提供了靈活且具成本效益的解決方案。您可以創建無限的私人克隆聲音,並透過強大的API將進階語音功能整合到您的專案中。

4.4K
Lingvanex

Lingvanex

Lingvanex提供先進的人工智慧語言解決方案,包括機器翻譯和語音辨識。它專注於為企業提供安全的本地化部署軟體,確保資料隱私。支援超過100種語言,為文本、文件和網站提供可客製化、高速的翻譯,滿足企業級需求。

921.9K
Ello

Ello

Ello是一款專為幼稚園至三年級兒童設計的人工智慧閱讀伴侶應用程式。它扮演著個人伴讀導師的角色,能傾聽您孩子的朗讀,提供即時協助,並利用自適應學習技術,將他們培養成自信、熱情的閱讀者。該應用程式建立在經過驗證的「閱讀科學」方法論之上。

35.9K
Ask Maya

Ask Maya

Ask Maya 是一款由人工智能驅動的對話夥伴,旨在幫助您練習和掌握英語口說。透過即時的語音對話,提高您的流利度、發音和自信心,讓您的口說聽起來更像母語人士。這是一種有趣、方便且無壓力的學習方式。

3.7K
iFlytek Spark

iFlytek Spark

訊飛星火是科大訊飛推出的綜合性AI助理和大型語言模型平台。它在深度推理、多模態互動和語言理解方面表現卓越,支援超過130種語言。該平台提供一套完整的工具,包括對話式AI、AI搜尋、開發者API和模型即服務(MaaS)平台,為個人用戶和教育、醫療、金融等行業的企業賦能。

320.7K
Accent Guesser

Accent Guesser

Accent Guesser 是一款由人工智能驅動的工具,它能透過分析您的聲音來精準識別您的口音。利用先進的深度學習技術,它能即時提供關於您語音模式和語言背景的洞察。對於語言學習者、科技愛好者和充滿好奇心的用戶來說,這是一個有趣且引人入勝的方式,可以探索全球口音並提升溝通技巧。只需在網站上錄製您的聲音,幾秒鐘內即可發現您口音的獨特之處。

6.0K
FileTranscribe

FileTranscribe

FileTranscribe 是一款免費的人工智慧工具,可快速準確地轉錄音訊和視訊檔案。它提供說話人識別、自動摘要和會議記錄產生等進階功能,是學生、專業人士和內容創作者輕鬆將語音轉換為文字的理想選擇。

3.8K
免費
Najva

Najva

Najva 是一款免費的原生 macOS 應用程式,它結合了離線、裝置端語音辨識與 GPT-4、Claude 3 等先進的 AI 模型。它能即時將您的聲音轉化為智慧文本,為作家、開發者和專業人士提供無與倫比的隱私保護和生產力。其特色功能包括上下文感知、螢幕截圖整合以及對眾多 AI 供應商的支援。

2.7K
Flow

Flow

Flow是一款由AI驅動的語言學習應用程式,旨在透過自然、日常的練習幫助您實現流利口語。與AI導師進行逼真的對話,獲得個人化回饋,以直觀和沈浸式的方式學習。它是您掌握一門新語言的個人嚮導。

2.8K
Tandem GPT

Tandem GPT

Tandem GPT 是一款由人工智能驅動的語言夥伴,旨在透過真實、互動的對話幫助您掌握新語言。您可以全天候與AI導師進行口語和文字練習,使用預設場景或創建自己的場景。它支援語音訊息,提供一個安全、無壓力的環境,幫助您建立流利度和自信心,以應對真實世界的情境。

4.6K
Buddy.ai

Buddy.ai

Buddy.ai是一款專為3-7歲兒童設計的人工智慧英語家教應用程式。它利用語音辨識和遊戲化課程,提供個人化的一對一口說練習。該應用程式以有趣、互動的方式,幫助孩子們學習超過1500個英語單字和片語,掌握發音並建立口說自信,而費用僅為真人家教的一小部分。

68.1K
Muchtodo

Muchtodo

Muchtodo 是一款由人工智能驅動的任務管理平台,可將您的語音轉換為專案、任務和筆記。它旨在透過最大限度地減少打字來提高生產力,讓您能夠即時捕捉想法。它支援57種語言,並包含一個番茄鐘計時器以增強專注力,確保流程無縫高效。

2.6K
Falou

Falou

Falou是一款由AI驅動的語言學習應用程式,旨在提高您的會話技巧。在真實場景中練習口說,獲得即時發音回饋,建立流利說外語的自信。它就像一個全天候待命的私人語言導師。

7.7K
Botjet

Botjet

Botjet 是一個端到端的對話式 AI 平台,供企業建構、部署和管理智慧的全通路聊天機器人。它專注於創建類似真人的對話流,以在網站、行動應用、IVRS 和社交媒體上實現更深層次的客戶互動。該平台提供視覺化流程設計器、強大的 NLU 和靈活的部署選項(雲端或本地),以實現任務自動化和提升客戶支援。

2.8K
Audiogest

Audiogest

Audiogest 是一款由人工智慧驅動的工具,可在 99 多種語言中快速準確地轉錄和總結音訊和視訊檔案。它具有說話人識別、可自訂的人工智慧筆記和靈活的按需付費定價。它非常適合學生、研究人員和專業人士,可以節省數小時的人工工作,同時透過位於歐盟的伺服器確保資料隱私。無需訂閱即可獲得快速、實惠且可靠的轉錄稿和摘要。

3.9K
Wavify

Wavify

Wavify 是一個面向開發者的裝置端語音AI平台。它提供高效能、注重隱私和跨平台的SDK,可將語音轉文字、喚醒詞偵測和語音意圖識別等功能整合到任何應用程式中。它確保了雲端級的準確性,同時在使用者裝置本機處理所有資料,保障隱私和離線功能。

2.8K
David AI

David AI

David AI 提供高品質、研究級的音訊資料集,用於訓練先進的語音和對話式AI模型。它提供多樣化、大規模的資料集,包括多語言對話、多說話者音訊和專家對話,並可選擇創建自訂資料集以解鎖新的AI功能。

24.1K
Sindarin

Sindarin

Sindarin 是一個為開發者打造的加速雲端平台,用於建構低延遲、對話式語音AI。它提供API和無程式碼平台,以創建高響應性、聽起來自然的AI角色。憑藉行業領先的輪流對話和無縫打斷處理能力,Sindarin能夠為客戶服務、健康、遊戲等應用創造真正的互動式語音體驗,並提供企業級的規模和可靠性。

4.9K
MediScoper

MediScoper

MediScoper是一款為醫療保健專業人員設計的AI輔助平台,旨在簡化臨床工作流程。它提供高精度的醫病互動音訊轉錄,自動生成符合SOAP標準的分析報告,提供即時診斷建議,並支援超過60種語言的翻譯。這使醫生能夠減少行政工作,更專注於病患照護,同時確保數據安全與保密。

2.7K
Krater.ai

Krater.ai

Krater.ai 是一款一體化的人工智慧超級應用,將超過50種AI工具整合於單一平台。它提供內容生成、圖像創作、音訊處理等多種解決方案,只需一次訂閱即可全部使用。該工具專為創作者、行銷人員和企業家設計,旨在透過統一、友好的使用者介面取代多個專業應用,從而節省時間、降低成本並簡化工作流程。

171.6K
Languate

Languate

Languate 是一個由AI驅動的語言學習平台,旨在提升您的會話技巧。它透過聽、說、讀、寫的主動練習,幫助您將理論知識轉化為實踐自信。獲取即時、詳細的發音回饋,以追蹤和提高您在英語、西班牙語、德語等語言中的流利度。

3.2K
AppTek.ai

AppTek.ai

AppTek.ai是人工智慧和機器學習語言技術的全球領導者。它為自動語音辨識(ASR)、神經機器翻譯(NMT)、自然語言處理(NLP)和文字轉語音(TTS)提供企業級解決方案,服務於媒體、客服中心和政府等行業。

4.7K
Transkriptor

Transkriptor

Transkriptor 是一款由人工智能驅動的轉錄服務,可將音訊和視訊檔案轉換為超過100種語言的準確、可編輯的文字。它配備了一個人工智慧助理,用於總結內容、識別發言者和提取行動要點。該工具非常適合會議、訪談、講座和內容創作,準確率高達99%,並與Zoom、Google Meet和Microsoft Teams等平台整合。它提供網頁版、行動應用程式和Chrome擴充功能,可簡化筆記記錄,並從您的對話中建立可搜尋的知識庫。

1.1M
AssemblyAI

AssemblyAI

AssemblyAI 透過一個對開發者友善的 API 提供強大的 AI 模型,用於高精度的語音轉文字和深度語音理解。它幫助企業建構先進的語音應用,從即時語音代理到深度對話智慧平台,功能包括說話人分離、個人身份資訊(PII)編輯和摘要生成。

592.8K
Langony

Langony

Langony是一款由AI驅動的語言學習應用程式,它使用互動式3D課程、引人入勝的故事情節和先進的語音辨識技術,使學習變得有趣而高效。它專為所有年齡層的使用者設計,透過語音助理和間隔重複等功能提供沉浸式體驗,以增強記憶和發音技巧。

2.7K
Speak

Speak

Speak是一款由AI驅動的語言導師,旨在幫助您掌握流利的口語。透過逼真的對話和對發音、語法和語調的即時回饋,Speak提供了一個無壓力的環境,讓您可以隨時隨地練習。這是建立真實世界語言自信、從書本知識邁向實際對話技巧的最快方式。

533.2K
neoformai

neoformai

neoformai 為非洲方言提供先進的AI模型,包括自動語音辨識(ASR)和文字轉語音(TTS)。它旨在賦能開發者和企業創建包容性應用程式,消除語言障礙,讓非洲數百萬用戶能夠無障礙地享受數位體驗。

3.5K
Voice To Notes

Voice To Notes

Voice To Notes 是一款由AI驅動的工具,可立即將您的語音轉換為可編輯、有組織的文字筆記。它支援70多種語言,非常適合在不打字的情況下捕捉想法、會議記錄和訪談內容。單次可錄製長達2小時,並無縫編輯您的筆記。

2.8K
yourteacher.ai

yourteacher.ai

yourteacher.ai 提供與AI導師進行無限的外語會話練習,其中一些導師是根據YouTube上著名的多語言博主克隆的。它專為中級學習者設計,透過24/7、無評判、個人化的對話來建立流利度和自信心。該平台支援網頁、iOS和安卓,並提供即時轉錄、即時糾正和進度追蹤功能。

54.6K
Corti

Corti

Corti 是一個專為醫療保健領域打造的AI平台,提供專為理解複雜醫療對話而設計的基礎模型和API。它透過環境AI和先進的語音辨識技術,幫助醫療服務提供者簡化工作流程、自動化文件處理並改善病患照護,同時高度重視資料隱私和主權雲端部署。

36.4K
ELSA Speak

ELSA Speak

ELSA Speak是一款由人工智能驅動的英語學習應用程式,旨在幫助非母語者提高發音和流利度。它利用先進的語音辨識技術,對發音、語調和節奏提供即時、詳細的回饋。該應用程式提供個人化學習路徑、數千個課程和真實生活對話練習,幫助用戶更自信、更清晰地講英語。

1.1M
SoundHound AI

SoundHound AI

SoundHound AI 是一個領先的獨立企業級語音AI平台,致力於創建先進的對話式智能代理。憑藉數十年的專業經驗,它為汽車、餐飲、客戶服務等行業提供客製化解決方案,專注於高準確性、數據主權和增強的用戶體驗。

550.6K
Defined.ai

Defined.ai

Defined.ai 是一個領先的高品質人工智慧訓練數據市場和平台。它為電腦視覺、自然語言處理和語音辨識提供現成的資料集和客製化數據收集/標註服務。透過利用全球眾包和強大的平台,Defined.ai 幫助企業加速開發準確且合乎道德的人工智慧模型。

74.1K
免費
voicetotext.org

voicetotext.org

voicetotext.org 是一款免費的、由人工智能驅動的線上工具,用於即時語音轉文字轉錄和文字轉語音轉換。它支援超過30種語言,允許使用者透過語音輸入、新增標點符號並匯出文字。該服務透過在瀏覽器本機處理所有資料來優先保護隱私,無需註冊或資料儲存。它還包括一個將文字轉換為音訊的語音產生器。

4.1K