最好的語音辨識 AI工具

TongueType

TongueType 是一款完全本地化、離線運行的 macOS 語音輸入應用程式。它使用 Whisper AI 模型在 Apple 晶片上運行，無需聯網、無需帳戶、無需訂閱。只需按住快捷鍵說話，文字即刻出現。永久免費，可選擇一次性購買 Pro 版。

Voice Input

2.9K

MiMo

MiMo是小米推出的先進大型AI工具，旨在透過深度理解語言和感知物理世界來重新定義智能。它作為智能夥伴，提供預測性協助、創意生成，並促進人機無縫協作。

Largelanguagemodels

1.2M

免費

AlphaKhoj

AlphaKhoj是一款由神經科學家設計的AI驅動應用程式，旨在幫助5-15歲兒童提高閱讀流暢性，尤其適用於閱讀障礙兒童和印度語言學習者。它透過遊戲化、互動式練習，利用主動回憶和個性化學習路徑，建立自動單詞識別能力，提升閱讀速度。

語言學習

3.5K

Hello Nabu

一款由人工智能驅動的語言學習平台，透過個人化的故事驅動課程幫助使用者學習英語、法語、西班牙語等語言。它配備了人工智能導師、即時回饋、語音辨識以及從A1到C1級別的CEFR對齊內容。

語言學習

3.0K

Models

Hathora 的 Models 提供精選的低延遲 ASR、TTS 和 LLM 模型目錄，專為語音 AI 和即時應用優化。開發者可以快速探索、測試和部署生產就緒模型，透過互動式沙盒和直接 API 存取，無縫整合到語音代理和其他應用中。

語音辨識

3.4K

OneNine

OneNine是面向AI的數據供應鏈，專注於為領先的AI公司提供高品質、文化真實、人工標註的低資源語言數據集。它彌合了語言鴻溝，使全球AI模型更具包容性和準確性。

資料標註

2.7K

Gabber

Gabber是一個強大的平台，用於構建能夠看、聽、說的實時多模態AI應用程式。它為視覺語言模型（VLM）、文本轉語音（TTS）和語音轉文本（STT）提供低延遲推理，並結合基於圖的編排系統，實現快速開發和部署。

即時AI

4.8K

VoiceGecko

VoiceGecko 是一款桌面應用程式，提供即時、高精度的語音轉文字聽寫功能。它幾乎相容所有應用程式，允許用戶透過語音進行輸入，從而節省時間、減少拼寫錯誤並改善工作流程，尤其適合開發人員和 AI 用戶。

轉錄

2.9K

Ello

Ello是一款針對幼稚園至三年級兒童的AI驅動閱讀教練和陪伴應用程式。它利用先進的語音辨識和自適應學習技術，傾聽、教導並幫助孩子們以有趣和引人入勝的方式成為自信、獨立的閱讀者。

閱讀

2.7K

DefinedCrowd

DefinedCrowd是一家領先的高品質AI訓練資料提供商。它利用全球眾包力量為機器學習模型收集、標註和豐富資料，專注於語音、自然語言處理和電腦視覺領域。它提供全託管服務，幫助企業大規模建構穩健且無偏見的AI應用。

資料標註

2.0B

Speech Studio

Speech Studio 是微軟 Azure 提供的一套功能全面的 AI 工具，使開發人員能夠建構具有進階語音功能的應用程式。它提供高精度的語音轉文字、聽感自然的文字轉語音、即時語音翻譯和說話人識別功能。使用者可以建立自訂語音模型和對話式介面，使其成為適用於各種語音解決方案的多功能平台。

語音處理

154.6K

Luca.ai

luca.ai是一款人工智能驅動的閱讀導師，旨在提高兒童的閱讀技能和參與度。它根據孩子的興趣和閱讀挑戰創建個人化故事，利用先進的語音識別技術來識別和解決特定困難，例如與閱讀障礙相關的困難。該平台提供適性學習計劃，以培養年輕讀者的讀寫能力和自信心。

語言學習

6.6K

Lingostar

Lingostar 是一個由人工智能驅動的語言學習平台，旨在透過逼真的對話練習幫助使用者實現流利口語。它能針對發音、語法和詞彙提供個人化的即時回饋。憑藉角色扮演、自適應學習路徑和智慧詞彙建構等功能，Lingostar 為旅行、工作或個人成長提供了一種沉浸式且高效的語言學習方式。

語言學習

3.9K

免費

OpenVoiceOS

OpenVoiceOS 是一個由社群驅動的開源語音 AI 平台，用於創建自訂、私密且安全的語音控制介面。它可在樹莓派和 Linux 桌上型電腦等各種硬體上運行，為開發者和 DIY 愛好者提供了一個靈活的、基於外掛程式的架構。

語音與語音

16.9K

Literably

Literably 是一款針對 K-12 學校的人工智慧驅動的讀寫能力評估工具。它能聽學生朗讀，自動轉錄其閱讀內容，並為教師提供關於流利度、準確性和理解力的詳細數據，從而節省數小時的人工評估時間。

讀寫能力評估

52.2K

Vocol.ai

Vocol.ai 是一款一體化的人工智慧語音協作平台，可將口頭對話轉化為可行的見解。它提供高精度的多語言（英語、中文、日語）轉錄、AI 生成的摘要、關鍵主題和行動項目。該平台專為團隊設計，透過自動化會議、訪談和講座的筆記與分析等手動工作，簡化工作流程、加強協作並提高生產力。

轉錄

20.0K

voice_vector

voice_vector 是一個功能強大的人工智慧語音平台，提供高保真聲音克隆、富表現力的文字轉語音（TTS）和精準的語音辨識功能。憑藉其獨特的「按量付費」與訂閱混合模式，它為內容創作者、開發者和企業提供了靈活且具成本效益的解決方案。您可以創建無限的私人克隆聲音，並透過強大的API將進階語音功能整合到您的專案中。

語音克隆

4.4K

Lingvanex

Lingvanex提供先進的人工智慧語言解決方案，包括機器翻譯和語音辨識。它專注於為企業提供安全的本地化部署軟體，確保資料隱私。支援超過100種語言，為文本、文件和網站提供可客製化、高速的翻譯，滿足企業級需求。

翻譯

921.9K

Ello

Ello是一款專為幼稚園至三年級兒童設計的人工智慧閱讀伴侶應用程式。它扮演著個人伴讀導師的角色，能傾聽您孩子的朗讀，提供即時協助，並利用自適應學習技術，將他們培養成自信、熱情的閱讀者。該應用程式建立在經過驗證的「閱讀科學」方法論之上。

語言學習

35.9K

Ask Maya

Ask Maya 是一款由人工智能驅動的對話夥伴，旨在幫助您練習和掌握英語口說。透過即時的語音對話，提高您的流利度、發音和自信心，讓您的口說聽起來更像母語人士。這是一種有趣、方便且無壓力的學習方式。

語言學習

3.7K

iFlytek Spark

訊飛星火是科大訊飛推出的綜合性AI助理和大型語言模型平台。它在深度推理、多模態互動和語言理解方面表現卓越，支援超過130種語言。該平台提供一套完整的工具，包括對話式AI、AI搜尋、開發者API和模型即服務（MaaS）平台，為個人用戶和教育、醫療、金融等行業的企業賦能。

助手

320.7K

Accent Guesser

Accent Guesser 是一款由人工智能驅動的工具，它能透過分析您的聲音來精準識別您的口音。利用先進的深度學習技術，它能即時提供關於您語音模式和語言背景的洞察。對於語言學習者、科技愛好者和充滿好奇心的用戶來說，這是一個有趣且引人入勝的方式，可以探索全球口音並提升溝通技巧。只需在網站上錄製您的聲音，幾秒鐘內即可發現您口音的獨特之處。

語音分析

6.0K

FileTranscribe

FileTranscribe 是一款免費的人工智慧工具，可快速準確地轉錄音訊和視訊檔案。它提供說話人識別、自動摘要和會議記錄產生等進階功能，是學生、專業人士和內容創作者輕鬆將語音轉換為文字的理想選擇。

轉錄

3.8K

免費

Najva

Najva 是一款免費的原生 macOS 應用程式，它結合了離線、裝置端語音辨識與 GPT-4、Claude 3 等先進的 AI 模型。它能即時將您的聲音轉化為智慧文本，為作家、開發者和專業人士提供無與倫比的隱私保護和生產力。其特色功能包括上下文感知、螢幕截圖整合以及對眾多 AI 供應商的支援。

轉錄

2.7K

Flow

Flow是一款由AI驅動的語言學習應用程式，旨在透過自然、日常的練習幫助您實現流利口語。與AI導師進行逼真的對話，獲得個人化回饋，以直觀和沈浸式的方式學習。它是您掌握一門新語言的個人嚮導。

語言學習

2.8K

Tandem GPT

Tandem GPT 是一款由人工智能驅動的語言夥伴，旨在透過真實、互動的對話幫助您掌握新語言。您可以全天候與AI導師進行口語和文字練習，使用預設場景或創建自己的場景。它支援語音訊息，提供一個安全、無壓力的環境，幫助您建立流利度和自信心，以應對真實世界的情境。

語言學習

4.6K

Buddy.ai

Buddy.ai是一款專為3-7歲兒童設計的人工智慧英語家教應用程式。它利用語音辨識和遊戲化課程，提供個人化的一對一口說練習。該應用程式以有趣、互動的方式，幫助孩子們學習超過1500個英語單字和片語，掌握發音並建立口說自信，而費用僅為真人家教的一小部分。

語言學習

68.1K

Muchtodo

Muchtodo 是一款由人工智能驅動的任務管理平台，可將您的語音轉換為專案、任務和筆記。它旨在透過最大限度地減少打字來提高生產力，讓您能夠即時捕捉想法。它支援57種語言，並包含一個番茄鐘計時器以增強專注力，確保流程無縫高效。

任務管理

2.6K

Falou

Falou是一款由AI驅動的語言學習應用程式，旨在提高您的會話技巧。在真實場景中練習口說，獲得即時發音回饋，建立流利說外語的自信。它就像一個全天候待命的私人語言導師。

語言學習

7.7K

Botjet

Botjet 是一個端到端的對話式 AI 平台，供企業建構、部署和管理智慧的全通路聊天機器人。它專注於創建類似真人的對話流，以在網站、行動應用、IVRS 和社交媒體上實現更深層次的客戶互動。該平台提供視覺化流程設計器、強大的 NLU 和靈活的部署選項（雲端或本地），以實現任務自動化和提升客戶支援。

聊天機器人

2.8K

Audiogest

Audiogest 是一款由人工智慧驅動的工具，可在 99 多種語言中快速準確地轉錄和總結音訊和視訊檔案。它具有說話人識別、可自訂的人工智慧筆記和靈活的按需付費定價。它非常適合學生、研究人員和專業人士，可以節省數小時的人工工作，同時透過位於歐盟的伺服器確保資料隱私。無需訂閱即可獲得快速、實惠且可靠的轉錄稿和摘要。

轉錄

3.9K

Wavify

Wavify 是一個面向開發者的裝置端語音AI平台。它提供高效能、注重隱私和跨平台的SDK，可將語音轉文字、喚醒詞偵測和語音意圖識別等功能整合到任何應用程式中。它確保了雲端級的準確性，同時在使用者裝置本機處理所有資料，保障隱私和離線功能。

語音辨識

2.8K

David AI

David AI 提供高品質、研究級的音訊資料集，用於訓練先進的語音和對話式AI模型。它提供多樣化、大規模的資料集，包括多語言對話、多說話者音訊和專家對話，並可選擇創建自訂資料集以解鎖新的AI功能。

資料集

24.1K

Sindarin

Sindarin 是一個為開發者打造的加速雲端平台，用於建構低延遲、對話式語音AI。它提供API和無程式碼平台，以創建高響應性、聽起來自然的AI角色。憑藉行業領先的輪流對話和無縫打斷處理能力，Sindarin能夠為客戶服務、健康、遊戲等應用創造真正的互動式語音體驗，並提供企業級的規模和可靠性。

API 平台

4.9K

MediScoper

MediScoper是一款為醫療保健專業人員設計的AI輔助平台，旨在簡化臨床工作流程。它提供高精度的醫病互動音訊轉錄，自動生成符合SOAP標準的分析報告，提供即時診斷建議，並支援超過60種語言的翻譯。這使醫生能夠減少行政工作，更專注於病患照護，同時確保數據安全與保密。

醫療轉錄

2.7K

Krater.ai

Krater.ai 是一款一體化的人工智慧超級應用，將超過50種AI工具整合於單一平台。它提供內容生成、圖像創作、音訊處理等多種解決方案，只需一次訂閱即可全部使用。該工具專為創作者、行銷人員和企業家設計，旨在透過統一、友好的使用者介面取代多個專業應用，從而節省時間、降低成本並簡化工作流程。

多合一

171.6K

Languate

Languate 是一個由AI驅動的語言學習平台，旨在提升您的會話技巧。它透過聽、說、讀、寫的主動練習，幫助您將理論知識轉化為實踐自信。獲取即時、詳細的發音回饋，以追蹤和提高您在英語、西班牙語、德語等語言中的流利度。

語言學習

3.2K

AppTek.ai

AppTek.ai是人工智慧和機器學習語言技術的全球領導者。它為自動語音辨識（ASR）、神經機器翻譯（NMT）、自然語言處理（NLP）和文字轉語音（TTS）提供企業級解決方案，服務於媒體、客服中心和政府等行業。

轉錄

4.7K

Transkriptor 是一款由人工智能驅動的轉錄服務，可將音訊和視訊檔案轉換為超過100種語言的準確、可編輯的文字。它配備了一個人工智慧助理，用於總結內容、識別發言者和提取行動要點。該工具非常適合會議、訪談、講座和內容創作，準確率高達99%，並與Zoom、Google Meet和Microsoft Teams等平台整合。它提供網頁版、行動應用程式和Chrome擴充功能，可簡化筆記記錄，並從您的對話中建立可搜尋的知識庫。

轉錄

1.1M