TongueType
TongueType 是一款完全本地化、離線運行的 macOS 語音輸入應用程式。它使用 Whisper AI 模型在 Apple 晶片上運行,無需聯網、無需帳戶、無需訂閱。只需按住快捷鍵說話,文字即刻出現。永久免費,可選擇一次性購買 Pro 版。
TongueType 是一款完全本地化、離線運行的 macOS 語音輸入應用程式。它使用 Whisper AI 模型在 Apple 晶片上運行,無需聯網、無需帳戶、無需訂閱。只需按住快捷鍵說話,文字即刻出現。永久免費,可選擇一次性購買 Pro 版。
MiMo
MiMo是小米推出的先進大型AI工具,旨在透過深度理解語言和感知物理世界來重新定義智能。它作為智能夥伴,提供預測性協助、創意生成,並促進人機無縫協作。
MiMo是小米推出的先進大型AI工具,旨在透過深度理解語言和感知物理世界來重新定義智能。它作為智能夥伴,提供預測性協助、創意生成,並促進人機無縫協作。
Hello Nabu
一款由人工智能驅動的語言學習平台,透過個人化的故事驅動課程幫助使用者學習英語、法語、西班牙語等語言。它配備了人工智能導師、即時回饋、語音辨識以及從A1到C1級別的CEFR對齊內容。
一款由人工智能驅動的語言學習平台,透過個人化的故事驅動課程幫助使用者學習英語、法語、西班牙語等語言。它配備了人工智能導師、即時回饋、語音辨識以及從A1到C1級別的CEFR對齊內容。
VoiceGecko
VoiceGecko 是一款桌面應用程式,提供即時、高精度的語音轉文字聽寫功能。它幾乎相容所有應用程式,允許用戶透過語音進行輸入,從而節省時間、減少拼寫錯誤並改善工作流程,尤其適合開發人員和 AI 用戶。
VoiceGecko 是一款桌面應用程式,提供即時、高精度的語音轉文字聽寫功能。它幾乎相容所有應用程式,允許用戶透過語音進行輸入,從而節省時間、減少拼寫錯誤並改善工作流程,尤其適合開發人員和 AI 用戶。
DefinedCrowd
DefinedCrowd是一家領先的高品質AI訓練資料提供商。它利用全球眾包力量為機器學習模型收集、標註和豐富資料,專注於語音、自然語言處理和電腦視覺領域。它提供全託管服務,幫助企業大規模建構穩健且無偏見的AI應用。
DefinedCrowd是一家領先的高品質AI訓練資料提供商。它利用全球眾包力量為機器學習模型收集、標註和豐富資料,專注於語音、自然語言處理和電腦視覺領域。它提供全託管服務,幫助企業大規模建構穩健且無偏見的AI應用。
Speech Studio
Speech Studio 是微軟 Azure 提供的一套功能全面的 AI 工具,使開發人員能夠建構具有進階語音功能的應用程式。它提供高精度的語音轉文字、聽感自然的文字轉語音、即時語音翻譯和說話人識別功能。使用者可以建立自訂語音模型和對話式介面,使其成為適用於各種語音解決方案的多功能平台。
Speech Studio 是微軟 Azure 提供的一套功能全面的 AI 工具,使開發人員能夠建構具有進階語音功能的應用程式。它提供高精度的語音轉文字、聽感自然的文字轉語音、即時語音翻譯和說話人識別功能。使用者可以建立自訂語音模型和對話式介面,使其成為適用於各種語音解決方案的多功能平台。
OpenVoiceOS
OpenVoiceOS 是一個由社群驅動的開源語音 AI 平台,用於創建自訂、私密且安全的語音控制介面。它可在樹莓派和 Linux 桌上型電腦等各種硬體上運行,為開發者和 DIY 愛好者提供了一個靈活的、基於外掛程式的架構。
OpenVoiceOS 是一個由社群驅動的開源語音 AI 平台,用於創建自訂、私密且安全的語音控制介面。它可在樹莓派和 Linux 桌上型電腦等各種硬體上運行,為開發者和 DIY 愛好者提供了一個靈活的、基於外掛程式的架構。
voice_vector
voice_vector 是一個功能強大的人工智慧語音平台,提供高保真聲音克隆、富表現力的文字轉語音(TTS)和精準的語音辨識功能。憑藉其獨特的「按量付費」與訂閱混合模式,它為內容創作者、開發者和企業提供了靈活且具成本效益的解決方案。您可以創建無限的私人克隆聲音,並透過強大的API將進階語音功能整合到您的專案中。
voice_vector 是一個功能強大的人工智慧語音平台,提供高保真聲音克隆、富表現力的文字轉語音(TTS)和精準的語音辨識功能。憑藉其獨特的「按量付費」與訂閱混合模式,它為內容創作者、開發者和企業提供了靈活且具成本效益的解決方案。您可以創建無限的私人克隆聲音,並透過強大的API將進階語音功能整合到您的專案中。
iFlytek Spark
訊飛星火是科大訊飛推出的綜合性AI助理和大型語言模型平台。它在深度推理、多模態互動和語言理解方面表現卓越,支援超過130種語言。該平台提供一套完整的工具,包括對話式AI、AI搜尋、開發者API和模型即服務(MaaS)平台,為個人用戶和教育、醫療、金融等行業的企業賦能。
訊飛星火是科大訊飛推出的綜合性AI助理和大型語言模型平台。它在深度推理、多模態互動和語言理解方面表現卓越,支援超過130種語言。該平台提供一套完整的工具,包括對話式AI、AI搜尋、開發者API和模型即服務(MaaS)平台,為個人用戶和教育、醫療、金融等行業的企業賦能。
Accent Guesser
Accent Guesser 是一款由人工智能驅動的工具,它能透過分析您的聲音來精準識別您的口音。利用先進的深度學習技術,它能即時提供關於您語音模式和語言背景的洞察。對於語言學習者、科技愛好者和充滿好奇心的用戶來說,這是一個有趣且引人入勝的方式,可以探索全球口音並提升溝通技巧。只需在網站上錄製您的聲音,幾秒鐘內即可發現您口音的獨特之處。
Accent Guesser 是一款由人工智能驅動的工具,它能透過分析您的聲音來精準識別您的口音。利用先進的深度學習技術,它能即時提供關於您語音模式和語言背景的洞察。對於語言學習者、科技愛好者和充滿好奇心的用戶來說,這是一個有趣且引人入勝的方式,可以探索全球口音並提升溝通技巧。只需在網站上錄製您的聲音,幾秒鐘內即可發現您口音的獨特之處。
FileTranscribe
FileTranscribe 是一款免費的人工智慧工具,可快速準確地轉錄音訊和視訊檔案。它提供說話人識別、自動摘要和會議記錄產生等進階功能,是學生、專業人士和內容創作者輕鬆將語音轉換為文字的理想選擇。
FileTranscribe 是一款免費的人工智慧工具,可快速準確地轉錄音訊和視訊檔案。它提供說話人識別、自動摘要和會議記錄產生等進階功能,是學生、專業人士和內容創作者輕鬆將語音轉換為文字的理想選擇。
Najva
Najva 是一款免費的原生 macOS 應用程式,它結合了離線、裝置端語音辨識與 GPT-4、Claude 3 等先進的 AI 模型。它能即時將您的聲音轉化為智慧文本,為作家、開發者和專業人士提供無與倫比的隱私保護和生產力。其特色功能包括上下文感知、螢幕截圖整合以及對眾多 AI 供應商的支援。
Najva 是一款免費的原生 macOS 應用程式,它結合了離線、裝置端語音辨識與 GPT-4、Claude 3 等先進的 AI 模型。它能即時將您的聲音轉化為智慧文本,為作家、開發者和專業人士提供無與倫比的隱私保護和生產力。其特色功能包括上下文感知、螢幕截圖整合以及對眾多 AI 供應商的支援。
Tandem GPT
Tandem GPT 是一款由人工智能驅動的語言夥伴,旨在透過真實、互動的對話幫助您掌握新語言。您可以全天候與AI導師進行口語和文字練習,使用預設場景或創建自己的場景。它支援語音訊息,提供一個安全、無壓力的環境,幫助您建立流利度和自信心,以應對真實世界的情境。
Tandem GPT 是一款由人工智能驅動的語言夥伴,旨在透過真實、互動的對話幫助您掌握新語言。您可以全天候與AI導師進行口語和文字練習,使用預設場景或創建自己的場景。它支援語音訊息,提供一個安全、無壓力的環境,幫助您建立流利度和自信心,以應對真實世界的情境。
Botjet
Botjet 是一個端到端的對話式 AI 平台,供企業建構、部署和管理智慧的全通路聊天機器人。它專注於創建類似真人的對話流,以在網站、行動應用、IVRS 和社交媒體上實現更深層次的客戶互動。該平台提供視覺化流程設計器、強大的 NLU 和靈活的部署選項(雲端或本地),以實現任務自動化和提升客戶支援。
Botjet 是一個端到端的對話式 AI 平台,供企業建構、部署和管理智慧的全通路聊天機器人。它專注於創建類似真人的對話流,以在網站、行動應用、IVRS 和社交媒體上實現更深層次的客戶互動。該平台提供視覺化流程設計器、強大的 NLU 和靈活的部署選項(雲端或本地),以實現任務自動化和提升客戶支援。
Audiogest
Audiogest 是一款由人工智慧驅動的工具,可在 99 多種語言中快速準確地轉錄和總結音訊和視訊檔案。它具有說話人識別、可自訂的人工智慧筆記和靈活的按需付費定價。它非常適合學生、研究人員和專業人士,可以節省數小時的人工工作,同時透過位於歐盟的伺服器確保資料隱私。無需訂閱即可獲得快速、實惠且可靠的轉錄稿和摘要。
Audiogest 是一款由人工智慧驅動的工具,可在 99 多種語言中快速準確地轉錄和總結音訊和視訊檔案。它具有說話人識別、可自訂的人工智慧筆記和靈活的按需付費定價。它非常適合學生、研究人員和專業人士,可以節省數小時的人工工作,同時透過位於歐盟的伺服器確保資料隱私。無需訂閱即可獲得快速、實惠且可靠的轉錄稿和摘要。
Sindarin
Sindarin 是一個為開發者打造的加速雲端平台,用於建構低延遲、對話式語音AI。它提供API和無程式碼平台,以創建高響應性、聽起來自然的AI角色。憑藉行業領先的輪流對話和無縫打斷處理能力,Sindarin能夠為客戶服務、健康、遊戲等應用創造真正的互動式語音體驗,並提供企業級的規模和可靠性。
Sindarin 是一個為開發者打造的加速雲端平台,用於建構低延遲、對話式語音AI。它提供API和無程式碼平台,以創建高響應性、聽起來自然的AI角色。憑藉行業領先的輪流對話和無縫打斷處理能力,Sindarin能夠為客戶服務、健康、遊戲等應用創造真正的互動式語音體驗,並提供企業級的規模和可靠性。
MediScoper
MediScoper是一款為醫療保健專業人員設計的AI輔助平台,旨在簡化臨床工作流程。它提供高精度的醫病互動音訊轉錄,自動生成符合SOAP標準的分析報告,提供即時診斷建議,並支援超過60種語言的翻譯。這使醫生能夠減少行政工作,更專注於病患照護,同時確保數據安全與保密。
MediScoper是一款為醫療保健專業人員設計的AI輔助平台,旨在簡化臨床工作流程。它提供高精度的醫病互動音訊轉錄,自動生成符合SOAP標準的分析報告,提供即時診斷建議,並支援超過60種語言的翻譯。這使醫生能夠減少行政工作,更專注於病患照護,同時確保數據安全與保密。
Krater.ai
Krater.ai 是一款一體化的人工智慧超級應用,將超過50種AI工具整合於單一平台。它提供內容生成、圖像創作、音訊處理等多種解決方案,只需一次訂閱即可全部使用。該工具專為創作者、行銷人員和企業家設計,旨在透過統一、友好的使用者介面取代多個專業應用,從而節省時間、降低成本並簡化工作流程。
Krater.ai 是一款一體化的人工智慧超級應用,將超過50種AI工具整合於單一平台。它提供內容生成、圖像創作、音訊處理等多種解決方案,只需一次訂閱即可全部使用。該工具專為創作者、行銷人員和企業家設計,旨在透過統一、友好的使用者介面取代多個專業應用,從而節省時間、降低成本並簡化工作流程。
Transkriptor
Transkriptor 是一款由人工智能驅動的轉錄服務,可將音訊和視訊檔案轉換為超過100種語言的準確、可編輯的文字。它配備了一個人工智慧助理,用於總結內容、識別發言者和提取行動要點。該工具非常適合會議、訪談、講座和內容創作,準確率高達99%,並與Zoom、Google Meet和Microsoft Teams等平台整合。它提供網頁版、行動應用程式和Chrome擴充功能,可簡化筆記記錄,並從您的對話中建立可搜尋的知識庫。
Transkriptor 是一款由人工智能驅動的轉錄服務,可將音訊和視訊檔案轉換為超過100種語言的準確、可編輯的文字。它配備了一個人工智慧助理,用於總結內容、識別發言者和提取行動要點。該工具非常適合會議、訪談、講座和內容創作,準確率高達99%,並與Zoom、Google Meet和Microsoft Teams等平台整合。它提供網頁版、行動應用程式和Chrome擴充功能,可簡化筆記記錄,並從您的對話中建立可搜尋的知識庫。
AssemblyAI
AssemblyAI 透過一個對開發者友善的 API 提供強大的 AI 模型,用於高精度的語音轉文字和深度語音理解。它幫助企業建構先進的語音應用,從即時語音代理到深度對話智慧平台,功能包括說話人分離、個人身份資訊(PII)編輯和摘要生成。
AssemblyAI 透過一個對開發者友善的 API 提供強大的 AI 模型,用於高精度的語音轉文字和深度語音理解。它幫助企業建構先進的語音應用,從即時語音代理到深度對話智慧平台,功能包括說話人分離、個人身份資訊(PII)編輯和摘要生成。
Voice To Notes
Voice To Notes 是一款由AI驅動的工具,可立即將您的語音轉換為可編輯、有組織的文字筆記。它支援70多種語言,非常適合在不打字的情況下捕捉想法、會議記錄和訪談內容。單次可錄製長達2小時,並無縫編輯您的筆記。
Voice To Notes 是一款由AI驅動的工具,可立即將您的語音轉換為可編輯、有組織的文字筆記。它支援70多種語言,非常適合在不打字的情況下捕捉想法、會議記錄和訪談內容。單次可錄製長達2小時,並無縫編輯您的筆記。
yourteacher.ai
yourteacher.ai 提供與AI導師進行無限的外語會話練習,其中一些導師是根據YouTube上著名的多語言博主克隆的。它專為中級學習者設計,透過24/7、無評判、個人化的對話來建立流利度和自信心。該平台支援網頁、iOS和安卓,並提供即時轉錄、即時糾正和進度追蹤功能。
yourteacher.ai 提供與AI導師進行無限的外語會話練習,其中一些導師是根據YouTube上著名的多語言博主克隆的。它專為中級學習者設計,透過24/7、無評判、個人化的對話來建立流利度和自信心。該平台支援網頁、iOS和安卓,並提供即時轉錄、即時糾正和進度追蹤功能。
ELSA Speak
ELSA Speak是一款由人工智能驅動的英語學習應用程式,旨在幫助非母語者提高發音和流利度。它利用先進的語音辨識技術,對發音、語調和節奏提供即時、詳細的回饋。該應用程式提供個人化學習路徑、數千個課程和真實生活對話練習,幫助用戶更自信、更清晰地講英語。
ELSA Speak是一款由人工智能驅動的英語學習應用程式,旨在幫助非母語者提高發音和流利度。它利用先進的語音辨識技術,對發音、語調和節奏提供即時、詳細的回饋。該應用程式提供個人化學習路徑、數千個課程和真實生活對話練習,幫助用戶更自信、更清晰地講英語。
SoundHound AI
SoundHound AI 是一個領先的獨立企業級語音AI平台,致力於創建先進的對話式智能代理。憑藉數十年的專業經驗,它為汽車、餐飲、客戶服務等行業提供客製化解決方案,專注於高準確性、數據主權和增強的用戶體驗。
SoundHound AI 是一個領先的獨立企業級語音AI平台,致力於創建先進的對話式智能代理。憑藉數十年的專業經驗,它為汽車、餐飲、客戶服務等行業提供客製化解決方案,專注於高準確性、數據主權和增強的用戶體驗。
Defined.ai
Defined.ai 是一個領先的高品質人工智慧訓練數據市場和平台。它為電腦視覺、自然語言處理和語音辨識提供現成的資料集和客製化數據收集/標註服務。透過利用全球眾包和強大的平台,Defined.ai 幫助企業加速開發準確且合乎道德的人工智慧模型。
Defined.ai 是一個領先的高品質人工智慧訓練數據市場和平台。它為電腦視覺、自然語言處理和語音辨識提供現成的資料集和客製化數據收集/標註服務。透過利用全球眾包和強大的平台,Defined.ai 幫助企業加速開發準確且合乎道德的人工智慧模型。
voicetotext.org
voicetotext.org 是一款免費的、由人工智能驅動的線上工具,用於即時語音轉文字轉錄和文字轉語音轉換。它支援超過30種語言,允許使用者透過語音輸入、新增標點符號並匯出文字。該服務透過在瀏覽器本機處理所有資料來優先保護隱私,無需註冊或資料儲存。它還包括一個將文字轉換為音訊的語音產生器。
voicetotext.org 是一款免費的、由人工智能驅動的線上工具,用於即時語音轉文字轉錄和文字轉語音轉換。它支援超過30種語言,允許使用者透過語音輸入、新增標點符號並匯出文字。該服務透過在瀏覽器本機處理所有資料來優先保護隱私,無需註冊或資料儲存。它還包括一個將文字轉換為音訊的語音產生器。