优先评估这些热门工具
工具卡片展示“是什么、是否热门、价格/标签”,提升列表扫描效率。
按场景快速选择
把高意图用户导向场景页,减少在目录里盲目浏览。
搜索结果
完整目录保留筛选能力,但视觉上不再压过搜索、分类和决策入口。
热门ElevenLabs
AI 语音平台,支持文本转语音、声音克隆、配音、旁白和多语言音频生成。
新收录Fish Audio
低成本文本转语音平台,提供开源权重的短样本声音克隆、细粒度情感控制和 80+ 语言支持。
新收录Cartesia
超低延迟文本转语音 API(Sonic),为实时对话语音智能体打造,按字符计费并支持即时声音克隆。
~$15/1M charsOpenAI TTS
OpenAI 的文本转语音 API,提供预设自然音色与可引导语气,按 token/字符计费,不支持声音克隆。
有免费额度Azure AI Speech(TTS)
微软 Azure 的企业级文本转语音,支持 100+ 语言和区域、神经与 HD 音色、定制语音选项、Speech SDK/REST 接入,以及合规级基础设施。
新收录Chatterbox(Resemble AI)
Resemble AI 推出的开源(MIT)文本转语音模型家族,可用几秒音频克隆音色、质量有竞争力,且可免费商用。
热门Deepgram
实时语音转文字平台(Nova/Flux),为低延迟语音智能体打造,支持批量与流式转写,按分钟计费。
有免费额度AssemblyAI
语音转文字 API(Universal-3 Pro、Universal-2 和流式模型),将转写与摘要、情感、主题检测和说话人标注等语音智能结合。
热门OpenAI Whisper
OpenAI 的开源语音识别模型家族,支持 99+ 语言,被视为准确率标杆,可免费自托管。
有免费额度Google Cloud Speech-to-Text
Google Cloud 的企业级语音识别 API,语言覆盖广,支持流式与批量转写,依托 Google 基础设施。
新收录ElevenLabs Scribe
ElevenLabs 的语音转文字模型(Scribe v2),用于准确的多语言转写与实时场景,补足其 TTS 平台。
新收录Suno
AI 音乐创作平台,可通过提示词生成歌曲、人声、伴奏和创意音频。
新收录Udio
AI 音乐生成器,用于创作歌曲、器乐灵感、人声和可分享的音频实验。
有免费额度Murf
AI 语音生成器,适合高质量旁白、演示、培训视频、广告和产品讲解。
有免费额度Krisp
AI 会议音频工具,支持降噪、语音清晰化、会议纪要和通话效率提升。
有免费额度Adobe Podcast
Adobe 的 AI 音频工具,用于增强语音、清理录音并提升播客或口播内容质量。
新收录AIVA
AI 音乐作曲平台,适合配乐、器乐和注重授权的作曲流程。
新收录SOUNDRAW
AI 背景音乐生成器,聚焦免版税商业曲目、编辑、分发和 API/企业路径。
新收录Mubert
AI 音乐 API 与生成平台,定位于基于授权/合作内容和更安全的商业背景音乐生成。
新收录OpenAI Realtime API
OpenAI 的实时音频 API,用于构建低延迟语音交互、实时语音对话和多模态智能体体验。
新收录Retell AI
用于构建、测试、部署和监控入站/出站 AI 电话智能体的平台,覆盖电话、工具调用和分析。
新收录Bland AI
企业级语音 AI 平台,用于大规模构建、运行和监控入站/出站 AI 电话智能体。
新收录Rasa Voice
Rasa 的企业级语音体验平台,面向实时对话、话轮控制、打断处理以及 ASR/TTS 供应商取舍。
新收录Inworld
实时语音与 AI 角色平台,提供流式 TTS、STT、声音克隆和 API 层,适合语音优先应用。





