精选 AI 工具目录

全部 AI 工具

覆盖写作、图像、视频、办公、编程和搜索等场景的 AI 工具导航。

搜索结果

完整目录保留筛选能力,但视觉上不再压过搜索、分类和决策入口。

全部分类热门优先有免费额度最近更新
已显示 24 个工具
ElevenLabs logo热门

ElevenLabs

AI 语音平台,支持文本转语音、声音克隆、配音、旁白和多语言音频生成。

有免费额度文本转语音
Fish Audio logo新收录

Fish Audio

低成本文本转语音平台,提供开源权重的短样本声音克隆、细粒度情感控制和 80+ 语言支持。

有免费额度文本转语音
Cartesia logo新收录

Cartesia

超低延迟文本转语音 API(Sonic),为实时对话语音智能体打造,按字符计费并支持即时声音克隆。

有免费额度实时 TTS
OpenAI TTS logo~$15/1M chars

OpenAI TTS

OpenAI 的文本转语音 API,提供预设自然音色与可引导语气,按 token/字符计费,不支持声音克隆。

~$15/1M chars文本转语音
Azure AI Speech(TTS) logo有免费额度

Azure AI Speech(TTS)

微软 Azure 的企业级文本转语音,支持 100+ 语言和区域、神经与 HD 音色、定制语音选项、Speech SDK/REST 接入,以及合规级基础设施。

有免费额度企业 TTS
Chatterbox(Resemble AI) logo新收录

Chatterbox(Resemble AI)

Resemble AI 推出的开源(MIT)文本转语音模型家族,可用几秒音频克隆音色、质量有竞争力,且可免费商用。

有免费额度开源 TTS
Deepgram logo热门

Deepgram

实时语音转文字平台(Nova/Flux),为低延迟语音智能体打造,支持批量与流式转写,按分钟计费。

有免费额度语音转文字
AssemblyAI logo有免费额度

AssemblyAI

语音转文字 API(Universal-3 Pro、Universal-2 和流式模型),将转写与摘要、情感、主题检测和说话人标注等语音智能结合。

有免费额度语音转文字
OpenAI Whisper logo热门

OpenAI Whisper

OpenAI 的开源语音识别模型家族,支持 99+ 语言,被视为准确率标杆,可免费自托管。

有免费额度语音转文字
Google Cloud Speech-to-Text logo有免费额度

Google Cloud Speech-to-Text

Google Cloud 的企业级语音识别 API,语言覆盖广,支持流式与批量转写,依托 Google 基础设施。

有免费额度语音转文字
ElevenLabs Scribe logo新收录

ElevenLabs Scribe

ElevenLabs 的语音转文字模型(Scribe v2),用于准确的多语言转写与实时场景,补足其 TTS 平台。

有免费额度语音转文字
Suno logo新收录

Suno

AI 音乐创作平台,可通过提示词生成歌曲、人声、伴奏和创意音频。

有免费额度AI 音乐
Udio logo新收录

Udio

AI 音乐生成器,用于创作歌曲、器乐灵感、人声和可分享的音频实验。

有免费额度音乐生成
Murf logo有免费额度

Murf

AI 语音生成器,适合高质量旁白、演示、培训视频、广告和产品讲解。

有免费额度旁白
Krisp logo有免费额度

Krisp

AI 会议音频工具,支持降噪、语音清晰化、会议纪要和通话效率提升。

有免费额度降噪
Adobe Podcast logo有免费额度

Adobe Podcast

Adobe 的 AI 音频工具,用于增强语音、清理录音并提升播客或口播内容质量。

有免费额度语音增强
AIVA logo新收录

AIVA

AI 音乐作曲平台,适合配乐、器乐和注重授权的作曲流程。

有免费额度AI 作曲
SOUNDRAW logo新收录

SOUNDRAW

AI 背景音乐生成器,聚焦免版税商业曲目、编辑、分发和 API/企业路径。

Paid plans背景音乐
Mubert logo新收录

Mubert

AI 音乐 API 与生成平台,定位于基于授权/合作内容和更安全的商业背景音乐生成。

API tiers音乐 API
OpenAI Realtime API logo新收录

OpenAI Realtime API

OpenAI 的实时音频 API,用于构建低延迟语音交互、实时语音对话和多模态智能体体验。

查看价格实时音频
Retell AI logo新收录

Retell AI

用于构建、测试、部署和监控入站/出站 AI 电话智能体的平台,覆盖电话、工具调用和分析。

查看价格AI 电话智能体
Bland AI logo新收录

Bland AI

企业级语音 AI 平台,用于大规模构建、运行和监控入站/出站 AI 电话智能体。

查看价格语音 AI
Rasa Voice logo新收录

Rasa Voice

Rasa 的企业级语音体验平台,面向实时对话、话轮控制、打断处理以及 ASR/TTS 供应商取舍。

查看价格企业语音
Inworld logo新收录

Inworld

实时语音与 AI 角色平台,提供流式 TTS、STT、声音克隆和 API 层,适合语音优先应用。

查看价格实时语音