Edge-TTS-Text-to-Speech-2.0 为无显卡的小伙伴打造的AI语音生成工具,小巧,免费,无字数限制,速度快

一、核心功能

表格

功能说明
文本转语音使用微软 Edge TTS 引擎,将输入文本转换为自然流畅的 MP3 音频
长文本支持自动分段处理(每段 ≤800 字符),支持超长文本合成
音频合并自动将分段音频合并为单一文件输出
多国语言支持中文、英语、日语、韩语、法语、德语等数十种语言

二、语音选择系统

两级联动选择:

  1. 选择国家/地区 – 带国旗标识,如 🇨🇳 中文(中国)、🇺🇸 英语(美国)、🇯🇵 日语
  2. 选择具体语音 – 显示该地区的可用语音及性别,如 Xiaoxiao (Female)、Yunyang (Male)

智能排序: 中文优先显示,其他语言按常用程度排列


三、音频参数调节


四、文件管理

  • 输出目录: output/ 文件夹
  • 命名格式: 日期_随机数.mp3(如 20260331_143022_a1b2c3.mp3)
  • 自动清理: 合并完成后自动删除临时分段文件

五、稳定性保障

  • 重试机制: 单段合成失败自动重试 5 次
  • 错误处理: 某段失败时自动清理已生成的临时文件
  • 依赖检查: 自动检测 pydub,未安装时给出友好提示

六、界面特性

  • 简洁的 Gradio 网页界面
  • 实时错误提示显示
  • 音频播放控件(生成后可直接试听)
  • 底部显示项目来源链接(剑二十七二次开发)

七、典型使用场景

  1. 短视频配音 – 快速生成中文或外文解说音频
  2. 有声读物 – 将长篇文章转为语音朗读
  3. 多语言内容 – 一键切换生成不同国家语言的语音
  4. 语音调试 – 调节语速音调,找到最佳朗读效果

技术基础: 基于微软 Edge TTS 在线服务,无需本地模型,即开即用。

image-20260603203308665
image-20260603203321202

工具说明

1 解压即可使用,无需安装任何东西

2 调用的是微软的 Edge TTS 免费 无限制

3 人气高就继续开发

20260526 更新记录

1 新增字幕生成

2 新增历史记录

3 修正部分bug

下载地址

© 版权声明
THE END
喜欢就支持一下吧
点赞15 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容