使用动态 AI 模型和语音克隆将电子书转换为带有章节和元数据的有声读物。支持1100多种语言!
特性
📖 使用 Calibre 将电子书转换为文本格式。
📚 将电子书按章节分割,方便有序生成音频。
🎙️ 采用 Coqui XTTSv2 和 Fairseq 实现高质量文本转语音转换。
🗣️ 可选语音克隆功能,支持使用自定义语音文件。
🌍 支持 1107 种语言(默认语言为英语)。
🖥️ 适配 4GB 内存设备运行。
安装
- 4GB 内存
- 启用虚拟化功能(仅适用于运行在 Windows 上的 Docker)
安装说明
- 克隆代码库:
git clone https://github.com/DrewThomasson/ebook2audiobook.git
- 在运行脚本时指定语言代码。
启动 Gradio Web 界面
运行 ebook2audiobook
:
- Linux/MacOS:
./ebook2audiobook.sh # 运行启动脚本
- Windows:
.\ebook2audiobook.cmd # 运行启动脚本
打开 Web 应用:
终端中会提供一个 URL,点击该链接即可访问 Web 应用并转换电子书。
生成公共链接:
在命令末尾添加 --share
,例如:
python app.py --share
查看更多参数:
使用 --help
参数,例如:
python app.py --help
基本用法
Linux/MacOS:
./ebook2audiobook.sh -- --ebook <电子书文件路径> --voice [语音文件路径] --language [语言代码]
Windows:
.\ebook2audiobook.cmd -- --ebook <电子书文件路径> --voice [语音文件路径] --language [语言代码]
<电子书文件路径>
: 电子书文件路径。[语音文件路径]
: 可选,用于语音克隆的语音文件路径。[语言代码]
: 可选,指定 ISO-639-3 的 3+ 字母语言代码(默认值为eng
)。也支持 ISO-639-1 的 2 字母代码。- 查看更多参数:
python app.py --help
自定义 XTTS 模型使用
Linux/MacOS:
./ebook2audiobook.sh -- --ebook <电子书文件路径> --voice <目标语音文件路径> --language <语言代码> --custom_model <模型文件路径> --custom_config <配置文件路径> --custom_vocab <词汇表路径>
Windows:
.\ebook2audiobook.cmd -- --ebook <电子书文件路径> --voice <目标语音文件路径> --language <语言代码> --custom_model <模型文件路径> --custom_config <配置文件路径> --custom_vocab <词汇表路径>
<电子书文件路径>
: 电子书文件路径。<目标语音文件路径>
: 可选,用于语音克隆的语音文件路径。<语言代码>
: 可选,指定语言代码。<模型文件路径>
: 模型文件model.pth
的路径。<配置文件路径>
: 配置文件config.json
的路径。<词汇表路径>
: 词汇表文件vocab.json
的路径。
查看更多参数:
python app.py --help