ebook2audiobook – 可完全离线自托管的开源有声书转换工具

使用动态 AI 模型和语音克隆将电子书转换为带有章节和元数据的有声读物。支持1100多种语言!

特性

📖 使用 Calibre 将电子书转换为文本格式。
📚 将电子书按章节分割,方便有序生成音频。
🎙️ 采用 Coqui XTTSv2 和 Fairseq 实现高质量文本转语音转换。
🗣️ 可选语音克隆功能,支持使用自定义语音文件。
🌍 支持 1107 种语言(默认语言为英语)。
🖥️ 适配 4GB 内存设备运行。

安装

  • 4GB 内存
  • 启用虚拟化功能(仅适用于运行在 Windows 上的 Docker)

安装说明

  1. 克隆代码库:
    git clone https://github.com/DrewThomasson/ebook2audiobook.git  
  2. 在运行脚本时指定语言代码。

启动 Gradio Web 界面

运行 ebook2audiobook

  • Linux/MacOS:
    ./ebook2audiobook.sh  # 运行启动脚本  
  • Windows:
    .\ebook2audiobook.cmd  # 运行启动脚本  

打开 Web 应用:
终端中会提供一个 URL,点击该链接即可访问 Web 应用并转换电子书。

生成公共链接:
在命令末尾添加 --share,例如:

python app.py --share  

查看更多参数:
使用 --help 参数,例如:

python app.py --help  

基本用法

Linux/MacOS:

./ebook2audiobook.sh -- --ebook <电子书文件路径> --voice [语音文件路径] --language [语言代码]  

Windows:

.\ebook2audiobook.cmd -- --ebook <电子书文件路径> --voice [语音文件路径] --language [语言代码]  
  • <电子书文件路径>: 电子书文件路径。
  • [语音文件路径]: 可选,用于语音克隆的语音文件路径。
  • [语言代码]: 可选,指定 ISO-639-3 的 3+ 字母语言代码(默认值为 eng)。也支持 ISO-639-1 的 2 字母代码。
  • 查看更多参数:
    python app.py --help  

自定义 XTTS 模型使用

Linux/MacOS:

./ebook2audiobook.sh -- --ebook <电子书文件路径> --voice <目标语音文件路径> --language <语言代码> --custom_model <模型文件路径> --custom_config <配置文件路径> --custom_vocab <词汇表路径>  

Windows:

.\ebook2audiobook.cmd -- --ebook <电子书文件路径> --voice <目标语音文件路径> --language <语言代码> --custom_model <模型文件路径> --custom_config <配置文件路径> --custom_vocab <词汇表路径>  
  • <电子书文件路径>: 电子书文件路径。
  • <目标语音文件路径>: 可选,用于语音克隆的语音文件路径。
  • <语言代码>: 可选,指定语言代码。
  • <模型文件路径>: 模型文件 model.pth 的路径。
  • <配置文件路径>: 配置文件 config.json 的路径。
  • <词汇表路径>: 词汇表文件 vocab.json 的路径。

查看更多参数:

python app.py --help  

参考链接

Comments

No comments yet. Why don’t you start the discussion?

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注