ebook2audiobook - 可完全离线自托管的开源有声书转换工具

使用动态 AI 模型和语音克隆将电子书转换为带有章节和元数据的有声读物。支持1100多种语言！

特性

📖 使用 Calibre 将电子书转换为文本格式。
📚 将电子书按章节分割，方便有序生成音频。
🎙️ 采用 Coqui XTTSv2 和 Fairseq 实现高质量文本转语音转换。
🗣️ 可选语音克隆功能，支持使用自定义语音文件。
🌍 支持 1107 种语言（默认语言为英语）。
🖥️ 适配 4GB 内存设备运行。

安装

4GB 内存
启用虚拟化功能（仅适用于运行在 Windows 上的 Docker）

安装说明

克隆代码库：

git clone https://github.com/DrewThomasson/ebook2audiobook.git

在运行脚本时指定语言代码。

启动 Gradio Web 界面

运行 ebook2audiobook：

Linux/MacOS:

./ebook2audiobook.sh  # 运行启动脚本

Windows:

.\ebook2audiobook.cmd  # 运行启动脚本

打开 Web 应用：
终端中会提供一个 URL，点击该链接即可访问 Web 应用并转换电子书。

生成公共链接：
在命令末尾添加 --share，例如：

python app.py --share

查看更多参数：
使用 --help 参数，例如：

python app.py --help

基本用法

Linux/MacOS:

./ebook2audiobook.sh -- --ebook <电子书文件路径> --voice [语音文件路径] --language [语言代码]

Windows:

.\ebook2audiobook.cmd -- --ebook <电子书文件路径> --voice [语音文件路径] --language [语言代码]

<电子书文件路径>: 电子书文件路径。
[语音文件路径]: 可选，用于语音克隆的语音文件路径。
[语言代码]: 可选，指定 ISO-639-3 的 3+ 字母语言代码（默认值为 eng）。也支持 ISO-639-1 的 2 字母代码。
查看更多参数：
```
python app.py --help  
```

自定义 XTTS 模型使用

Linux/MacOS:

./ebook2audiobook.sh -- --ebook <电子书文件路径> --voice <目标语音文件路径> --language <语言代码> --custom_model <模型文件路径> --custom_config <配置文件路径> --custom_vocab <词汇表路径>

Windows:

.\ebook2audiobook.cmd -- --ebook <电子书文件路径> --voice <目标语音文件路径> --language <语言代码> --custom_model <模型文件路径> --custom_config <配置文件路径> --custom_vocab <词汇表路径>

<电子书文件路径>: 电子书文件路径。
<目标语音文件路径>: 可选，用于语音克隆的语音文件路径。
<语言代码>: 可选，指定语言代码。
<模型文件路径>: 模型文件 model.pth 的路径。
<配置文件路径>: 配置文件 config.json 的路径。
<词汇表路径>: 词汇表文件 vocab.json 的路径。

查看更多参数：

python app.py --help

参考链接

GitHub 仓库

ebook2audiobook – 可完全离线自托管的开源有声书转换工具

特性

安装

安装说明

启动 Gradio Web 界面

基本用法

自定义 XTTS 模型使用

参考链接

相关

Comments

发表回复取消回复

AI Hedge Fund – 探索 AI 驱动的对冲基金概念验证

LangBot – 开源多语言交互机器人

LEDE – 高性能开源路由器固件平台

FileCodeBox – 简洁高效的文件代码管理工具

特性

安装

安装说明

启动 Gradio Web 界面

基本用法

自定义 XTTS 模型使用

参考链接

相关

Comments

发表回复 取消回复

AI Hedge Fund – 探索 AI 驱动的对冲基金概念验证

LangBot – 开源多语言交互机器人

LEDE – 高性能开源路由器固件平台

FileCodeBox – 简洁高效的文件代码管理工具

发表回复取消回复