Audiblez 是一款免费的开源工具,旨在将 EPUB 电子书转换为 M4B 格式的有声书,这是一种广泛使用的有声书格式。它基于 Kokoro-82M 文本转语音模型,这个轻量级模型仅有 8200 万参数,用不到 100 小时的音频数据训练而成。尽管模型较小,它仍能提供清晰、自然的多语言朗读效果。
特性
-
高质量朗读:Kokoro-82M 模型生成出色的语音输出,媲美更复杂的替代方案。
-
多语言支持:支持英语(美式和英式)、西班牙语、法语、印地语、意大利语、日语、巴西葡萄牙语和中文等多种语言。
-
灵活转换:可转换整本书或选择特定章节生成有声书。
-
性能选项:默认使用 CPU 运行,若有兼容硬件,可通过 CUDA 启用 GPU 加速以提升速度。
-
开源自由:采用 MIT 许可证,免费使用、修改和分发。
功能
Audiblez 将 EPUB 文件转化为 M4B 有声书文件,您可以自定义体验:
-
从多种朗读声音中选择。
-
调整语速(0.5x 至 2.0x)。
-
使用 --pick 选项,通过交互模式手动选择需要的章节。
转换速度取决于硬件:
-
在 Google Colab T4 GPU 上,转换《动物农庄》(约 16 万字符)只需 5 分钟。
-
在 MacBook Pro M2 芯片(仅 CPU) 上,同一本书需约 1 小时。
对于喜欢图形界面的用户,Audiblez 还提供 GUI 版本,通过 audiblez-ui 命令启动。
安装
- 准备环境:
- 确保安装 Python 3。
- 安装依赖
espeak-ng
和ffmpeg
,Ubuntu/Debian 系统运行:sudo apt install ffmpeg espeak-ng
- 安装 Audiblez:
- 使用 pip 安装:
pip install audiblez
- 使用 pip 安装:
- 下载模型文件:
- 获取 Kokoro 模型和语音配置:
wget https://github.com/thewh1teagle/kokoro-onnx/releases/download/model-files/kokoro-v0_19.onnx wget https://github.com/thewh1teagle/kokoro-onnx/releases/download/model-files/voices.json
- 将文件放入工作目录。
- 获取 Kokoro 模型和语音配置:
- 运行工具:
- 转换电子书:
audiblez your_book.epub
- 若有 GPU,添加
--cuda
加速。 - 使用 GUI:
audiblez-ui
- 转换电子书: