Audiblez – 支持中文的开源电子书转有声书的利器

Audiblez 是一款免费的开源工具,旨在将 EPUB 电子书转换为 M4B 格式的有声书,这是一种广泛使用的有声书格式。它基于 Kokoro-82M 文本转语音模型,这个轻量级模型仅有 8200 万参数,用不到 100 小时的音频数据训练而成。尽管模型较小,它仍能提供清晰、自然的多语言朗读效果。

file

特性

  • 高质量朗读:Kokoro-82M 模型生成出色的语音输出,媲美更复杂的替代方案。

  • 多语言支持:支持英语(美式和英式)、西班牙语、法语、印地语、意大利语、日语、巴西葡萄牙语和中文等多种语言。

  • 灵活转换:可转换整本书或选择特定章节生成有声书。

  • 性能选项:默认使用 CPU 运行,若有兼容硬件,可通过 CUDA 启用 GPU 加速以提升速度。

  • 开源自由:采用 MIT 许可证,免费使用、修改和分发。

功能

Audiblez 将 EPUB 文件转化为 M4B 有声书文件,您可以自定义体验:

  • 从多种朗读声音中选择。

  • 调整语速(0.5x 至 2.0x)。

  • 使用 --pick 选项,通过交互模式手动选择需要的章节。

转换速度取决于硬件:

  • 在 Google Colab T4 GPU 上,转换《动物农庄》(约 16 万字符)只需 5 分钟。

  • 在 MacBook Pro M2 芯片(仅 CPU) 上,同一本书需约 1 小时。

对于喜欢图形界面的用户,Audiblez 还提供 GUI 版本,通过 audiblez-ui 命令启动。

安装

  1. 准备环境
    • 确保安装 Python 3。
    • 安装依赖 espeak-ngffmpeg,Ubuntu/Debian 系统运行:
      sudo apt install ffmpeg espeak-ng
  2. 安装 Audiblez
    • 使用 pip 安装:
      pip install audiblez
  3. 下载模型文件
    • 获取 Kokoro 模型和语音配置:
      wget https://github.com/thewh1teagle/kokoro-onnx/releases/download/model-files/kokoro-v0_19.onnx
      wget https://github.com/thewh1teagle/kokoro-onnx/releases/download/model-files/voices.json
    • 将文件放入工作目录。
  4. 运行工具
    • 转换电子书:
      audiblez your_book.epub
    • 若有 GPU,添加 --cuda 加速。
    • 使用 GUI:
      audiblez-ui

参考链接

Comments

No comments yet. Why don’t you start the discussion?

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注