LaTeX OCR – 基于深度学习的开源工具,能够高效地将数学公式图像识别为精确的 LaTeX 代码

 一款基于深度学习的开源工具,能够高效地将数学公式图像识别为精确的 LaTeX 代码。它为科研人员和学术作者提供了一种便捷的方式,显著加快了 LaTeX 文档的编撰速度。

安装

要运行模型需要 Python 3.7 以上版本。

如果没有安装 PyTorch,请按照其官方说明进行安装。

安装 pix2tex 包:

pip install "pix2tex[gui]"

模型检查点将自动下载。

有三种方法从图像中获取预测:

  1. 命令行工具:使用 pix2tex 解析磁盘或剪贴板中的图像。
  2. 图形用户界面 (GUI):调用 latexocr 启动界面,截图并将预测的 LaTeX 代码复制到剪贴板。
  3. API:安装并运行 API,通过 Streamlit 演示或 Docker 容器使用。

此外,模型对分辨率敏感,使用较小分辨率图像效果更好。如果结果不准确,您可以尝试调整图像分辨率重新进行预测。

官方链接

Comments

No comments yet. Why don’t you start the discussion?

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注