7 CLI工具
7.1 简介
CLI工具是一种命令行工具,可以通过命令行方式进行操作。对于大部分IDE工具,例如Cursor IDE,都可以通过CLI工具进行操作。很多开发者会在网上分享一些CLI工具的安装和使用方法,成为开源社区的一部分。
CLI工具可以执行多种类型的语言命令,例如Python、JavaScript、TypeScript等。因此,理论上只要用户安装了对应CLI工具所需的程序语言、程序包、环境和依赖库,就可以执行对应的CLI语言命令。
7.2 MathPix CLI工具
Mathpix https://mathpix.com/ 提供快速精准的 PDF 和图像转换为可搜索、可导出、可机读文本的解决方案,适用于开发者和研究人员。开发者可通过集成 OCR 技术,实现包括数学、化学、手写、表格、外语及完整 PDF 文档转换等功能。
Mathpix 支持完整 PDF 转换为 Markdown/LaTeX,并对手写文本、表格等提供高精度支持。Mathpix 提供多种转换功能,包括 PDF 转 DOCX、Excel、Google Sheets、HTML、LaTeX 等。
Mathpix CLI工具特别适用于:
- 学术研究:将PDF论文转换为可编辑的Markdown或LaTeX格式
- 文档处理:批量处理包含数学公式的文档
- 内容迁移:将纸质文档数字化
- 格式转换:在不同文档格式间进行转换
- 自动化工作流:集成到CI/CD流程中进行文档处理
通过Mathpix CLI工具,开发者可以在IDE中直接处理包含数学公式、表格和复杂格式的文档,大大提高了工作效率。
用户可以使用多种方式使用Mathpix,包括:
- 使用Mathpix官网的在线转换功能;
- 使用Mathpix CLI工具;
- 使用Mathpix API;
7.2.1 Mathpix CLI工具安装
为了更方便地在IDE工具(例如Cursor IDE、VS Code等)中使用Mathpix,可以使用Mathpix CLI工具。
Mathpix CLI工具的github仓库:mathpix-cli。
根据官方文档说明,安装Mathpix CLI工具的步骤如下:
- 全局安装Mathpix CLI工具
npm install -g @mathpix/mpx-cli- 登录Mathpix账户
首先在 https://accounts.mathpix.com 注册账户,然后运行登录命令:
mpx login系统会要求输入Mathpix邮箱和密码,然后保存授权令牌用于后续操作(对于windows用户,会保存在c:<username>.mpx-cli)。
- 设置API密钥(可选)
也可以使用Mathpix API账户,从 https://accounts.mathpix.com/ocr-api 创建API密钥,然后设置环境变量:
export MATHPIX_OCR_API_KEY=your_api_key_here或者永久保存到配置文件中:
mpx set-api-key your_api_key_here7.2.2 主要功能和使用方法
- PDF文档转换
将PDF文件转换为可编辑的Mathpix Markdown、DOCX、HTML或LaTeX格式:
# PDF转Markdown
mpx convert input-file.pdf output-file.mmd
# PDF转DOCX
mpx convert input-file.pdf output-file.docx
# PDF转LaTeX
mpx convert input-file.pdf output-file.tex
# PDF转HTML
mpx convert input-file.pdf output-file.html- 图像文件转换
将图像文件转换为可编辑格式:
# 图像转Markdown
mpx convert input-file.png output-file.mmd
mpx convert input-file.jpeg output-file.mmd
# 图像转DOCX
mpx convert input-file.png output-file.docx
# 图像转LaTeX
mpx convert input-file.jpeg output-file.tex
# 图像转HTML
mpx convert input-file.png output-file.html- Markdown文件编译
编译Markdown文件为其他格式(无需使用Mathpix OCR):
# Markdown转DOCX
mpx convert input-file.mmd output-file.docx
# Markdown转LaTeX
mpx convert input-file.mmd output-file.tex
# Markdown转HTML
mpx convert input-file.mmd output-file.html
# Markdown转PDF
mpx convert input-file.mmd output-file.pdf
mpx convert input-file.mmd output-file.pdf --pdf-method html- 本地服务器预览
在本地服务器上预览渲染的HTML文件:
# 预览整个目录
mpx serve ./input-dir
# 预览单个文件
mpx serve ./input-dir/example.mmd- 静态网站构建
将Markdown文件目录构建为静态HTML网站:
mpx build ./input-dir ./output-dir- 常用命令
查看所有可用命令和选项:
mpx --help主要命令包括: - build - 构建静态HTML网站 - convert - 文件格式转换 - serve - 本地服务器预览 - set-api-key - 设置API密钥 - unset-api-key - 移除API密钥 - login - 登录账户 - logout - 登出账户