M
MCP Parse Document
作者 @tianfn
这是一个MCP(Model Communication Protocol)工具,用于帮助解析各种格式的文档(PDF、Word、Excel、PPT等)获取其内容。该工具提供了简单易用的接口,使您能够在各种应用中集成文档解析功能。
创建于 12/16/2025
更新于 about 15 hours ago
README
Repository documentation and setup instructions
MCP Document Parse Tool
项目介绍
这是一个MCP(Model Communication Protocol)工具,用于帮助解析各种格式的文档(PDF、Word、Excel、PPT等)获取其内容。该工具提供了简单易用的接口,使您能够在各种应用中集成文档解析功能。
支持的文件格式
- PDF (.pdf)
- Word (.doc, .docx)
- Excel (.xls, .xlsx)
- PowerPoint (.ppt, .pptx)
安装方法
使用 uv 安装并启动发布版
uv tool install mcp-document-parse
环境变量
NIUTRANS_API_KEY(必填):小牛翻译开放平台提供文档API的 API Key,可免费使用, 请登录后获取:https://niutrans.com/cloud/api/listNIUTRANS_DOCUMENT_APPID(必填):小牛翻译开放平台提供文档API的 APPID,可免费使用, 请登录后获取:https://niutrans.com/cloud/api/list
环境要求
- Python >= 3.9
- 依赖项已在
pyproject.toml中定义
MCP 客户端配置示例
若通过 uv tool install 安装,可在 mcp.json 中配置:
{
"mcpServers": {
"document_parse": {
"type": "stdio",
"command": "uv",
"args": [
"tool",
"run",
"mcp-document-parse"
],
"env": {
"NIUTRANS_API_KEY": "${env.NIUTRANS_API_KEY}",
"NIUTRANS_DOCUMENT_APPID": "${env.NIUTRANS_DOCUMENT_APPID}"
}
}
}
}
启动支持MCP的应用后,执行 ListTools 即可看到 parse_document_by_path 工具,同时支持 ListResources 读取 document://supported-types。
工具说明
parse_document_by_path
将指定路径的文件转换为Markdown格式。
参数:
file_path(str): 文件的绝对路径,支持pdf、doc、docx、xls、xlsx、ppt、pptx格式
返回:
- 成功:
{"status": "success", "text_content": "文件内容", "filename": 文件名} - 失败:
{"status": "error", "error": "错误信息"}
document://supported-types
获取支持的文件类型信息。
返回:
- 包含支持的文件类型列表及其描述的JSON对象
许可证
MIT License
联系方式
如有问题或建议,请联系 tianfengning@niutrans.com
快速设置
此服务器的安装指南
安装包 (如果需要)
uvx mcp-parse-document
Cursor 配置 (mcp.json)
{
"mcpServers": {
"tianfn-mcp-parse-document": {
"command": "uvx",
"args": [
"mcp-parse-document"
]
}
}
}