MCP server for MiMo V2.5 vision capabilities - image, video, audio analysis
MiMo Vision MCP Server
让 Claude Code 具备图片、视频、音频分析能力的 MCP 服务器,基于小米 MiMo V2.5 多模态模型。
为什么需要这个 MCP
在 Claude Code 中使用 MiMo 模型时,你一定遇到过这些问题:
| 问题 | 影响 | |---|---| | MiMo Pro 编码能力强,但不支持多模态 | 强行让它识别图片/视频/音频会卡死或崩溃 | | MiMo V2.5 支持多模态,但编码能力不如 Pro | 为了看一张图就要切换模型,代码能力打折扣 | | 来回切换模型会丢失上下文 | 和 Pro 聊到一半的代码逻辑、项目背景全部清零,又要重新解释 |
本 MCP 的解决方案: Pro 继续写代码,通过 MCP 调用 V2.5 的多模态能力。分析结果直接返回到当前对话中,不切换模型、不丢上下文、两个模型各司其职。
┌─────────────┐ MCP 调用 ┌──────────────┐
│ Claude Code │ ──────────────> │ MiMo V2.5 │
│ (Pro 写代码) │ <────────────── │ (多模态分析) │
└─────────────┘ 返回结果 └──────────────┘
不用切换模型,上下文完整保留
功能一览
| 工具 | 说明 | 示例场景 |
|---|---|---|
| analyze_image | 图片分析(OCR、描述、理解) | 识别截图中的文字、描述电路图、分析 UI 设计稿 |
| analyze_video | 视频内容分析与场景描述 | 分析监控录像、理解操作录屏、描述产品演示 |
| analyze_audio | 音频识别与语音转录 | 转录会议录音、识别语音指令 |
| compare_images | 多图对比分析 | 对比设计稿差异、对比两张截图的变化 |
| analyze_multimodal | 图片+视频+音频混合分析 | 同时分析多种媒体文件的综合内容 |
支持的文件格式
| 类型 | 格式 |
|---|---|
| 图片 | .jpg .jpeg .png .gif .bmp .webp |
| 视频 | .mp4 .avi .mov .mkv .webm |
| 音频 | .mp3 .wav .flac .ogg .aac |
快速开始
1. 获取 API Key
- 访问 小米 MiMo 平台
- 注册并登录
- 在 API Keys 页面创建密钥
2. 配置 Claude Code
编辑项目根目录下的 .mcp.json 文件(没有就新建):
{
"mcpServers": {
"mimo-vision": {
"command": "npx",
"args": ["-y", "mimo-vision-mcp"],
"env": {
"MIMO_API_KEY": "你的API密钥"
}
}
}
}
或者添加到全局配置(所有项目生效),编辑 ~/.claude/settings.json:
{
"mcpServers": {
"mimo-vision": {
"command": "npx",
"args": ["-y", "mimo-vision-mcp"],
"env": {
"MIMO_API_KEY": "你的API密钥"
}
}
}
}
3. 验证安装
在 Claude Code 中输入:
/mcp
如果看到 mimo-vision 出现在列表中且状态为绿色,说明安装成功。
4. 开始使用
直接在 Claude Code 对话中使用即可,Claude 会自动调用 MCP 工具:
你:帮我看看这张截图里写了什么
Claude:[调用 analyze_image] 截图中显示的是...
你:这个视频讲了什么内容
Claude:[调用 analyze_video] 视频展示了...
你:对比一下这两张设计稿有什么不同
Claude:[调用 compare_images] 主要差异有以下几点...
其他安装方式
全局安装
npm install -g mimo-vision-mcp
配置中 command 改为 "mimo-vision-mcp",不再需要 args:
{
"mcpServers": {
"mimo-vision": {
"command": "mimo-vision-mcp",
"env": {
"MIMO_API_KEY": "你的API密钥"
}
}
}
}
本地克隆
git clone https://github.com/yzndx/mimo-vision-mcp.git
cd mimo-vision-mcp
npm install
配置中指定本地路径:
{
"mcpServers": {
"mimo-vision": {
"command": "node",
"args": ["D:/mimo-vision-mcp/index.js"],
"env": {
"MIMO_API_KEY": "你的API密钥"
}
}
}
}
环境变量
| 变量 | 必填 | 默认值 | 说明 |
|---|---|---|---|
| MIMO_API_KEY | 是 | - | MiMo API 密钥 |
| MIMO_BASE_URL | 否 | https://token-plan-cn.xiaomimimo.com/v1 | API 地址,国内用户无需修改 |
| MIMO_MODEL | 否 | mimo-v2.5 | 模型名称 |
常见问题
Q: MCP 显示红色/连接失败?
A: 检查 MIMO_API_KEY 是否正确设置,确认网络能访问 platform.xiaomimimo.com。
Q: 分析大文件时报错? A: 文件会转为 base64 传输,过大的文件(如几百 MB 的视频)可能导致内存不足。建议压缩后再分析。
Q: Pro 模型能直接用吗? A: 不能。Pro 不支持多模态,强行调用会卡死。这正是本 MCP 存在的意义——让 Pro 通过 MCP 借用 V2.5 的多模态能力。
Q: 和直接切换到 V2.5 有什么区别? A: 切换模型会丢失当前对话上下文。通过 MCP 调用,Pro 的对话历史完整保留,分析结果直接回到对话中。
许可证
MIT