MCP Servers

A collection of Model Context Protocol servers, templates, tools and more.

M
Mimo Vision MCP

MCP server for MiMo V2.5 vision capabilities - image, video, audio analysis

Created 5/27/2026
Updated about 2 hours ago
Repository documentation and setup instructions

MiMo Vision MCP Server

让 Claude Code 具备图片、视频、音频分析能力的 MCP 服务器,基于小米 MiMo V2.5 多模态模型。

为什么需要这个 MCP

在 Claude Code 中使用 MiMo 模型时,你一定遇到过这些问题:

| 问题 | 影响 | |---|---| | MiMo Pro 编码能力强,但不支持多模态 | 强行让它识别图片/视频/音频会卡死或崩溃 | | MiMo V2.5 支持多模态,但编码能力不如 Pro | 为了看一张图就要切换模型,代码能力打折扣 | | 来回切换模型会丢失上下文 | 和 Pro 聊到一半的代码逻辑、项目背景全部清零,又要重新解释 |

本 MCP 的解决方案: Pro 继续写代码,通过 MCP 调用 V2.5 的多模态能力。分析结果直接返回到当前对话中,不切换模型、不丢上下文、两个模型各司其职。

┌─────────────┐    MCP 调用     ┌──────────────┐
│ Claude Code │ ──────────────> │ MiMo V2.5   │
│ (Pro 写代码) │ <────────────── │ (多模态分析)  │
└─────────────┘    返回结果     └──────────────┘
     不用切换模型,上下文完整保留

功能一览

| 工具 | 说明 | 示例场景 | |---|---|---| | analyze_image | 图片分析(OCR、描述、理解) | 识别截图中的文字、描述电路图、分析 UI 设计稿 | | analyze_video | 视频内容分析与场景描述 | 分析监控录像、理解操作录屏、描述产品演示 | | analyze_audio | 音频识别与语音转录 | 转录会议录音、识别语音指令 | | compare_images | 多图对比分析 | 对比设计稿差异、对比两张截图的变化 | | analyze_multimodal | 图片+视频+音频混合分析 | 同时分析多种媒体文件的综合内容 |

支持的文件格式

| 类型 | 格式 | |---|---| | 图片 | .jpg .jpeg .png .gif .bmp .webp | | 视频 | .mp4 .avi .mov .mkv .webm | | 音频 | .mp3 .wav .flac .ogg .aac |

快速开始

1. 获取 API Key

  1. 访问 小米 MiMo 平台
  2. 注册并登录
  3. 在 API Keys 页面创建密钥

2. 配置 Claude Code

编辑项目根目录下的 .mcp.json 文件(没有就新建):

{
  "mcpServers": {
    "mimo-vision": {
      "command": "npx",
      "args": ["-y", "mimo-vision-mcp"],
      "env": {
        "MIMO_API_KEY": "你的API密钥"
      }
    }
  }
}

或者添加到全局配置(所有项目生效),编辑 ~/.claude/settings.json

{
  "mcpServers": {
    "mimo-vision": {
      "command": "npx",
      "args": ["-y", "mimo-vision-mcp"],
      "env": {
        "MIMO_API_KEY": "你的API密钥"
      }
    }
  }
}

3. 验证安装

在 Claude Code 中输入:

/mcp

如果看到 mimo-vision 出现在列表中且状态为绿色,说明安装成功。

4. 开始使用

直接在 Claude Code 对话中使用即可,Claude 会自动调用 MCP 工具:

你:帮我看看这张截图里写了什么
Claude:[调用 analyze_image] 截图中显示的是...

你:这个视频讲了什么内容
Claude:[调用 analyze_video] 视频展示了...

你:对比一下这两张设计稿有什么不同
Claude:[调用 compare_images] 主要差异有以下几点...

其他安装方式

全局安装

npm install -g mimo-vision-mcp

配置中 command 改为 "mimo-vision-mcp",不再需要 args

{
  "mcpServers": {
    "mimo-vision": {
      "command": "mimo-vision-mcp",
      "env": {
        "MIMO_API_KEY": "你的API密钥"
      }
    }
  }
}

本地克隆

git clone https://github.com/yzndx/mimo-vision-mcp.git
cd mimo-vision-mcp
npm install

配置中指定本地路径:

{
  "mcpServers": {
    "mimo-vision": {
      "command": "node",
      "args": ["D:/mimo-vision-mcp/index.js"],
      "env": {
        "MIMO_API_KEY": "你的API密钥"
      }
    }
  }
}

环境变量

| 变量 | 必填 | 默认值 | 说明 | |---|---|---|---| | MIMO_API_KEY | | - | MiMo API 密钥 | | MIMO_BASE_URL | 否 | https://token-plan-cn.xiaomimimo.com/v1 | API 地址,国内用户无需修改 | | MIMO_MODEL | 否 | mimo-v2.5 | 模型名称 |

常见问题

Q: MCP 显示红色/连接失败? A: 检查 MIMO_API_KEY 是否正确设置,确认网络能访问 platform.xiaomimimo.com

Q: 分析大文件时报错? A: 文件会转为 base64 传输,过大的文件(如几百 MB 的视频)可能导致内存不足。建议压缩后再分析。

Q: Pro 模型能直接用吗? A: 不能。Pro 不支持多模态,强行调用会卡死。这正是本 MCP 存在的意义——让 Pro 通过 MCP 借用 V2.5 的多模态能力。

Q: 和直接切换到 V2.5 有什么区别? A: 切换模型会丢失当前对话上下文。通过 MCP 调用,Pro 的对话历史完整保留,分析结果直接回到对话中。

许可证

MIT

Quick Setup
Installation guide for this server

Install Package (if required)

npx @modelcontextprotocol/server-mimo-vision-mcp

Cursor configuration (mcp.json)

{ "mcpServers": { "yzndx-mimo-vision-mcp": { "command": "npx", "args": [ "yzndx-mimo-vision-mcp" ] } } }