MCP Servers

A collection of Model Context Protocol servers, templates, tools and more.

M
Mimo Vision MCP

为不支持多模态的 AI 模型(如 DeepSeek、Mimo-v2.5-pro 等)添加图片理解能力。

Created 6/2/2026
Updated about 3 hours ago
Repository documentation and setup instructions

Mimo Vision MCP Server

为不支持多模态的 AI 模型(如 DeepSeek、Mimo-v2.5-pro 等)添加图片理解能力。

通过 MCP Server + 代理服务器,让 Claude Code 在拖拽/粘贴图片时自动调用多模态模型分析图片,再将结果交给主模型处理。

功能特性

  • 智能图片识别:自动识别截图、图表、流程图、照片等类型
  • 多轮细化分析:支持 low/medium/high 三种详细程度
  • 结构化输出:返回 JSON 格式,包含类型、摘要、文字、布局、细节等
  • 透明代理:拦截含图片的请求,自动替换为文字描述
  • 持久化配置:一次配置,所有项目通用

工作原理

用户拖拽图片 → Claude Code 发送请求(含图片)→ 代理服务器拦截
                                                    ↓
                                            检测到图片数据
                                                    ↓
                                    调用多模态模型(如 mimo-v2.5)描述图片
                                                    ↓
                                    替换图片为文字描述,转发给主模型
                                                    ↓
                                            主模型处理并返回结果

安装

1. 克隆项目

git clone https://github.com/your-username/mimo-vision-mcp.git
cd mimo-vision-mcp
npm install

2. 配置 MCP Server

# 添加到 Claude Code(用户级别,所有项目可用)
claude mcp add mimo-vision -s user -e MIMO_API_KEY=your-api-key -- node C:/path/to/mimo-vision-mcp/index.js

3. 配置代理(可选,用于拖拽图片)

~/.claude/.mcp.json 中添加:

{
  "mcpServers": {
    "mimo-vision": {
      "command": "node",
      "args": ["C:/path/to/mimo-vision-mcp/index.js"],
      "env": {
        "MIMO_API_KEY": "your-api-key"
      }
    }
  }
}

使用方法

方法 1:文件路径(推荐)

直接在对话中输入图片路径:

分析这个图片 C:/Users/xxx/Desktop/screenshot.png

方法 2:拖拽图片(需要代理)

  1. 启动代理:node proxy/server.js
  2. 在 VSCode 中打开 Claude Code
  3. 拖拽图片到对话框

方法 3:/vision 命令

/vision C:/path/to/image.png

项目结构

mimo-vision-mcp/
├── index.js              # MCP Server 入口
├── analyzer.js           # 图片分析核心逻辑(多轮细化)
├── prompts.js            # 各类型专用 prompt
├── lib/
│   ├── image-loader.js   # 图片加载(本地文件/URL → base64)
│   └── api-client.js     # 多模态 API 调用封装
├── proxy/
│   ├── server.js         # 代理服务器(拦截图片请求)
│   ├── start.cmd         # 代理启动脚本(Windows)
│   └── start-cli.cmd     # CLI 启动脚本(带图片支持)
└── package.json

配置说明

环境变量

| 变量 | 说明 | 默认值 | |------|------|--------| | MIMO_API_KEY | 多模态模型 API Key | (必填) | | MIMO_BASE_URL | API 地址 | https://token-plan-sgp.xiaomimimo.com/v1 | | VISION_MODEL | 多模态模型名称 | mimo-v2.5 | | PROXY_PORT | 代理服务器端口 | 3000 |

支持的多模态模型

  • Mimo-v2.5(推荐)
  • DeepSeek-VL2
  • 其他 OpenAI API 兼容的多模态模型

analyze_image 工具参数

| 参数 | 类型 | 必填 | 说明 | |------|------|------|------| | image | string | 是 | 图片路径或 URL | | prompt | string | 否 | 自定义提示词 | | detail_level | string | 否 | low/medium/high,默认 medium |

适配其他模型

要使用 DeepSeek 或其他模型,只需修改环境变量:

# DeepSeek 示例
MIMO_API_KEY=your-deepseek-key
MIMO_BASE_URL=https://api.deepseek.com/v1
VISION_MODEL=deepseek-vl2

License

MIT

Quick Setup
Installation guide for this server

Install Package (if required)

npx @modelcontextprotocol/server-mimo-vision-mcp

Cursor configuration (mcp.json)

{ "mcpServers": { "dawn47-mimo-vision-mcp": { "command": "npx", "args": [ "dawn47-mimo-vision-mcp" ] } } }