OceanGPT·沧渊新增声呐图像 **MCP(Model Context Protocol)**服务,支持利用MCP动态调用沧渊大模型的声纳图像解读能力。MCP 是一种通用模型上下文扩展协议,其核心作用是为大模型提供可插拔的专业服务调用机制,通过上下文协议接口完成外部能力的无缝接入。在声呐图像场景下,MCP 允许用户在自己的大模型应用程序中植入沧渊模型的声呐图像解析能力,将原始声呐图像转化为自然语言形式的描述,并支持实现“声纳图像+语言文字"的一体化推理。该能力适用于水下环境建模、目标探测、任务规划等应用场景,使科研人员与工程应用能够通过统一的对话式智能体接口直接获取水下感知结果。

本文档将从下面几个方面介绍声呐图智能识别感知MCP服务以及其使用方法:


一、服务功能

MCP (Model Control Protocol)是一种用于大模型API调用和管理的协议,可以作为AI与各种外部工具服务的中间层,代替人类访问并操作外部工具,大幅简化了API调用的复杂性。基于本声呐图智能识别感知MCP服务,可以以对话的方式与大模型进行交互,实现声呐图的感知和自然语言解读。

本MCP服务地址: **http://60.191.72.39:8082/sse**

本MCP服务使用文档:**https://github.com/OceanGPT/OceanGPT/blob/main/mcp_server/README_CN.md**

该服务基于公开的声纳图数据集训练得到专有模型,目前支持如下15类物体的感知能力:

编号 物体中文名 物体英文名
0 ball
1 圆形笼 circle cage
2 立方体 cube
3 圆柱体 cylinder
4 瓶状物 bottle
5 金属桶 metal bucket
6 飞机 plane
7 水下机器人 rov
8 方形笼 square cage
9 轮胎 tyre
10 船体 ship
11 钩子 hook
12 螺旋桨 propeller
13 气阀 valve
14 水下管道 pipeline

下面我们将介绍基于Cherry Studio 和Cursor使用本MCP服务。

mcp相关的使用方法可以参考B站视频 https://www.bilibili.com/video/BV1RNTtzMENj