08-04 10:58 The University of Sydney Java 发布于青海

关注

MCP是怎么和大模型交互

技术小馆专注AI与Java领域的前沿技术知识库技术小馆官网

MCP是怎么和大模型交互

在人工智能快速发展的今天，大模型已经展现出惊人的能力，但它们的"知识"往往局限于训练数据截止的时间点。想象一下，如果大模型能够实时访问最新的数据库、调用外部API、甚至控制你的智能家居设备，那会是怎样的体验？

这就是MCP（Model Context Protocol）要解决的问题。它就像给大模型安装了一个"万能工具箱"，让AI助手不仅能回答问题，还能执行实际的操作。从查询实时股票数据到帮你预订餐厅，从分析公司财务报表到控制智能设备，MCP让大模型从"纸上谈兵"变成了"实干家"。

1. MCP技术基础

1.1 什么是MCP协议

MCP（Model Context Protocol）是一个开放标准协议，它定义了大模型与外部工具和服务之间的通信规范。简单来说，MCP就是大模型的"翻译官"，让AI能够理解并调用各种外部功能。

{
  "jsonrpc": "2.0",
  "id": 1,
  "method": "tools/list",
  "params": {}
}

这个简单的JSON消息就是MCP协议的基础。通过标准化的消息格式，大模型可以：

查询可用的工具列表
调用具体的工具功能
接收工具执行结果
处理错误和异常情况

1.2 MCP的核心组件

MCP架构包含三个核心组件：

客户端（Client）：大模型所在的系统，负责发送请求和处理响应服务器（Server）：提供工具和服务的系统，执行具体的操作协议层（Protocol）：基于JSON-RPC的通信协议，确保消息的标准化传输

# MCP客户端示例
import json

class MCPClient:
    def __init__(self):
        self.tools = {}
    
    def list_tools(self):
        request = {
            "jsonrpc": "2.0",
            "id": 1,
            "method": "tools/list",
            "params": {}
        }
        return self.send_request(request)
    
    def call_tool(self, tool_name, parameters):
        request = {
            "jsonrpc": "2.0",
            "id": 2,
            "method": "tools/call",
            "params": {
                "name": tool_name,
                "arguments": parameters
            }
        }
        return self.send_request(request)

1.3 与传统API的区别

传统API调用需要预先定义接口，而MCP提供了更灵活的交互方式：

特性	传统API	MCP协议
接口定义	固定不变	动态发现
调用方式	直接调用	协议封装
扩展性	需要重新部署	即插即用
安全性	独立管理	统一认证

2. MCP的工作原理

2.1 协议通信机制

MCP采用JSON-RPC 2.0作为底层通信协议，确保消息的可靠传输。通信流程如下：

工具发现阶段：客户端向服务器请求可用工具列表
工具调用阶段：客户端发送具体工具调用请求
结果返回阶段：服务器执行操作并返回结果
错误处理阶段：处理异常情况和错误信息

// 工具发现请求
{
  "jsonrpc": "2.0",
  "id": 1,
  "method": "tools/list",
  "params": {}
}

// 服务器响应
{
  "jsonrpc": "2.0",
  "id": 1,
  "result": {
    "tools": [
      {
        "name": "get_weather",
        "description": "获取指定城市的天气信息",
        "inputSchema": {
          "type": "object",
          "properties": {
            "city": {"type": "string"}
          }
        }
      }
    ]
  }
}

2.2 工具调用流程

当大模型需要调用外部工具时，完整的流程如下：

# 完整的MCP工具调用示例
class WeatherTool:
    def get_weather(self, city):
        # 模拟天气API调用
        weather_data = {
            "city": city,
            "temperature": "25°C",
            "condition": "晴天",
            "humidity": "60%"
        }
        return weather_data

# MCP服务器实现
class MCPServer:
    def __init__(self):
        self.tools = {
            "get_weather": WeatherTool().get_weather
        }
    
    def handle_request(self, request):
        method = request.get("method")
        if method == "tools/call":
            tool_name = request["params"]["name"]
            arguments = request["params"]["arguments"]
            
            if tool_name in self.tools:
                result = self.tools[tool_name](**arguments)
                return {
                    "jsonrpc": "2.0",
                    "id": request["id"],
                    "result": result
                }

2.3 安全认证机制

MCP支持多种安全认证方式，确保工具调用的安全性：

API密钥认证：使用密钥进行身份验证
OAuth 2.0：支持第三方授权
JWT令牌：基于令牌的认证机制
IP白名单：限制访问来源

# 安全认证示例
import jwt
import time

class SecureMCPServer:
    def __init__(self, secret_key):
        self.secret_key = secret_key
    
    def verify_token(self, token):
        try:
            payload = jwt.decode(token, self.secret_key, algorithms=["HS256"])
            return payload["user_id"]
        except jwt.ExpiredSignatureError:
            raise Exception("令牌已过期")
        except jwt.InvalidTokenError:
            raise Exception("无效令牌")
    
    def handle_authenticated_request(self, request, token):
        user_id = self.verify_token(token)
        # 处理认证后的请求
        return self.handle_request(request)

2.4 错误处理机制

MCP定义了标准的错误码和错误处理机制：

// 错误响应示例
{
  "jsonrpc": "2.0",
  "id": 1,
  "error": {
    "code": -32603,
    "message": "工具执行失败",
    "data": {
      "tool_name": "get_weather",
      "error_details": "城市名称无效"
    }
  }
}

3. MCP的技术优势

3.1 实时数据访问能力

MCP让大模型能够访问最新的实时数据，打破了训练数据的时间限制：

# 实时股票数据获取示例
class StockDataTool:
    def get_stock_price(self, symbol):
        # 连接实时股票API
        import yfinance as yf
        stock = yf.Ticker(symbol)
        info = stock.info
        return {
            "symbol": symbol,
            "current_price": info.get("currentPrice"),
            "change_percent": info.get("regularMarketChangePercent"),
            "volume": info.get("volume")
        }

# 大模型可以这样调用
# "请帮我查询苹果公司的股票价格"
# MCP会自动调用get_stock_price("AAPL")

3.2 动态工具扩展

MCP支持动态添加新工具，无需重新训练模型：

# 动态工具注册示例
class ToolRegistry:
    def __init__(self):
        self.tools = {}
    
    def register_tool(self, name, function, description):
        self.tools[name] = {
            "function": function,
            "description": description
        }
    
    def get_available_tools(self):
        return [
            {
                "name": name,
                "description": info["description"]
            }
            for name, info in self.tools.items()
        ]

# 注册新工具
registry = ToolRegistry()
registry.register_tool(
    "translate_text",
    translate_function,
    "将文本翻译成指定语言"
)

3.3 跨平台兼容性

MCP协议是语言无关的，支持多种编程语言和平台：

// Node.js MCP客户端示例
class MCPClient {
    async listTools() {
        const request = {
            jsonrpc: "2.0",
            id: 1,
            method: "tools/list",
            params: {}
        };
        
        const response = await fetch('/mcp/tools', {
            method: 'POST',
            headers: {
                'Content-Type': 'application/json'
            },
            body: JSON.stringify(request)
        });
        
        return await response.json();
    }
}

4. 实际应用场景

4.1 金融数据分析

MCP在金融领域有广泛应用，让AI能够实时分析市场数据：

# 金融分析工具示例
class FinancialAnalysisTool:
    def analyze_portfolio(self, symbols):
        results = {}
        for symbol in symbols:
            # 获取实时数据
            stock_data = self.get_stock_data(symbol)
            # 计算技术指标
            technical_indicators = self.calculate_indicators(stock_data)
            # 风险评估
            risk_assessment = self.assess_risk(stock_data)
            
            results[symbol] = {
                "data": stock_data,
                "indicators": technical_indicators,
                "risk": risk_assessment
            }
        return results
    
    def get_stock_data(self, symbol):
        # 连接金融数据API
        pass
    
    def calculate_indicators(self, data):
        # 计算RSI、MACD等技术指标
        pass
    
    def assess_risk(self, data):
        # 风险评估算法
        pass

4.2 智能家居控制

MCP让大模型能够直接控制智能家居设备：

# 智能家居控制工具
class SmartHomeTool:
    def __init__(self):
        self.devices = {
            "living_room_light": {"type": "light", "status": "off"},
            "thermostat": {"type": "thermostat", "temperature": 22},
            "security_camera": {"type": "camera", "status": "on"}
        }
    
    def control_device(self, device_name, action, parameters=None):
        if device_name not in self.devices:
            raise Exception(f"设备 {device_name} 不存在")
        
        device = self.devices[device_name]
        
        if action == "turn_on":
            device["status"] = "on"
        elif action == "turn_off":
            device["status"] = "off"
        elif action == "set_temperature" and device["type"] == "thermostat":
            device["temperature"] = parameters["temperature"]
        
        return {
            "device": device_name,
            "action": action,
            "status": "success",
            "current_state": device
        }
    
    def get_device_status(self, device_name):
        if device_name in self.devices:
            return self.devices[device_name]
        return None

4.3 企业系统集成

MCP可以集成企业内部系统，让AI助手处理业务数据：

# 企业CRM系统集成示例
class CRMTool:
    def __init__(self, database_connection):
        self.db = database_connection
    
    def search_customer(self, query):
        # 搜索客户信息
        sql = "SELECT * FROM customers WHERE name LIKE %s OR email LIKE %s"
        results = self.db.execute(sql, (f"%{query}%", f"%{query}%"))
        return results
    
    def create_lead(self, customer_data):
        # 创建新的销售线索
        sql = """
        INSERT INTO leads (name, email, company, status, created_at)
        VALUES (%s, %s, %s, %s, NOW())
        """
        self.db.execute(sql, (
            customer_data["name"],
            customer_data["email"],
            customer_data["company"],
            "new"
        ))
        return {"status": "success", "message": "线索创建成功"}
    
    def update_opportunity(self, opportunity_id, status):
        # 更新销售机会状态
        sql = "UPDATE opportunities SET status = %s WHERE id = %s"
        self.db.execute(sql, (status, opportunity_id))
        return {"status": "success", "message": "机会状态更新成功"}

4.4 个人助理服务

MCP让AI助手能够执行日常任务：

# 个人助理工具集
class PersonalAssistantTools:
    def __init__(self):
        self.calendar = CalendarTool()
        self.email = EmailTool()
        self.reminder = ReminderTool()
    
    def schedule_meeting(self, title, date, participants):
        # 安排会议
        meeting_id = self.calendar.create_event(title, date, participants)
        
        # 发送邀请邮件
        for participant in participants:
            self.email.send_invitation(participant, title, date)
        
        return {
            "meeting_id": meeting_id,
            "status": "scheduled",
            "participants": participants
        }
    
    def set_reminder(self, message, time):
        # 设置提醒
        reminder_id = self.reminder.create(message, time)
        return {
            "reminder_id": reminder_id,
            "message": message,
            "time": time
        }
    
    def summarize_emails(self, date_range):
        # 总结邮件
        emails = self.email.get_emails(date_range)
        summary = self.analyze_emails(emails)
        return summary

5. 开发实践指南

5.1 环境搭建

搭建MCP开发环境需要以下步骤：

# 1. 安装Python依赖
pip install mcp-sdk
pip install fastapi
pip install uvicorn

# 2. 创建MCP服务器
mkdir mcp-project
cd mcp-project

# 3. 创建基础MCP服务器
from mcp import Server, StdioServerParameters
from mcp.server.models import InitializationOptions
import asyncio

class MyMCPServer(Server):
    def __init__(self):
        super().__init__()
        self.register_tool("hello_world", self.hello_world)
    
    async def hello_world(self, name: str = "World") -> str:
        return f"Hello, {name}!"

async def main():
    server = MyMCPServer()
    async with StdioServerParameters() as params:
        await server.run(params)

if __name__ == "__main__":
    asyncio.run(main())

5.2 工具开发规范

开发MCP工具需要遵循以下规范：

# 工具开发模板
from typing import Dict, Any, Optional
from mcp.server.models import Tool

class CustomTool:
    def __init__(self):
        self.name = "custom_tool"
        self.description = "自定义工具描述"
        self.input_schema = {
            "type": "object",
            "properties": {
                "param1": {"type": "string", "description": "参数1"},
                "param2": {"type": "number", "description": "参数2"}
            },
            "required": ["param1"]
        }
    
    async def execute(self, parameters: Dict[str, Any]) -> Dict[str, Any]:
        """
        工具执行逻辑
        """
        try:
            # 参数验证
            param1 = parameters.get("param1")
            param2 = parameters.get("param2", 0)
            
            # 执行具体操作
            result = self.perform_operation(param1, param2)
            
            return {
                "status": "success",
                "result": result
            }
        except Exception as e:
            return {
                "status": "error",
                "error": str(e)
            }
    
    def perform_operation(self, param1: str, param2: int) -> str:
        # 具体的业务逻辑
        return f"处理结果: {param1} + {param2}"

5.3 最佳实践建议

错误处理：始终包含完善的错误处理机制
参数验证：严格验证输入参数的类型和范围
日志记录：记录工具调用的关键信息
性能优化：避免长时间阻塞的操作
安全考虑：实施适当的访问控制

# 最佳实践示例
import logging
from typing import Dict, Any
from functools import wraps

# 设置日志
logging.basicConfig(level=logging.INFO)
logger = logging.getLogger(__name__)

def log_tool_call(func):
    """装饰器：记录工具调用"""
    @wraps(func)
    async def wrapper(*args, **kwargs):
        logger.info(f"调用工具: {func.__name__}, 参数: {kwargs}")
        try:
            result = await func(*args, **kwargs)
            logger.info(f"工具执行成功: {func.__name__}")
            return result
        except Exception as e:
            logger.error(f"工具执行失败: {func.__name__}, 错误: {str(e)}")
            raise
    return wrapper

class BestPracticeTool:
    @log_tool_call
    async def safe_operation(self, parameters: Dict[str, Any]) -> Dict[str, Any]:
        # 参数验证
        if "required_param" not in parameters:
            raise ValueError("缺少必需参数: required_param")
        
        # 业务逻辑
        result = await self.perform_safe_operation(parameters)
        
        return {
            "status": "success",
            "data": result,
            "timestamp": datetime.now().isoformat()
        }

通过MCP协议，大模型获得了与外部世界交互的能力，从静态的知识库变成了动态的智能助手。这种技术不仅扩展了AI的应用边界，也为开发者提供了构建更强大AI应用的标准化方案。随着MCP生态系统的不断完善，我们有理由相信，这将是AI技术发展的重要里程碑。

#MCP#