时歌 (@Lapis0x0) 在 开发随笔:一个简单的 Todo MCP,和一次关于减法的开发实践 中发帖
说是开发,其实绝大多数时间都在拷打Windsurf里的Claude、GPT和Gemini老师。
我们意念合一.jpg
一、MCP到底是什么
MCP 是 Model Context Protocol 的缩写,最早由 Anthropic 提出。其作用可以理解为一种 「接口协议」,让 LLM 能够和外部的各种工具、数据库、服务进行交互。
但光看这一段定义,实际上我自己是很迷糊的,我想知道的是,一个只能预测文本tokens的模型,到底是如何调用一个外部API呢?
调用MCP的基本流程大概有五步:
第1步:准备阶段-向 LLM 提供工具调用说明
在用户与LLM开始对话之前,开发者会先将所有可用的工具(API、函数)按照特定格式(例如JSON Schema)定义好,并作为一条特殊的“系统指令”(System Prompt)或上下文的一部分,发送给LLM。
这些说明看起来像这样:
{...