@wenliang_zeng 在 【开源】Banana Image MCP 中发帖
基于 Gemini 原生图像能力的 MCP Server 实现:从智能路由到 4K 输出的工程实践
前言
MCP(Model Context Protocol)生态爆发式增长,但图像生成领域的 MCP 实现普遍存在几个问题:
单一模型绑定:要么只接 DALL-E,要么只接 Stable Diffusion,缺乏灵活性
分辨率天花板:大多数实现止步于 1024px
上下文割裂:生成的图片无法在对话流中直接使用
基于这些痛点,我开发了 Banana Image MCP——一个支持智能模型路由、4K 原生输出、Google Search Grounding 的生产级 MCP Server。
本文分享整个工程实现过程中的技术决策与踩坑经验。
架构设计
整体分层
banana_image_mcp/
├── server.py # 入口 + FastMCP 应用工...