kejun (@ke_jun) 在 250326 三花 AI 日报:OpenAI 推出了 GPT-4o 的图像生成功能; 谷歌 Gemini 2.5 Pro 实验版发布;DeepSeek-V3 非推理模型首次登顶排行榜 中发帖
今天内容不多
OpenAI 推出了 GPT-4o 的图像生成功能
[image]
OpenAI 推出了 GPT-4o 的图像生成功能,它取代了此前使用的DALL-E 3模型,利用GPT-4o的原生多模态能力,能够支持渲染文本,支持从写实风格到艺术插图的多种风格,能处理复杂的用户指令,并保持一致性,还能通过多轮对话逐步调整和完善图像。
目前,该功能已集成到 ChatGPT 中,所有人都可以在对话中输入生图请求即可使用,API 将在未来几周内提供。当然这玩意不是万能的,偶尔会出现幻觉(hallucination)、数学图表生成不够准确,以及多语言文本支持有限。
更多细节和演示可以看官方介绍。
谷歌 Gemini 2.5 Pro 实验版发布:登顶 Chatbot Arena
[图片]
谷歌正式推出 Gemini 2.5 Pro 实验版(gemini-2.5-pro-exp...