杰尼龟老师 (@user1558)分镜脚本和视频生成初探小记 中发帖

AI辅助视频生成工具深度拆解:从故事到成片的完整流程
最近在网上发现了一个有趣的开源项目 StoryGen-Atelier,这是一个AI辅助的分镜脚本和视频生成工具。它巧妙地结合了 Gemini(文本和图像生成)、Vertex AI Veo(视频片段生成)以及 ffmpeg(视频拼接),还内置了日志和素材管理功能。
核心工作流程:三阶段生成法
整个视频生成过程分为三个关键阶段:

阶段 1:分镜脚本生成(Gemini Text)
阶段 2:分镜图像生成(Gemini Image)
阶段 3:视频片段生成与拼接(Veo + FFmpeg)

下面我将用一个实际案例**「女子在咖啡店的偶遇」**来详细拆解整个流程。

阶段 1:分镜脚本生成
提示词设计
首先,我们需要生成一个结构化的分镜脚本。这个阶段的提示词设计非常精妙:
Role: You are a film storyboard...