Bunn (@BunnHack) 在 苹果推出 STARFlow-V 视频模型,独家采用“归一化流”,实现长达30秒的画面稳定 中发帖
苹果公司正式发布了其全新的视频生成模型 STARFlow-V,该模型在底层技术上与当前主流的Sora、Veo和Runway等竞争对手完全不同。STARFlow-V 放弃了业界主流的扩散模型(Diffusion Model),转而采用**“归一化流”(Normalizing Flow)技术,旨在解决长视频片段生成中的稳定性和错误累积问题。
[17651612254397138211157481593314]
扩散模型通过多步迭代去除噪声来生成视频,而STARFlow-V的核心“归一化流”技术,则直接学习随机噪声和复杂视频数据之间的数学变换**。这一根本性差异带来了几大优势:
训练效率:训练过程只需一次完成,无需多次小迭代,提高了效率。
生成速度:训练完成后可直接生成视频,无需迭代计算,生成速度得到显著提升。
错误减少:减少了逐步生成过程中常见的错误。
苹果表示,STARFlow-...