Goku

基于Flow Matching的视频生成基础模型，支持文本到视频生成与广告视频创作

收录时间：

2026-05-05

Goku

Goku是一款基于Flow Matching技术的视频生成基础模型，由香港大学（HKU）与字节跳动研究院联合研发。该项目专注于文生视频领域的前沿研究，提出了创新的流式生成架构，能够从文本描述生成高质量的视频内容。模型已在学术论文和开源社区中公开发表，为视频生成领域的研究者和开发者提供重要参考。

Goku项目包含两个核心模型：基础版Goku专注于通用文本到视频生成任务，采用Flow Based架构实现高效的视频合成；Goku+则是针对广告视频场景优化的专用基础模型，在广告创意生成方面表现更优。两个模型均基于MovieGenBench评测基准进行效果验证，用户可以在项目页面直观对比生成质量。

Flow Matching是Goku的核心技术特点，相较于传统扩散模型方法，该技术能够提供更稳定和高效的生成过程。模型在文本理解、运动连贯性、视觉质量等方面均展现出优秀的性能，代表了当前文生视频领域的先进水平。

Goku主要面向AI研究人员、计算机视觉开发者、视频生成技术爱好者以及对前沿生成模型感兴趣的学者。无论是进行学术研究、模型对比，还是探索视频生成技术边界，Goku都提供了宝贵的参考资料和实验基础。

项目页面提供了完整的学术论文、GitHub代码仓库、Hugging Face模型资源以及MovieGenBench上的生成演示示例。用户可以通过这些资源深入了解模型架构、复现实验结果或在此基础上开展进一步研究。

特别声明

本站词点网提供的Goku都来源于网络，不保证外部链接的准确性和完整性，同时，对于该外部链接的指向，不由词点网实际控制，在2026年5月5日下午11:57收录时，该网页上的内容，都属于合规合法，后期网页的内容如出现违规，可以直接联系网站管理员进行删除，词点网不承担任何责任。

词点网致力于优质、实用的网络站点资源收集与分享！本文地址https://www.cd2.cn/sites/6016.html转载请注明