通过自然语言描述一键生成电影级视频,支持写实与动画风格自由切换
全球首创U-ViT技术融合Diffusion与Transformer模型,实现高效视觉任务处理
智能切换远景/近景/特写镜头,打造专业级影视化叙事语言
30秒内输出4K高清视频片段,行业领先的实时渲染效率
精准还原光影流动与物体运动轨迹,打造符合现实规律的沉浸场景
深度理解中国传统文化符号,智能生成熊猫/龙等特色文化意象
2024年4月
中国首个长时长、高一致性的AI视频大模型Vidu由清华大学与生数科技联合发布。基于原创的U-ViT架构,Vidu支持一键生成16秒高清视频,展现了对真实物理世界的模拟能力和丰富想象力,成为全球首个融合Diffusion与Transformer技术的视频生成模型,开启国产AI视频生成新纪元。
2024年7月
Vidu正式全球上线,推出文生视频和图生视频两大核心功能,以30秒生成4秒视频的行业领先速度引发关注。免费版每月提供80积分,同时推出多档订阅套餐,以亲民价格和高效服务迅速吸引全球创作者,成为短视频创作领域的新标杆。
2024年9月
Vidu推出“主体一致性”功能升级,通过技术创新实现角色全身形象的高精度控制。该功能突破传统视频生成模型的限制,在动态表情与复杂动作场景中保持角色稳定性,为影视、游戏行业提供更可控的创作工具。
2024年11月
Vidu 1.5版本发布,全球首发“多主体一致性”能力,支持上传1-3张参考图实现多元素交互控制。创新性地引入视觉上下文学习机制,省去传统微调环节,30秒内生成复杂场景视频,推动视觉模型正式迈入“上下文时代”。
2025年3月
生数科技宣布Vidu实现多模态技术新突破,在长视频生成与跨场景衔接方面达到国际顶尖水平。团队强调Vidu已超越单纯对标国际产品的阶段,以独特技术路线引领行业创新,为全球创作者提供更智能的视频生产解决方案。