云开体育万相均达到了业界最初推崇-开云(中国)Kaiyun·体育官方网站 登录入口
发布日期:2025-08-09 03:26 点击次数:85
你家里的显卡也能用!阿里万相视频生成模子开源
2月25日音信,阿里云旗下视觉生成基座模子万相2.1(Wan)文告开源,这次开源接纳最宽松的Apache2.0契约,14B和1.3B两个参数规格的沿路推理代码和权重沿路开源,同期缓助文生视频和图生视频任务,各人缔造者可在Github、HuggingFace和魔搭社区下载体验。
据先容,14B万相模子在领导遵命、复杂通顺生成、物理建模、翰墨视频生成等方面推崇凸起,在巨擘评测集VBench中,万相2.1以总分86.22%的得益大幅超越Sora、Luma、Pika等国表里模子,稳居榜首位置。1.3B版块测试遵循不仅独特了更大尺寸的开源模子,以致还接近部分闭源模子,同期能在耗尽级显卡开动,仅需8.2GB显存就不错生成高质料视频,适用于二次模子缔造和学术商议。
万相2.1以总分86.22%的得益稳居VBench榜单第一
在算法诡计上,万相基于主流DiT架构和线性噪声轨迹Flow Matching范式,研发了高效的因果3D VAE、可彭胀的预磨练战略等。以3D VAE为例,为了高效缓助自便长度视频的编码息争码,万相在3D VAE的因果卷积模块中完毕了特征缓存机制,从而代替平直对长视频端到端的编解码流程,完毕了无尽长1080P视频的高效编解码。此外,通过将空间降采样压缩提前,在不亏欠性能的情况下进一步减少了29%的推理时内存占用。
万相团队的本质遵循流露,在通顺质料、视觉质料、格和洽多看法等14个主要维度和26个子维度测试中,万相均达到了业界最初推崇,而况斩获5项第一。尤其在复杂通顺和物理法例遵命上的推崇大幅普及,万相简略自如展现各式复杂的东说念主物肢体通顺,如旋转、进步、回身、翻腾等;简略精确收复碰撞、反弹、切割等复杂着什物理场景。
生成示例展示:
Prompt:体育照相格调,骑手在款式阻塞赛中训导马匹快速通过阻塞物。骑手身着专科比赛服,头戴安全帽,心思专注而坚决,双手紧合手缰绳,双腿夹紧马腹,与马匹好意思满合营。马匹腾空跃起,算作连贯且准确,四蹄有劲地踏过每一个阻塞物,保持速率和均衡。布景是当然的草地和蓝天,画面充满动感和病笃感。4K, 高清画质,算作完整。
Prompt:体育照相格调,中国皮划艇通顺员在急流回旋比赛中,于湍急的水流顶用桨快速划水,纯真地绕过一个又一个阻塞物。他身着专科通盲从,肌肉线条赫然,心思专注而坚决,展现出出色的操控技能和飘扬的拼搏精神。布景是澄莹的河流和翠绿的山峦,画面充满动感与活力。算作完整,4K, 高清画质。
Prompt:一段超速POV镜头,录像机飞奔穿越一条阳光下的中国乡村小径,镜头紧随着一个在空中遨游的一稔闲散服闲散鞋的中国女子的背后,她肉体立正张开双臂,风吹动她的头发和衣服。
南边+记者 叶丹云开体育
栏目分类