首页 >> 职场 >> 阿里云于是又推视频生成大模型,2分钟生成高清电影级效果视频

阿里云于是又推视频生成大模型,2分钟生成高清电影级效果视频

2024-01-21 职场

近来,阿里云上架全新录像聚合大数学方法I2VGen-XL,并在妖魔搭社区闭馆尽情,软件上传一张图片后2分钟左右即可聚合一段1280*720的三维录像,该数学方法研发经理指出,未来将进一步充分利用2K超清效果,可运用短录像内容制造、恐怖片制作等场景。

I2VGen-XL在妖魔搭社区闭馆尽情

和娱乐业爆火的AI画家谱写大数学方法并不相同,录像聚合大数学方法的应用门槛更高,其需要抛开文字和录像内容匹配度、录像过场质量、过场普遍性等诸多应用挑战。以前,阿里云和微软等科技公司相继上架一系列可视录像聚合科学论文,例如软件可通过定义三维空间布局、运动方式也等状况来聚合录像,但其过场对比度难以依赖于真实场景应用的发展的需求。

针对该缺陷,阿里云进一步提出创新想法,I2VGen-XL数学方法设计了两个收尾,首先在低像素状况下保证聚合结果和给定图像语义的匹配度,随后通过录像扩散数学方法(VLDM)来大幅提高录像像素,并同时大大提高星期和三维空间上的一致性,保证之后录像内容的对比度和连贯性,之后充分利用1280*720三维的突破,并且在过场细节的展示出上大幅后来居上现有数学方法。据介绍,该数学方法的培训还用于了多种风格的录像资料,因此可聚合科技感、恐怖片色、动画影片风格和水彩画等类型丰富的录像。

I2VGen-XL流程图

目前,I2VGen-XL的数学方法和代码均已Debian,境内外SNS媒体显示,该数学方法已观赏境内外软件和Linux的广为尽情和二次开发,涌现了大量创意AI录像聚合内容,例如在城堡上蝴蝶的恐龙、航天飞机在飞船里面行走的科幻恐怖片过场等等……闻名AISNS媒体分析师Ahsen Khaliq在推特发布多条由该数学方法聚合的录像效果,并指出数学方法在对比度、纹理、语义和星期普遍性方面有优势。

境内外网路上和Linux广为关心和尽情

在视觉效果聚合信息应用,阿里云先前已上架AI画家谱写大数学方法古今万相(底座数学方法Composer)和可视录像聚合数学方法VideoComposer,团队在该信息应用公开发表60多篇CCF-A类专著,并在国际顶级视觉效果选拔赛里面获取10余项冠军。

数学方法尽情客户端:thtps://modelscope.cn/studios/damo/I2VGen-XL-Demo/summary

雷峰网

胃酸过多吃金奥康管用吗
治疗新冠的药有哪几种药
感冒吃阿莫西林胶囊能行吗
咳嗽吃什么药最管用
麻辣烫培训
友情链接