继谷歌和Meta后,阿里达摩院上线文本生成视频大模型
(相关资料图)
这波AIGC(利用人工智能技术来生成内容)的热潮,已经开卷视频了。近日,阿里达摩院低调地在魔搭社区(ModelScope)放出了“文本生成视频大模型”。
据了解。目前文本生成视频大模型,由文本特征提取、文本特征到视频隐空间扩散模型、视频隐空间到视频视觉空间这3个子网络组成,整体模型参数约17亿。支持英文输入。扩散模型采用Unet3D结构,通过从纯高斯噪声视频中,迭代去噪的过程,实现视频生成的功能。
记者发现,这个模型目前已经开放给用户试玩,只要输入一些简单的描述词,就可以看到生成的视频效果。比如输入“A panda eating bamboo on a rock”,就可以看到一只大熊猫坐在岩石上吃竹子的画面。
不过,目前这个模型还不支持中文输入,而且生成的视频长度多在2-4秒,等待时间从20多秒到1分多钟不等,画面的真实度、清晰度以及长度等方面还有待提升。
不止是阿里达摩院,总部位于纽约的人工智能初创公司Runway也发布了一种从文本到视频转化的AI模型Gen-2。上个月,这家曾参与创建Stable Diffusion的公司推出过模型Gen-1,能通过文本提示或参考图像指定的风格,将现有视频转化为新视频。比如将“街道上的人”变成“粘土木偶”,只需要一行提示词。
早在去年,谷歌和Meta都展示了各自在文本转视频上的尝试,利用AI生成泰迪熊洗碗和在湖上泛舟等视频。但这两家公司都没有宣布将相关技术推进到研究阶段以外的计划。
不过,从目前此类模型生成视频的等待时间,画面的真实度、清晰度以及长度等各方面来看,距离产出令人满意的视频还有很大距离。
标签:
为您推荐
广告
随机阅读
- 继谷歌和Meta后,阿里达摩院上线文本生成视频大模型
- 富有挑战性的地图探索向轻度Rogue游戏《破碎原像》Steam页面上线 年内发售
- 中国5a景区排名前十_中国5A景区-天天热闻
- 2023广西玉林市兴业县通过专场招聘会招聘县直学校教师补充公告
- 供应链金融迎来发展黄金期 百融云创推动生态圈发展 世界热点
- 孕期吃什么有营养图解_孕期吃什么有营养|焦点讯息
- 密码箱24寸是多大_24寸是多大_环球快播
- 为什么和水瓶恋爱累|世界微头条
- 中国广核:防城港3、4号机组临时上网电价获得核准_天天热点
- 面条变透明还能吃吗 面条变透明能否继续食用
- 打工新鲜事儿丨突发火灾,快递小哥从火场扛出煤气罐! 当前热闻
- 通胀高企,银行“暴雷”!美国民众担心在经济衰退中失去一切|天天快播报
- 世界最资讯丨宁江区开启现代化基层治理新模式
- 环球实时:昨日两市86只个股发生大宗交易 三六零、航天宏图、晶澳科技成交额居前
- DNF:95版本四大搬砖地图,最后一个满疲劳400万!
- 当前速看:保定市一中怎么样_保定一中怎么样
- 口袋妖怪百科全书_口袋妖怪百科
- 环球今日讯!拼多多第四季度营收398.2亿元 Non-GAAP净利润121亿元
- 世界视点!中铁五局长沙盼盼路PPP项目10.5亿元资产支持ABS已获受理
- 环球快看点丨2023年acca考试难在哪里?各科目备考建议
广告
财经
- ColtDCS在日本大阪京阪奈设立数据中心 世界播报
- 当前短讯!成都高新区合作街道消费券美团领的怎么用2023?(时间+规则)
- 金在中肯定大国男儿Karam翻唱东方神起,你真的表演得很好
- 全球简讯:萝卜招聘?甘肃某县引进人才13名,5人是三本!刷新高端人才底线
- 祥隆香港2.72亿元挂牌转让祥隆(大连)房地产100%股权
- excel表格合并单元格保留内容怎么操作_excel表格合并单元格保留内容_焦点讯息
- 打点计时器加速度公式_打点计时器公式
- 信达澳亚基金宋冬旭:市场有望进入结构性行情|短讯
- 【世界时快讯】北向资金今日净买入7.87亿元 长江电力、TCL中环等获加仓
- csgo多少钱算大件_cs go多少钱
- 椴树亚科
- 全球热点!调解协议书什么时候生效?
- 热文:全球单厂规模最大“绿氢+煤”制烯烃项目开工建设
- 医治晕车的最好办法是什么打一生肖_医治晕车的最好办法是什么
- 世界新资讯:慢性非萎缩性胃炎是什么意思_什么是紧张性头疼
- 俄国家杜马二读通过一项草案,允许安全部门直接击落无人机
- 世界球精选!当您回到办公室时新的Zoom功能正在为混合世界做好准备
- 亚洲资源(00899.HK)3月15日收盘跌1.1%
- 原煤进口大幅回升:前2月进口煤炭6064万吨 同比增长70.8%
- 北京曝光多起医疗美容典型案例_环球新视野