智算万物·湘约未来|AI来帮忙,创意视频一键直出

谢卓芳 傅聪   湖南日报·新湖南客户端   2024-09-21 21:50:06

湖南日报全媒体记者 谢卓芳

输入简单的指令:“热带雨林,一头狮子正凝视着前方”。几分钟后,一段逼真的视频素材自动生成。画面中,狮子的毛发随风摆动,周围的环境栩栩如生,宛若摄影师实景拍摄。

这是国内首个音视频多媒体大模型——万兴“天幕”音视频多媒体大模型,也是湖南首批通过备案的大模型。以音视频生成式AI技术为基础,集视频大模型、音频大模型、图片大模型、语言大模型于一体,具备文生视频、视频生视频、文生音乐、视频配乐、文生音效、文生图、图生图等核心能力。

“天幕聚焦音视频创作全链路,让创作者在各环节都可以提高效率。”万兴科技产品策划经理罗杨介绍,音视频创作整体链路长,覆盖内容构思、资源搜索、效果编辑、效果生成、合成、编辑等流程。天幕大模型希望把音视频创作的每一个应用场景都做精,在每个环节都为用户解决实际问题。

以铺设视频字幕为例。以往视频粗剪工作量繁多,需要反复查阅素材、逐句对应裁剪。但AI算法可将视频声音自动转成文本,并匹配对应语句,让用户可以像编辑文本一样高效剪辑视频。

有数据显示,制作1个3分钟以内的短视频,平均需要花费1.6个小时。记者利用天幕,从创意灵感、素材生成、文本字幕、特效和音乐合成,仅花费20分钟,就制作出一个2分钟的短视频,效率指数级上升。

天幕的落地同样迅速,广泛探索传媒影视、自媒体创作、电商运营、教育培训等领域的应用。

比如电商出海,服装模特需要不同年龄和不同肤色,利用天幕可迅速生成一批虚拟模特,为下游用户省去大量拍摄时间和成本;短剧赛道正热,天幕可以将剧集一键翻译成多种语言,演员的口型也会相应发生变化,提升观众观看体验。

短视频风头正盛,未来天幕还将从哪些方面优化?据介绍,万兴科技将重点进行AI提效增强功能的持续叠加。譬如在效率层面,如何将过往繁琐的操作通过“一键化”的方式去处理完成;在质量方面,如何能基于用户已有素材,提升其画质、音质甚至于成片的观感等,这些都已被纳入企业研发计划。

万兴科技于2019年正式落户长沙,近年来不断加大投入,目前在湘团队规模已接近1000人。


责编:何金燕

一审:何金燕

二审:胡宇芬

三审:李伟锋

来源:湖南日报·新湖南客户端

我要问