智算万物·湘约未来｜AI来帮忙，创意视频一键直出

谢卓芳傅聪湖南日报·新湖南客户端 2024-09-21 21:50:06

湖南日报全媒体记者谢卓芳

输入简单的指令：“热带雨林，一头狮子正凝视着前方”。几分钟后，一段逼真的视频素材自动生成。画面中，狮子的毛发随风摆动，周围的环境栩栩如生，宛若摄影师实景拍摄。

这是国内首个音视频多媒体大模型——万兴“天幕”音视频多媒体大模型，也是湖南首批通过备案的大模型。以音视频生成式AI技术为基础，集视频大模型、音频大模型、图片大模型、语言大模型于一体，具备文生视频、视频生视频、文生音乐、视频配乐、文生音效、文生图、图生图等核心能力。

“天幕聚焦音视频创作全链路，让创作者在各环节都可以提高效率。”万兴科技产品策划经理罗杨介绍，音视频创作整体链路长，覆盖内容构思、资源搜索、效果编辑、效果生成、合成、编辑等流程。天幕大模型希望把音视频创作的每一个应用场景都做精，在每个环节都为用户解决实际问题。

以铺设视频字幕为例。以往视频粗剪工作量繁多，需要反复查阅素材、逐句对应裁剪。但AI算法可将视频声音自动转成文本，并匹配对应语句，让用户可以像编辑文本一样高效剪辑视频。

有数据显示，制作1个3分钟以内的短视频，平均需要花费1.6个小时。记者利用天幕，从创意灵感、素材生成、文本字幕、特效和音乐合成，仅花费20分钟，就制作出一个2分钟的短视频，效率指数级上升。

天幕的落地同样迅速，广泛探索传媒影视、自媒体创作、电商运营、教育培训等领域的应用。

比如电商出海，服装模特需要不同年龄和不同肤色，利用天幕可迅速生成一批虚拟模特，为下游用户省去大量拍摄时间和成本；短剧赛道正热，天幕可以将剧集一键翻译成多种语言，演员的口型也会相应发生变化，提升观众观看体验。

短视频风头正盛，未来天幕还将从哪些方面优化？据介绍，万兴科技将重点进行AI提效增强功能的持续叠加。譬如在效率层面，如何将过往繁琐的操作通过“一键化”的方式去处理完成；在质量方面，如何能基于用户已有素材，提升其画质、音质甚至于成片的观感等，这些都已被纳入企业研发计划。

万兴科技于2019年正式落户长沙，近年来不断加大投入，目前在湘团队规模已接近1000人。

作者：谢卓芳傅聪

责编：何金燕

一审：何金燕

二审：胡宇芬

三审：李伟锋

来源：湖南日报·新湖南客户端

我要问