龙年伊始,Sora的发布引发热议,开启视频动画领域的AIGC新篇章。一夜之间, “AI创作”不再只是科技爱好者的美好构想,同时让普通人的AI创作从“文生文”、“文生图”进一步拓展到了“文生视频”。这是否意味着传统广告行业、影视行业乃至更广泛的内容生产者的业务组织形式、工作方式都将被颠覆?
3月29日,小即是大创新伙伴联合启迪之星(上海)、钛媒体集团、欧美同学会上海AI分会举办了“大模型X|AI视频动画应用实践”互动沙龙。活动从多模态大语言模型的技术内涵、AI视频的产业应用等多重维度展开深入对话。现场吸引了来自学界、业界的百余名专业人士和爱好者出席。
活动最后的happy hour环节,数十位观众参与自由交流,分享自己对AI视频的创见。
以下是本期活动的精彩回顾
01 技术解读:当我们谈论Sora时,我们在谈论什么?
商汤科技研究院的骆继祥对Sora视频技术进行了框架梳理,包括生成模型家族自2013年以来的发展脉络、AI视频所需的Scaling Law数据、图文音视频多模态的基础模型以及Sora的架构。
然而,骆继祥指出,尽管AI视频技术取得了长足的进步,当前仍处于完全生成与模拟之间的阶段,“无中生有为生成,适应规则为模拟”。文字与物体之间的交互关系、画面畸变,乃至艺术审美高度的评价都还有待于进一步突破。骆继祥强调说,“生成式网络暂时只是学到基本规则中的皮毛,或许有更高纬度的大一统形式的基本规则待生成式网络发现”。
AWS亚马逊云科技初创赋能顾问程可珺与资深解决方案架构师贺杨则结合长期实践经验,为现场企业提炼出四个GenAI初创阶段需要关注的问题:海量视频训练数据的安全低成本存储、视觉数据的准确标注、分布式训练集群的工程化,以及推理成本的管控。
这些经验为参与者提供了关于有效管理视频数据、提高模型训练效果和性能、构建高效训练集群以及管理推理成本的实用建议。
Seed V实验室CEO王咏刚则直接从AI视频的实现效果作为切入口,指出生成式AI的最强路标是“可控性”,但已有技术仍然落后于人类所需要的“表现力”,GenAI仍然高度依赖于创作者的互动,需要不断修正。
王咏刚提出,人类最好的内容创作流程往往包含了极其细致的专业分工,以及逻辑缜密的协作工作流。因此,“可控性的自动化”可能是解构AI创作壁垒的可行途径,通过自反馈的多智能体系统实现内容创作工作流,用AI来精确控制GenAI,让所有普通人都可以利用AI成为创作者。
02 AI视频应用:创作者的春天
不可置否的是,生成式AI在传媒行业已经进入井喷式发展阶段,被运用于电影艺术、商业广告、个人创作等全局全域。全球首部AI独立⻓篇电影《Our T2 Remake》已于2024年3月6日于美国好莱坞上映,团队中唯一亚洲制作人Junie也来到沙龙现场,揭密电影创作幕后。
也办文化传播联合创始人陈文理展示了一系列商业广告中的应用案例,并表示对“零瑕疵”AI广告的期许。
UGC时代,AIGC技术同样被快速应用于个人创作。爱诗科技PixVerse合作者生态负责人熊沁茹带来了几位合作艺术家的代表作。
03 大模型X:不一样的互动沙龙
现场设计了多个互动环节。Seed V实验室联合创始人童超主持圆桌论坛,猫眼娱乐副总裁西贝、上海浦东建筑设计院三院副院长袁博等几位嘉宾应邀共话AI视频发展的潜力与隐患。
问答阶段,现场观众围绕作品版权、AIGC技术普适性等话题与嘉宾展开热烈讨论。随后数十位观众留下共享Happy Hour时刻,与小伙伴们分享自己近期在AI视频领域的行业见闻,度过轻松愉快的餐叙时光。
小即是大创新伙伴联合启迪之星(上海)、钛媒体集团将与生态伙伴一起,持续举办 “大模型 X 产业”系列沙龙,探索大模型技术对各行业发展赋能机会,分享技术进展和案例,共同推动大模型在垂直领域的应用和创新落地。欢迎关注我们,相聚下一场盛会!
根据《网络安全法》实名制要求,请绑定手机号后发表评论