圆桌对话式的产品发布会直播之风,正在从硅谷吹到国内科技圈。从12月15日至19日,商汤科技举办产品发布周。要有多大的产品立异浓度,才干撑得起为期5天的发布?
12月15日,产品发布周的榜首天,商汤抛出了一个重磅炸弹——Seko2.0,官方称其为职业首个创编一体、多集合生成智能体,让“一人剧组”变为或许,让零经历用户也能完结100集短剧发明。
AI漫剧、短剧正在爆发式增加,很多个人发明者与小团队涌入,乃至将其视为“第二职业”。巨量引擎多个方面数据显现,本年上半年漫剧供给量以83%的复合增加率继续扩容,对外输出超3000部著作,流水规划更是翻了12倍。
个人发明者和工作室需求的是真实能低于人工本钱,产出高质量著作的AI东西。
一个AI东西究竟好不好用?仍是要拿作用来说线月上线以来,Seko仅用两个月用户量即打破10万,不到半年已集合超20万发明者,其间30%为短剧发明者、20%为漫剧发明者。
Seko孵化的真人短剧《婉心计》现已登顶抖音AI短剧榜榜首,《我在山顶建末日堡垒》《隐神录》等漫剧著作也受到了较多重视。尽管仍是能看出AI生成的痕迹,可是人物共同性这个老大难问题已根本被处理。
Seko还在向高品质影视工业范畴跨进,下一年将走进院线。Seko与影视职业头部企业长江电影集团达到战略协作,估计将于下一年推出荆楚文明前史故事系列短剧,并联合孵化院线级AIGC电影,推进AI发明东西深化专业影视出产流程。
在1.0年代,Seko帮发明者摆脱了在多东西间疲于切换、为杂乱提示词消耗心力的困扰。
现在,市面上大部分AI视频生成产品,仅支撑单集短片或片段资料出产。发明者若想完结多集接连剧,不得不面临多东西切换、杂乱工作流建立、人物与场景共同性难以坚持等中心痛点。“一人剧组”的规划化、高品质内容出产仍然遥不行及。
Seko2.0已能支撑100集以内的剧本接连发明,不同剧会集,人物场景道具可以灵敏相关,人物妆造也能随场景改动。它首要霸占了两大难题,一是多剧集、跨分镜人物共同性难题,二是多人对口型难题。
传统数字人技能在处理多言语、多人交互的杂乱场景时,常呈现口型与语音匹配禁绝的问题。SekoTalk完结了从单人口型到多人互动的高度精准的声型同步,无论是日常对话、剧烈争持仍是团体报数,都能完结精准对口型,让多人场景制造趁热打铁。
以往,一支漫剧团队完结50集著作常常要3个月以上,现在,凭借Seko2.0,漫剧制造周期可缩短80%~90%,让发明者脱离烦琐的资料办理,“一人剧组”的愿望照进实际。
AI短剧确实提高了功率,可是本钱合算吗?来算笔账,AI 短剧、漫剧的多剧集发明触及海量分镜,仅一个5秒视频就需生成挨近10万token,若一键生成10~20个分镜,总token需求量更将高达100万~200万。
此外,商汤开源了职业首个能完结实时视频生成的推理结构LightX2V,经过DiT蒸馏加快、轻量化 VAE、稀少注意力等优化,将推理功能提高3倍以上,完结低本钱、强实时的视频生成。LightX2V在消费级显卡上可以以不到5秒的时刻生成5秒视频,远优于Sora2数分钟的耗时,现在累计下载量已超350万次,被全球发明者所喜爱。
寒武纪、沐曦等国产芯片的适配,完结视频生成模型的全国产化布置,并做到了准实时的生成功率。从作用比照来看,Seko在国产化芯片渠道上可以以附近的时刻,完结和世界芯片渠道共同的生成作用。世界芯片渠道运转1s可生成1.25s视频,国产芯片渠道运转1s可生成1.0625s视频。跟着国产芯片功能的继续优化与生态老练,两者距离还将进一步缩小。
这代表着国产算力对AIGC中心场景的支撑完结了从言语到多模态的要害跨过。下一步,商汤与寒武纪还将在模型中心才能、算力利用率、本钱功率、大规划并行处理才能等方面协同优化,逐渐下降多模态AI的运用门槛。
未来,商汤将为Seko的发明者供给国产化计划挑选,敞开AI视频发明的“低本钱”年代。
“颠覆性技能一般首先在新式或不起眼的商场商业化。”商汤科技董事长兼CEO徐立表明,AI以极致功率和本钱协助发明者开释构思,并跟着才能的不断进化,产出内容的质量将逐渐向“精品化”跨进,发明“高深典雅”与“通俗易懂”共存的内容新生态。