⚬🕺🧦
活动现场展示的视频生成效果令人惊叹。无论是语义理解能力,多个主体运动的复杂交互画面,还是多镜头切换的内容一致性,豆包视频生成大模型均达到业界先进水平。火山引擎总裁谭待表示,“视频生成有很多难关亟待突破。豆包两款模型会持续演进,在解决关键问题上探索更多可能性,加速拓展AI视频的创作空间和应用落地。”
据火山引擎介绍,豆包视频生成模型基于DiT架构,通过高效的DiT融合计算单元,让视频在大动态与运镜中自由切换,拥有变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力。全新设计的扩散模型训练方法更是攻克了多镜头切换的一致性难题,在镜头切换时可同时保持主体、风格、氛围的一致性,这也是豆包视频生成模型独树一帜的技术创新。
经过剪映、即梦AI等业务场景打磨和持续迭代,豆包视频生成模型具备专业级光影布局和色彩调和,画面视觉极具美感和真实感。深度优化的Transformer结构,则大幅提升了豆包视频生成的泛化能力,支持3D动画、2D动画、国画、黑白、厚涂等多种风格,适配电影、电视、电脑、手机等各种设备的比例,不仅适用于电商营销、动画教育、城市文旅、微剧本等企业场景北京电子科技学院提前批,也能为专业创作者和艺术家们提供创作辅助。
据谭待介绍,业内多家大模型目前最高仅支持300K甚至100K的TPM(每分钟token数),难以承载企业生产环境流量。例如某科研机构的文献翻译场景,TPM峰值为360K,某汽车智能座舱的TPM峰值为420K,某AI教育公司的TPM峰值更是达到630K。为此,豆包大模型默认支持800K的初始TPM,远超行业平均水平,客户还可根据需求灵活扩容。
📽(撰稿:仲强睿)滑雪季 送你防护攻略
2024/09/26邰莉澜♹
朝鲜夺得U20女足世界杯冠军
2024/09/26管丹琼🕡
拉夫罗夫:伊朗朝鲜向俄提供导弹?都是美国捏造的
2024/09/26陆琬彬🛂
加速发展新质生产力,吉利携全品牌亮相台州国际车展
2024/09/26耿珊贤⛺
“一个博物院就是一所大学校”(今日谈)
2024/09/26淳于诚露⛆
韩国爆冷出局 无缘亚洲杯决赛
2024/09/25鲁宝菲🖲
“傻姑娘,不这样,我怎能再见到你呢?”
2024/09/25封程姣💒
研究称COVID-19或能导致脑异常 马来西亚4月将重新开放边境|大流行手记(3月8日)
2024/09/25詹威飘w
赵丽颖新片时长126分钟
2024/09/24公孙滢全e
价值1000多万的宾利,失宠后停车库吃灰,浙江仅有1台
2024/09/24习琪欣🏳