新闻30

 

新闻30

🕙➀😾     

新闻30

活动现场展示的视频生成效果令人惊叹。无论是语义理解能力,多个主体运动的复杂交互画面,还是多镜头切换的内容一致性,豆包视频生成大模型均达到业界先进水平。火山引擎总裁谭待表示,“视频生成有很多难关亟待突破。豆包两款模型会持续演进,在解决关键问题上探索更多可能性,加速拓展AI视频的创作空间和应用落地。”

据火山引擎介绍,豆包视频生成模型基于DiT架构,通过高效的DiT融合计算单元,让视频在大动态与运镜中自由切换,拥有变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力。全新设计的扩散模型训练方法更是攻克了多镜头切换的一致性难题新闻30,在镜头切换时可同时保持主体、风格、氛围的一致性,这也是豆包视频生成模型独树一帜的技术创新。

经过剪映、即梦AI等业务场景打磨和持续迭代,豆包视频生成模型具备专业级光影布局和色彩调和,画面视觉极具美感和真实感。深度优化的Transformer结构,则大幅提升了豆包视频生成的泛化能力,支持3D动画、2D动画、国画、黑白、厚涂等多种风格,适配电影、电视、电脑、手机等各种设备的比例,不仅适用于电商营销、动画教育、城市文旅、微剧本等企业场景,也能为专业创作者和艺术家们提供创作辅助。

据谭待介绍,业内多家大模型目前最高仅支持300K甚至100K的TPM(每分钟token数),难以承载企业生产环境流量。例如某科研机构的文献翻译场景,TPM峰值为360K,某汽车智能座舱的TPM峰值为420K,某AI教育公司的TPM峰值更是达到630K。为此,豆包大模型默认支持800K的初始TPM,远超行业平均水平,客户还可根据需求灵活扩容。

❖(撰稿:穆璐斌)

本文来自网友发表,不代表本网站观点和立场,如存在侵权问题,请与本网站联系。未经本平台授权,严禁转载!
展开
支持楼主

37人支持

阅读原文阅读 8807回复 4
举报
    全部评论
    • 默认
    • 最新
    • 楼主
    • 祁雁腾🕺LV9六年级
      2楼
      2024年东城区育人故事讲述活动举办📱
      2024/09/25   来自遵义
      0回复
    • 🐝房彩茗LV2大学四年级
      3楼
      辟谣无人驾驶车坠江🐅
      2024/09/25   来自宿豫
      4回复
    • 闵元忠📟LV2幼儿园
      4楼
      国企改革概念掀涨停潮 保变电气14天10板 还会涨吗?❍
      2024/09/25   来自阳泉
      0回复
    • 姬珍永LV4大学三年级
      5楼
      延续好状态张雨霏半决赛第一名晋级全锦赛50米蝶泳决赛☴
      2024/09/25   来自鞍山
      7回复
    • 苏融仪❃⏹LV0大学三年级
      6楼
      领悟理论的伟力🚵
      2024/09/25   来自湘潭
      8回复
    • 梅萱恒LV2大学四年级
      7楼
      走进重庆民主村,感受老旧小区的新生🕠
      2024/09/25   来自安康
      回复
    你的热评
    游客
    发表评论
    最热圈子
    • #王沪宁主持召开全国政协主席会议#

      舒园安

      4
    • #充分发挥刑事审判职能 依法严惩海上走私犯罪#

      姬欢儿

      6
    • #“时隔8年,菲律宾又准备谋划提起新仲裁”#

      房清睿

      3
    • #中国式现代化的世界意义:创造人类文明新形态

      伏哲伟

      4
    热点推荐

    安装应用

    随时随地关注新闻30

    Sitemap
    安全检测