豆包大模型发布视频生成模型，语义理解精准、画质高保真-数码影音专区

豆包大模型发布视频生成模型，语义理解精准、画质高保真

作者：网络编辑：关关 2024-09-27 09:17

　　火山引擎总裁谭待

　　“截至到9月，豆包大模型的日均 tokens 使用量已经超过1.3万亿，4个月的时间里 tokens 整体增长超过了10倍。在多模态方面，豆包·文生图模型日均生成图片5,000万张，此外，豆包目前日均处理语音85万小时。”火山引擎总裁谭待表示。

　　9月24日，2024火山引擎 AI 创新巡展在深圳举办，带来豆包大模型最新进展。豆包大模型家族迎来新成员，全新发布豆包·视频生成模型以及豆包·音乐模型、豆包·同声传译模型。豆包通用模型pro 和文生图模型、语音合成模型等垂类模型大幅升级，不断增加的各类模态以及规模化的调用量，让豆包大模型“更强模型、更低价格、更易落地”的优势持续凸显。其中，主力模型“豆包通用模型pro”最新版本在各维度上国内领先，模型效果持续增强。

　　火山引擎正式发布豆包·视频生成模型

　　全面加速 AIGC 应用创新

　　精准的语义理解

　　多动作多主体交互

　　豆包·视频生成模型能遵从复杂 prompt，解锁时序性多拍动作指令与多个主体间的交互能力。

　　强大动态与酷炫运镜

　　告别PPT动画

　　可以让视频在主体的大动态与镜头中炫酷切换，拥有变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力，灵活控制视角，带来真实世界的体验。

　　一致性多镜头生成

　　10秒讲一个完整故事

　　成功攻克多镜头切换时一致性的技术挑战，在一个 prompt 内实现多个镜头切换，同时保持主体、风格、氛围的一致性。

　　高保真高美感

　　多风格多比例

　　支持包括黑白、3D 动画、2D 动画、国画等多种风格，包含1:1、3:4、4:3、16:9、9:16、21:9 六个比例，适配于各种终端，以及电影、手机竖屏等不同画幅。

　　强大画面效果的背后，是字节跳动在视频大模型技术研发的不断投入。

　　视频生成能力，为众多企业场景带来创新。例如在电商营销场景，豆包·视频生成模型不仅快速把商品变成 3D 动态多角度展示，还能配合中秋、七夕、春节等节点替换背景和风格，生成不同尺寸快速上架；在动画教育场景，豆包·视频生成模型可以大幅降低动画的制作成本，生动的呈现童话故事情节。

　　此外，还有城市文旅、音乐 MV、微电影、短剧等应用场景，都可以通过豆包·视频生成模型实现降本提效和创意合规。

　　豆包大模型家族成员更加丰富，模型能力持续升级，为大模型在多模态、多元化方面的落地应用打下了良好的基础。火山引擎将继续推进模型能力的不断升级与迭代，探索模型能力在更多场合的应用，持续为企业借助大模型实现云上智能化注入动力。

特别提醒：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

关注我们