火山引擎正式发布实时音视频与低延时视频直播产品-数码影音专区

火山引擎正式发布实时音视频与低延时视频直播产品

作者：辛文辉编辑：辛文辉 2021-12-13 16:36

12月2日下午，「新云·共未来」云产品发布会上，火山引擎召开了5场分论坛：云基础分论坛「云之基石」、视频云分论坛「预见趋“视”」、数据分论坛「数智引擎」、云+体验分论坛「智享盛宴」、生态分论坛「共创生态」。5场分论坛从重点产品介绍、技术实践、客户案例、行业观点、生态共建等角度，对火山引擎的重点云产品进行了全景式的深度解读。其中，「预见趋“视”」从视频云产品介绍、技术实践、客户案例、行业观点四个方面，为大家全面展示了火山引擎的视频云。

12月2日，在「新云·预见趋“视”」分论坛上，火山引擎正式发布了实时音视频产品与低延时视频直播解决方案。

超视频化时代来临

2015年直播连麦兴起，2016年教育数字化起步，2019年云视频会议应用扎堆发布，随之而来的疫情也推动了各行各业的线上视频化。同时，企业和个人用户对视频提出了更高的要求：

清晰度：今天在互联网上已经很少看到高清以下的视频，1080P是标配；

流畅度：用户对于卡顿不再容忍，希望开机就能看到视频，零首帧的要求越来越高；

互动：用户希望能够进行互动，比如连麦、发送弹幕、对视频进行评论等。

为了满足用户需求，火山引擎视频云基于字节跳动音视频技术能力，通过对底层架构、产品能力进行全面优化，为客户提供贴近业务场景的音视频产品与服务。并在云产品发布会上，正式发布了实时音视频产品与低延时视频直播解决方案。

火山引擎实时音视频（Real-Time Communication，RTC）致力于帮助开发者快速构建语音通话、视频通话、直播连麦，提供全球范围内高品质、低延时的实时音视频通信能力。

低延时视频直播解决方案（Ultra-Fast-Media-Streaming，UFMS）基于音视频处理技术和大规模内容分发技术，为直播行业提供直播推流、直播录制、直播鉴权、直播转码、直播时移、数据统计、互动等全套解决方案，让客户快速拥有直播能力。

火山引擎实时音视频：贴合业务场景的RTC最佳实践

图片3.png

火山引擎视频云团队依托覆盖广泛的RTC网络，打造低延时、高可用的实时音视频服务。基于对底层技术架构的不断优化，实现了线上首帧平均时长仅300ms，端到端延时400ms以内，可用性高达99.9%。

对于弱网环境，基于实时、精准的网络预测和自适应拥塞控制策略，火山引擎实时音视频可以实现50%丢包无感知恢复，80%丢包情况下依然可以保证音视频体验流畅。通过应用FEC、ARQ、HARQ、自适应 Jitter Buffer、自适应码率下发等弱网策略，实现端到端音视频QoE优化。

再强的技术，最终也需要服务于业务场景。火山引擎视频云团队基于内部最佳实践，凝聚了对实时交互场景的深刻理解，可以提供更加贴合业务场景的实时音视频服务：

区分不同业务场景的参数配置下发

房间用户规模细分策略

高/中/低端机型适配策略

不同地区、网络模型适配策略

同时，为了将线下场景更好地“复制”到实时互联网中，火山引擎实时音视频进行了多项能力优化：

为满足更多元的业务场景需求，以创新策略不断突破传统RTC厂商主播人数限制，通过服务端混流方案降低方案复杂度，将主播人数提升至1000人，实现“千人聊天”；

为带来更真实的交互体验，支持空间音效功能。多人聊天时，通过空间音效处理，把音源放到不同位置，显著提升各个声源的清晰度和可懂度，为线上交流带来面对面的真实体验感。

从业务视角出发，火山引擎实时音视频还提供更灵活易用的API设计，通过多年沉淀的场景化最佳实践，降低开发者集成复杂度，帮助客户高效开发，平均上线时间由以往的2-3个月缩减至2 周。

火山引擎视频直播：打造更低延时的视频直播能力

图片4.png

全链路直播中，推拉流产生延时是由上下游若干节点堆叠加而成，从采集、编码、推流、CDN网络分发、播放器缓冲等，每一个环节都会产生延时。火山引擎视频云团队通过全链路的改造，最终实现1s以内端到端延迟，打造更低延时的视频直播服务。

全链路各环节的“微创新”不断叠加，最终实现直播效果的“颠覆性”优化。火山引擎视频直播基于RTC实时视频通信框架进行深度定制化，根据客户和地域的不同，灵活定制网络传输策略，在1秒的延时范围下，视频渲染百秒卡顿低于3.7秒。

依托火山引擎、阿里云、腾讯云三方共建的低延时协议标准，定制低延时直播的信令通信协议，使低延时直播的上下行连通成功率大于96.7%；并借助字节跳动的大数据分析平台和成熟的A/B测试灰度实验论证体系，全方位评价低延时中的各种QoS/QoE技术指标，根据客户的用户规模和使用场景，灵活配置直播解决方案的各种技术优化策略。

随着直播的更多应用，连麦、K歌、聊天房等更多直播新玩法也陆续涌现，这对视频直播提出了更多要求：不仅更低延时、更少卡顿，还要更动听、更安全、更个性化。火山引擎基于自研ByteAudio语音处理引擎，满足直播中的各种后处理需求，打造优异的听觉感受。

为了更好地保证“线上演唱会”等场景中付费用户权益，集成防盗链、加密传输、DRM方案（数字版权管理解决方案）等能力。同时，为了更好地满足用户的个性化需求，针对不同场景、网络类型、网络级别、机型打分等，定制不同的参数，并利用AI推理引擎进行参数个性化，让直播更懂用户。

实时音视频与低延时视频直播解决方案，更与火山引擎各核心产品进行深度融合，结合美颜特效、内容审核、语音识别等智能应用，为客户提供系统化的全链路解决方案，助力企业业务创新，赋能各类音视频场景应用，带来更优质的选择和更佳的体验。

关注我们