数码影音 频道

火山引擎正式发布实时音视频与低延时视频直播产品

12月2日下午,「新云·共未来」云产品发布会上,火山引擎召开了5场分论坛:云基础分论坛「云之基石」、视频云分论坛「预见趋“视”」、数据分论坛「数智引擎」、云+体验分论坛「智享盛宴」、生态分论坛「共创生态」。5场分论坛从重点产品介绍、技术实践、客户案例、行业观点、生态共建等角度,对火山引擎的重点云产品进行了全景式的深度解读。其中,「预见趋“视”」从视频云产品介绍、技术实践、客户案例、行业观点四个方面,为大家全面展示了火山引擎的视频云。

12月2日,在「新云·预见趋“视”」分论坛上,火山引擎正式发布了实时音视频产品与低延时视频直播解决方案。

超视频化时代来临

2015年直播连麦兴起,2016年教育数字化起步,2019年云视频会议应用扎堆发布,随之而来的疫情也推动了各行各业的线上视频化。同时,企业和个人用户对视频提出了更高的要求:

清晰度:今天在互联网上已经很少看到高清以下的视频,1080P是标配;

流畅度:用户对于卡顿不再容忍,希望开机就能看到视频,零首帧的要求越来越高;

互动:用户希望能够进行互动,比如连麦、发送弹幕、对视频进行评论等。

为了满足用户需求,火山引擎视频云基于字节跳动音视频技术能力,通过对底层架构、产品能力进行全面优化,为客户提供贴近业务场景的音视频产品与服务。并在云产品发布会上,正式发布了实时音视频产品与低延时视频直播解决方案。

火山引擎实时音视频(Real-Time Communication,RTC)致力于帮助开发者快速构建语音通话、视频通话、直播连麦,提供全球范围内高品质、低延时的实时音视频通信能力。

低延时视频直播解决方案(Ultra-Fast-Media-Streaming,UFMS)基于音视频处理技术和大规模内容分发技术,为直播行业提供直播推流、直播录制、直播鉴权、直播转码、直播时移、数据统计、互动等全套解决方案,让客户快速拥有直播能力。

火山引擎实时音视频:贴合业务场景的RTC最佳实践

图片3.png

火山引擎视频云团队依托覆盖广泛的RTC网络,打造低延时、高可用的实时音视频服务。基于对底层技术架构的不断优化,实现了线上首帧平均时长仅300ms,端到端延时400ms以内,可用性高达99.9%。

对于弱网环境,基于实时、精准的网络预测和自适应拥塞控制策略,火山引擎实时音视频可以实现50%丢包无感知恢复,80%丢包情况下依然可以保证音视频体验流畅。通过应用FEC、ARQ、HARQ、自适应 Jitter Buffer、自适应码率下发等弱网策略,实现端到端音视频QoE优化。

再强的技术,最终也需要服务于业务场景。火山引擎视频云团队基于内部最佳实践,凝聚了对实时交互场景的深刻理解,可以提供更加贴合业务场景的实时音视频服务:

区分不同业务场景的参数配置下发

房间用户规模细分策略

高/中/低端机型适配策略

不同地区、网络模型适配策略

同时,为了将线下场景更好地“复制”到实时互联网中,火山引擎实时音视频进行了多项能力优化:

为满足更多元的业务场景需求,以创新策略不断突破传统RTC厂商主播人数限制,通过服务端混流方案降低方案复杂度,将主播人数提升至1000人,实现“千人聊天”;

为带来更真实的交互体验,支持空间音效功能。多人聊天时,通过空间音效处理,把音源放到不同位置,显著提升各个声源的清晰度和可懂度,为线上交流带来面对面的真实体验感。

从业务视角出发,火山引擎实时音视频还提供更灵活易用的API设计,通过多年沉淀的场景化最佳实践,降低开发者集成复杂度,帮助客户高效开发,平均上线时间由以往的2-3个月缩减至2 周。

火山引擎视频直播:打造更低延时的视频直播能力

图片4.png

全链路直播中,推拉流产生延时是由上下游若干节点堆叠加而成,从采集、编码、推流、CDN网络分发、播放器缓冲等,每一个环节都会产生延时。火山引擎视频云团队通过全链路的改造,最终实现1s以内端到端延迟,打造更低延时的视频直播服务。

全链路各环节的“微创新”不断叠加,最终实现直播效果的“颠覆性”优化。火山引擎视频直播基于RTC实时视频通信框架进行深度定制化,根据客户和地域的不同,灵活定制网络传输策略,在1秒的延时范围下,视频渲染百秒卡顿低于3.7秒。

依托火山引擎、阿里云、腾讯云三方共建的低延时协议标准,定制低延时直播的信令通信协议,使低延时直播的上下行连通成功率大于96.7%;并借助字节跳动的大数据分析平台和成熟的A/B测试灰度实验论证体系,全方位评价低延时中的各种QoS/QoE技术指标,根据客户的用户规模和使用场景,灵活配置直播解决方案的各种技术优化策略。

随着直播的更多应用,连麦、K歌、聊天房等更多直播新玩法也陆续涌现,这对视频直播提出了更多要求:不仅更低延时、更少卡顿,还要更动听、更安全、更个性化。火山引擎基于自研ByteAudio语音处理引擎,满足直播中的各种后处理需求,打造优异的听觉感受。

为了更好地保证“线上演唱会”等场景中付费用户权益,集成防盗链、加密传输、DRM方案(数字版权管理解决方案)等能力。同时,为了更好地满足用户的个性化需求,针对不同场景、网络类型、网络级别、机型打分等,定制不同的参数,并利用AI推理引擎进行参数个性化,让直播更懂用户。

实时音视频与低延时视频直播解决方案,更与火山引擎各核心产品进行深度融合,结合美颜特效、内容审核、语音识别等智能应用,为客户提供系统化的全链路解决方案,助力企业业务创新,赋能各类音视频场景应用,带来更优质的选择和更佳的体验。

0
相关文章