当前位置:新闻中心行业动态 → 正文

金山云打造AI黑科技:集智高清创造视频新体验

责任编辑:cres |来源:企业网D1Net  2018-10-22 15:10:31 本文摘自:中华网

对于国内的移动视频用户来说,从2015年到现在,可谓是“视界大开”,VR、短视频、移动直播纷至沓来,移动视频的广阔前景让人们浮想联翩,也成就了一个又一个的商业传奇。

视频云服务在其中功不可没,其不断降低移动视频的准入门槛,让视频与各行各业的融合成为常态。与此同时,随着移动终端的升级和网络环境的改变,用户对视频的上传和播放提出了更高要求,产生了新的痛点。对此,在最近的LiveVideoStackCon 2018音视频技术大会上,金山云高级总监武爱敏发表主题演讲,与听众分享了目前如火如荼的人工智能技术,是如何为金山云的视频云服务赋能,解决视频行业痛点的。

金山云高级总监武爱敏发表主题演讲

人工智能:破除视频业痛点的利器

视频行业的繁荣,催生了专业化的服务,云服务商的入场就是典型的例子。从早期的存储、CDN,到现在的大数据、人工智能,服务内容的多样化,让视频行业企业专注于自身的核心业务,更加灵活地应对行业变化。

但这并不代表视频行业可高枕无忧,行业的三个痛点仍然待解。首先,内容越来越丰富、清晰度不断提升,使得用户对观看体验的要求近乎无止境,高画质、零卡顿、超低延时、安全稳定......有数据显示,遇到视频播放卡顿或加载时间太长,66%的用户会直接退出当前的播放,严重的卡顿会使用户的满意程度从接近满分跌到几乎为零。

第二,对于视频行业而言,带宽是无法忽视的问题。昂贵的带宽费用,让许许多多想在视频行业一展拳脚的公司望而却步,对于视频行业巨头来说,从他们的成本结构中可以看到,带宽成本如果居高不下,长期处于“烧钱”状态,也会对他们在行业中的口碑和地位造成影响。

第三,视频行业有着非常丰富的内容,但同时也有着内容的红线。为了确保平台上的内容不会出现有害信息,视频平台需要对内容进行严格审核,完善内容管控机制,改善内容推荐算法,这也需要耗费大量人力成本。

这些痛点需要依靠技术上的不断突破才能缓解。“依靠算法、算力和大数据支撑的人工智能技术,将成为赋能视频云、解决视频行业客户痛点的重要工具”,武爱敏表示。

四大黑科技加持金山云集智高清

“一直以来,金山云通过不断加大人工智能技术的研发投入,推动相关的应用不断落地”,武爱敏介绍了金山云最新推出的集智高清(Kingsoft smart high definition,简称KSHD),“集智高清围绕人眼结构特性,将编码、图像处理和人工智能进行整合,通过自研算法和深度神经网络,对视频内容进行感知,为客户节省20%—40%视频传输带宽,为用户带来更好的视觉感受”。

集智高清之所以能够提升视觉效果,为客户节省成本,是因为有四大黑科技加持,首先是灯光建模。由于我国的用电频率是50Hz,灯光频闪很难完全避免。人眼的视锥细胞负责感光,视锥细胞在经历一次刺激之后,无法对二次刺激产生反应。

但对室内场景来说,多光源的频闪照射到物体上引起的反射,将会对视频编码带来极大的负担。集智高清的研发团队对室内光源位置进行建模,将人眼感受不到的灯光和反光消除,将纹理保存下来,帮助直播平台节省更多带宽。

第二,画质增强。人眼的视锥细胞负责感受亮视觉,视杆细胞负责感受暗视觉,在明暗转换过程中,细胞的激活需要时间。针对人眼对光的感受特性,集智高清提供了多种模型进行画质增强,包括暗场增强、细节恢复、去除拍摄或压缩产生的噪声、超分辨率等等,并将最优结果进行融合操作,实现用户无感知下对各种不同场景的自动应对。

第三,视频聚焦。集智高清的ROI处理技术,可根据人眼最敏感最关注的内容做视觉感知保护,实现画质增强的同时节省至少20%的带宽。

第四,恰可感知失真。人眼视觉系统能够适应的光强度(朗伯)级别范围很宽,从暗阈值到强闪光阈值可以达到10的10次方量级。然而,当背景光保持恒定的时候,人眼能够感受到的范围是有限的,典型的观察者可以分辨总共12级到24级的不同光强度变化,而观察者可以分辨的级数会根据其环境光源强度、高频/低频区域有着很大的差异。通过大量的统计建模,集智高清集成了最符合人眼视觉系统的恰可感知失真技术,可以做到同画质下节省5%—25%的码率。

破除技术和成本壁垒,更好应对需求

有了黑科技的护持,集智高清在游戏、体育赛事、秀场直播以及VR、短视频等多种场景和形态上,有着广泛的应用。在视频场景识别方面,集智高清针对游戏、新闻、秀场、动漫、体育、短视频等多种类型内容,分别建立视频模型,以便根据不同的视频场景进行分类实时识别,根据不同场景的识别结果,配置适合此类场景的编码参数,根据纹理和运动变化幅度等,选择最优编码模板参数。

在视频场景分类上,集智高清通过深度学习,形成了十余大类,几十种小类视频场景模型库。客户在使用集智高清服务时,可实时分析直播流,匹配相应的视频场景模型,根据客户对视频画质的要求,对画质进行实时处理。

“我们希望集智高清能够成为视频行业的加速器,为客户的业务创新和行业的技术演进贡献力量”,武爱敏表示,视频云服务受到移动视频行业的驱动,但是反过来也能促进移动视频行业的繁荣,金山云作为视频云服务的领军企业,将帮助客户更好应对移动视频日益复杂多样的场景和需求,破除技术和成本壁垒,帮助客户建立竞争优势,为用户提供更加多元化和个性化的服务。

关键字:金山云

本文摘自:中华网

x 金山云打造AI黑科技:集智高清创造视频新体验 扫一扫
分享本文到朋友圈
当前位置:新闻中心行业动态 → 正文

金山云打造AI黑科技:集智高清创造视频新体验

责任编辑:cres |来源:企业网D1Net  2018-10-22 15:10:31 本文摘自:中华网

对于国内的移动视频用户来说,从2015年到现在,可谓是“视界大开”,VR、短视频、移动直播纷至沓来,移动视频的广阔前景让人们浮想联翩,也成就了一个又一个的商业传奇。

视频云服务在其中功不可没,其不断降低移动视频的准入门槛,让视频与各行各业的融合成为常态。与此同时,随着移动终端的升级和网络环境的改变,用户对视频的上传和播放提出了更高要求,产生了新的痛点。对此,在最近的LiveVideoStackCon 2018音视频技术大会上,金山云高级总监武爱敏发表主题演讲,与听众分享了目前如火如荼的人工智能技术,是如何为金山云的视频云服务赋能,解决视频行业痛点的。

金山云高级总监武爱敏发表主题演讲

人工智能:破除视频业痛点的利器

视频行业的繁荣,催生了专业化的服务,云服务商的入场就是典型的例子。从早期的存储、CDN,到现在的大数据、人工智能,服务内容的多样化,让视频行业企业专注于自身的核心业务,更加灵活地应对行业变化。

但这并不代表视频行业可高枕无忧,行业的三个痛点仍然待解。首先,内容越来越丰富、清晰度不断提升,使得用户对观看体验的要求近乎无止境,高画质、零卡顿、超低延时、安全稳定......有数据显示,遇到视频播放卡顿或加载时间太长,66%的用户会直接退出当前的播放,严重的卡顿会使用户的满意程度从接近满分跌到几乎为零。

第二,对于视频行业而言,带宽是无法忽视的问题。昂贵的带宽费用,让许许多多想在视频行业一展拳脚的公司望而却步,对于视频行业巨头来说,从他们的成本结构中可以看到,带宽成本如果居高不下,长期处于“烧钱”状态,也会对他们在行业中的口碑和地位造成影响。

第三,视频行业有着非常丰富的内容,但同时也有着内容的红线。为了确保平台上的内容不会出现有害信息,视频平台需要对内容进行严格审核,完善内容管控机制,改善内容推荐算法,这也需要耗费大量人力成本。

这些痛点需要依靠技术上的不断突破才能缓解。“依靠算法、算力和大数据支撑的人工智能技术,将成为赋能视频云、解决视频行业客户痛点的重要工具”,武爱敏表示。

四大黑科技加持金山云集智高清

“一直以来,金山云通过不断加大人工智能技术的研发投入,推动相关的应用不断落地”,武爱敏介绍了金山云最新推出的集智高清(Kingsoft smart high definition,简称KSHD),“集智高清围绕人眼结构特性,将编码、图像处理和人工智能进行整合,通过自研算法和深度神经网络,对视频内容进行感知,为客户节省20%—40%视频传输带宽,为用户带来更好的视觉感受”。

集智高清之所以能够提升视觉效果,为客户节省成本,是因为有四大黑科技加持,首先是灯光建模。由于我国的用电频率是50Hz,灯光频闪很难完全避免。人眼的视锥细胞负责感光,视锥细胞在经历一次刺激之后,无法对二次刺激产生反应。

但对室内场景来说,多光源的频闪照射到物体上引起的反射,将会对视频编码带来极大的负担。集智高清的研发团队对室内光源位置进行建模,将人眼感受不到的灯光和反光消除,将纹理保存下来,帮助直播平台节省更多带宽。

第二,画质增强。人眼的视锥细胞负责感受亮视觉,视杆细胞负责感受暗视觉,在明暗转换过程中,细胞的激活需要时间。针对人眼对光的感受特性,集智高清提供了多种模型进行画质增强,包括暗场增强、细节恢复、去除拍摄或压缩产生的噪声、超分辨率等等,并将最优结果进行融合操作,实现用户无感知下对各种不同场景的自动应对。

第三,视频聚焦。集智高清的ROI处理技术,可根据人眼最敏感最关注的内容做视觉感知保护,实现画质增强的同时节省至少20%的带宽。

第四,恰可感知失真。人眼视觉系统能够适应的光强度(朗伯)级别范围很宽,从暗阈值到强闪光阈值可以达到10的10次方量级。然而,当背景光保持恒定的时候,人眼能够感受到的范围是有限的,典型的观察者可以分辨总共12级到24级的不同光强度变化,而观察者可以分辨的级数会根据其环境光源强度、高频/低频区域有着很大的差异。通过大量的统计建模,集智高清集成了最符合人眼视觉系统的恰可感知失真技术,可以做到同画质下节省5%—25%的码率。

破除技术和成本壁垒,更好应对需求

有了黑科技的护持,集智高清在游戏、体育赛事、秀场直播以及VR、短视频等多种场景和形态上,有着广泛的应用。在视频场景识别方面,集智高清针对游戏、新闻、秀场、动漫、体育、短视频等多种类型内容,分别建立视频模型,以便根据不同的视频场景进行分类实时识别,根据不同场景的识别结果,配置适合此类场景的编码参数,根据纹理和运动变化幅度等,选择最优编码模板参数。

在视频场景分类上,集智高清通过深度学习,形成了十余大类,几十种小类视频场景模型库。客户在使用集智高清服务时,可实时分析直播流,匹配相应的视频场景模型,根据客户对视频画质的要求,对画质进行实时处理。

“我们希望集智高清能够成为视频行业的加速器,为客户的业务创新和行业的技术演进贡献力量”,武爱敏表示,视频云服务受到移动视频行业的驱动,但是反过来也能促进移动视频行业的繁荣,金山云作为视频云服务的领军企业,将帮助客户更好应对移动视频日益复杂多样的场景和需求,破除技术和成本壁垒,帮助客户建立竞争优势,为用户提供更加多元化和个性化的服务。

关键字:金山云

本文摘自:中华网

电子周刊
回到顶部

关于我们联系我们版权声明隐私条款广告服务友情链接投稿中心招贤纳士

企业网版权所有 ©2010-2024 京ICP备09108050号-6 京公网安备 11010502049343号

^