中国科技快讯网 > 快讯 > AI辨认技能在怎样改动全球流媒体们

AI辨认技能在怎样改动全球流媒体们

2019-11-26 19:09:52 浏览量：8290 作者：责任编辑NO。郑子龙0371

编者按：本文来自微信公众号“涵的硅谷成长笔记”（ID：HanGrowth），作者Han涵，36氪经授权发布。

话说，最近这高质量网综也太多了吧，都看不过来！

我这时间，全耗在各种职场、侦探、语言、演技类节目里了。

那今天，咱就来说说，这些流媒体平台吧。

我一直觉得啊，咱互联网企业的“落地”能力，那是杠杠的。

同样类型的App，对比国外App，国内大厂总有各种新奇的功能，真引领世界。

周末，我看《奇葩说》的时候，就发现爱奇艺在推广一个新玩意儿—— “扫一扫”。

视频旁边，会有个扫面按钮。开始我还不知道，这是干嘛的。

点击了之后才发现，原来是对内容扫描啊，进行人脸识别。然后，会告诉你视频里的人都是谁，还有相关百科。

哇，完美解决观众常见需求—— “这人谁啊？”。

仔细想想，技术上，还真挺难的。

要知道，这可不是机场里面那种 1:1 人脸识别，你可以正对着摄像头，让系统认出来。

你看，诞总和虫仔，视频里根本没看镜头，机器只能根据一部分侧脸做出判断。

在我看看来，类似“扫一扫”的创新功能，改变的可不单单是优化使用者真实的体验。

通过这小小的功能，我看到的是全球流媒体平台们暗潮涌动的技术整体实力的竞争，以及在“识别”这个动作下，人、场、物，正在技术赋予的想象力中串联在一起。

来，我们先“认识”一下

“扫一扫”是众多AI在视频里应用的一个小例子，实际上，AI已经充斥在视频各个环节。

要让AI得到更充分的应用，第一步，当然就是要认识视频里的内容。

这个能力没有，后面都没法玩儿。

来，咱直接先看一个AI最复杂的应用场景—— 艺术创作。

今年7月，Netflix财报披露：公司正在研究利用AI生成预告片。

很快，Netflix就可以快速、大量地，对海量内容自动生成预告，质量还非常高哦。

在降低剪辑师人工成本的同时，这千人千面的预告片，又会增加影片点击率和观看时长。

其实，在2016年时，21世纪福克斯和IBM就推出了Watson系统给自家的惊悚片Morgan自动生成预告片了，只不过不能像Netflix这大批量搞。

这背后的原理其实都类似，一共分两步。

第一步，就是识别并理解内容。

把剪辑好的全片直接倒入，系统首先就会开始对内容进行识别。

比如，进行复杂环境下的人脸识别，认出演员是谁，还能知道谁是主角，谁是群演。

除了人，还会对景色、物体识别，贴上各种标签，比如“公园里”，“家里近景”等等。

另外，还会对台词和配乐分析，识别各个片段的情感，是惊悚还是温情，一目了然。

这一过程想要做到详细，是很耗费时间的，因为要跟其他来源的数据对比。比如IBM的Watson，就需要24小时来完成。

第二步，就是根据既定工业化套路生成预告。

比如，同样是30秒的预告，可以有各种风格，和各种模版音乐，按照相关标准生产即可，再按照每个用户喜好投放。

假设，让你用AI剪辑沈腾的喜剧电影合集，那可以想象出来，这最起码可以有“感人风格”和“爆笑风格”两种模版。

上面这两步里，第一步的“识别”是基础，第二步的“生成”则是应用。

当然，第一步最为重要也是必须，而且同一部影片，系统理解一次之后，结果可以重复利用，赋能更多应用。

第一步的“识别”还真是“基础武功”。正因如此重要，各大流媒体巨头都在重点投入研发。

国内方面，老大哥爱奇艺在研究识别这件事上下了大功夫。比如爱奇艺计算机视觉的研究成果多次被包含ICCV在内的学术会议收录，多次在挑战赛获奖。

爱奇艺还曾直接联合了国内外顶级视觉和多媒体会议，如PRCV2018和ACMMM，首次发起“多模态视频人物识别挑战赛”，还公布了全球最大的明星视频数据集（iQIYI-VID），联手产学研，取得突破。

你问啥是多模态识别？

简单说，就是基于人脸、声纹、姿态、场景等综合识别，这样一来，即使在暗光下、化浓妆、侧脸等等，都能准确识别，它对提升人物识别的精准度很重要，属于AI领域中前沿的技术。

开头提到“扫一扫”能识别半张脸的虫仔，核心能力就来自于这儿。所以这些应用看着好像没什么，但没点硬核技术还真不行。

比如爱奇艺办的这两场大赛，就让它的人物识别精确度大幅提升。不然你以为一家娱乐公司为何需要天天搞技术研发。

当AI系统“识别”了视频内容，那就算是“正式认识”了。在之后，更多的应用可能性，就可以展开了。

“认识”之后，事儿了就好办了

如何利用AI已经“识别”好的视频数据呢？

这时，就要想下流媒体平台的位置了：链接「创作者」和「观众」。

对于「观众」们，就是要想办法提高用户观影体验，而对「创作者」，就能够在一定程度上帮助他们更快更方便的做出好内容。

先看「观众」端。

有了识别的信息以后，最简单的应用就是…直接把结果显示给用户呗。比如，文章开头提到的“扫一扫”。

TV端也有类似的，比如奇异果AI雷达—— 显示明星信息，进入泡泡社区等。

其他相关的应用还有——「只看TA」，腾讯视频和爱奇艺也都支持。

点了之后，用户就可以只看自己爱豆的cut了，比如看一万遍“坤坤唱跳篮球Rap”合集。这背后，就是利用了各种识别技术，人脸、表情、场景等等。

诶？于此推演，我有一个脑洞。

那就是，“只-不看TA”。想一下，是不是对于某些剧啊，综艺啊，你老觉得有些地方比较多余？比如，《亲爱的》里面的回忆画面，还有《破冰》里面的陈珂。是不是感觉，你需要这个功能。

其他的，还有对特定人群的使用优化，比如腾讯视频的儿童模式保护，爱奇艺的AI手语主播片段生成，B站等弹幕网站的智能防挡脸功能等等。

好，那再来看看对「创作者」的应用。

上面提到的预告片自动剪辑，就是一个高级的例子。

国内方面，AI也已经被主要用到两个方面：智能选角色，还有，智能剪辑。

AI选角，能够准确的通过剧情需要和演员信息智能匹配，大大提升选人效率和成功率。爱奇艺的“艺汇”和优酷的“鱼脑”系统，都已经正式商用。

选角的结果，就有《泡沫之夏》的张雪迎、《最好的我们》的刘昊然，还有《长安十二时辰》的雷佳音等等。

剪辑方面，目前已经商用的，更多的，是一个“助手”角色。比如，拍真人秀的时候，需要FollowPD时刻记录，还要后期各种人工打标签，剪辑的时候超级费劲。

有了AI的加持，系统可以快速扫描内容，然后按照明星角色分类，还可以识别各类场景，甚至人物的语言和情绪，给各个片段都打上有用的标签。

比如，在《中国新说唱》后期制作的时候，AI就帮助剪辑师通过特定标签，精准找到需要片段内容，数秒内就可以调出特定人物素材，大大缩短制作时间。

类似的系统和功能，国内各大产都有投入，爱奇艺的智能剪辑，腾讯智能云剪辑，优酷的鲸观剪辑等等。

当然，AI的能力不仅在于提升体验，最重要的，还是帮平台赚钱。

“识别”与流媒体平台的“赚钱引擎”

AI怎么帮流媒体平台赚钱？这里有两个重点应用：视频推荐，以及，广告投放。

当然，这背后都有统一的关键词“匹配”——内容和人，广告和人。

当用户能更快的看到自己想看的内容，会员就会不退订。当用户能发现了自己喜欢的商品，广告主就不会停止花钱，这样整个机器就会运转。

根据Netflix，其平台80%的观看量都来自于推荐引擎。他们希望用户能在1分钟之内开始观看节目，否则用户很有一定的概率会有关掉整个App。

除了常见的，在网站和App上，根据推荐位的权重不同，以及用户的喜好程度推荐视频之外，Netflix还可通过智能识别到的视频图像信息，生成个性化的视频封面。

比如，一部剧里有很多演员，Netflix会先“识别”出不同的角色和演员，之后专门用你喜欢的演员当封面，类似的还可以应用在不同场景和色调上。

比如下面这个《奇怪物语》，就可以生成无数种不同的封面，角色、场景都不同。

另外，还能够准确的通过你看视频的时间和历史内容，体会你的心情变化，推荐不同的视频。比如，一部电影可以有「浪漫」和「惊险」两种风格的封面。你大半夜的，刚看完一部恐怖片，那就会给你用浪漫风格推荐，平复一下心情。

国内方面，推荐能力各家均有部署。

爱奇艺推出了个性化海报，能够准确的通过用户的喜好，“识别”用户喜欢的海报并推送。去年3月，奇异果TV的首页个性化长视频推荐功能落地，为用户更好的提供千人千面的推荐服务。

除了卖会员，广告也是流媒体平台的重要盈利方式。

在之前，视频的贴片广告，就只是随便地插入到视频里，再正常播放就完事了。广告和视频本身几乎分离，使用者真实的体验很差，广告转化率也很低。

后来，YouTube和爱奇艺等头部企业，探索了智能广告插入点，也就是，在适合的情况下插入广告，以减少使用者真实的体验的损失。

最近两年，大家又开始探索，怎样能让广告也和视频内容完美切合。

比如，爱奇艺的创可贴广告，会根据AI对视频内容“识别”的结果，比如不同的场景、角色、演员、情绪、动作、台词等，选取广告点位。

之后，在影片播放过程中，以浮层展示不同品牌形象的广告。

基于不同剧情而推送的广告，其内容与视频情节有了关联，使用者真实的体验和商品转化率都大幅提升。

去年爆款大剧《延禧攻略》上，这类情景广告就有广泛应用，大受广告主喜爱。

看到爱奇艺最新的“扫一扫”功能，我觉得，全新“电视购物”的时代要来了。

自动识别内容+ 电商链接，绝对是一个新亮点。随便看一个什么综艺啊，现代剧啊，就约等于电视购物。

看到节目里面的明星们，在穿啥用啥吃啥，你突然种草了的话，那就直接“扫一扫”视频画面呗，然后你会知道这些商品是什么，然后去直接购买。

这一定是一个新的电商流量入口，再也不用自己去搜什么“xx同款”了。基于准确的识别，实现了人、货、场的连接。

国际方面，YouTube在2017年就尝试广告内容个性化方案，推出Director Mix工具，方便让广告主根据不用用户定制化广告。

比如，同样一款汤类产品的广告：

如果你在看《星际穿越》，那么贴片的广告语就会是“感到世界之外的饥饿了吗？”
而如果你在看《女子监狱》，广告语就变成了“牢里的饭不好吃？
我们的汤好吃。”
要是你在看碧昂斯的《SingleLady》，那就说“一个人吃晚饭？”

根据YouTube，这种和视频内容极度切合的广告方案，让这款新的汤品的品牌认知度提升55%。

“识别”技术和未来

AI在流媒体中的应用，重点就是视频识别技术的各种落地。

从Netflix和爱奇艺等中美流媒体巨头的动作，我们大家可以看出这些年的布局特点。

首先，重点铺研发。从Netflix早年举办轰动业界的百万美金推荐引擎大赛，到爱奇艺最近的识别大赛，都是企业在贴近学界，布局基础能力。

之后，要利用识别到的数据，展开落地应用探索。流媒体们，作为中间平台，向下游，要尝试提升使用者真实的体验的功能，向上游，则要方便节目选角和影片制作。

重点，是要通过强大的AI能力来赚钱，更好的推荐引擎，更优化的广告技术甚至尝试融合电商，都是流媒体们商业化探索的成果。

2019年，随着苹果TV+和迪士尼+正式商用，流媒体的竞争更激烈了。

流媒体的竞赛，除了内容自制和版权领域外，最大的战场就在AI，就在视频识别能力的突破，以及像样儿的落地应用。

5G时代下，没有卡顿的体验和越来越强的AI，将会把用户的最后一滴时间“榨干”，你准备好了吗？

上一篇：GES2019AI+教育论坛实

下一篇：抖音上线创作者学院官

“如果发现本网站发布的资讯影响到您的版权，可以联系本站！同时欢迎来本站投稿！

AI辨认技能在怎样改动全球流媒体们

来，我们先“认识”一下

“认识”之后，事儿了就好办了

“识别”与流媒体平台的“赚钱引擎”

“识别”技术和未来

AI技术赋能内容生产全链路芒果探索“文化+科技”的下一步

全国人大代表刘宏志：推动数字乡村建设、激发乡村振兴“数智力量

情人节不止214 DR钻戒将七夕情人节传至海外

全面继承OPPO旗舰影像算法，一加 Ace 2 Pro 让旗舰影像能力更进

华为智选x膳魔师强势合作，致力于联力打造智能水杯标杆

AI辨认技能在怎样改动全球流媒体们

来，我们先“认识”一下

“认识”之后，事儿了就好办了

“识别”与流媒体平台的“赚钱引擎”

“识别”技术和未来

AI技术赋能内容生产全链路 芒果探索“文化+科技”的下一步

全国人大代表刘宏志：推动数字乡村建设、激发乡村振兴“数智力量

情人节不止214 DR钻戒将七夕情人节传至海外

全面继承OPPO旗舰影像算法，一加 Ace 2 Pro 让旗舰影像能力更进

华为智选x膳魔师强势合作，致力于联力打造智能水杯标杆

AI技术赋能内容生产全链路芒果探索“文化+科技”的下一步