句子大全

句子大全 > 句子大全

用事实说话 亚马逊和谷歌如何被数据分析“打脸”的

句子大全 2014-04-21 02:24:09
相关推荐

两家著名的影视剧制作机构分别利用大数据来决定投拍怎样的电视剧,貌似使用同样的方法进行分析,一家未达到预期,另一家的作品却获得了空前的反响。看似方法类似,但为何会有不同的结果呢? 让我们来看看亚马逊和谷歌如何被自己的数据分析打脸的。

今天给大家分享一个TED演讲:如何利用大数据做出正确的判断。演讲者是一个数据科学家Sebastian,他用自己的工作经验对数据分析的不同结果进行了思考,希望能够帮助人们利用大数据更多的做出正确的判断。

失败的亚马逊

相信绝大多数人都没听说过罗伊普莱斯,即便他可能要对大家看电视剧时度过的无聊几分钟负责,而这都源于一个罗伊几年前做出的决定。

这位神秘的罗伊普莱斯就是亚马逊工作室的高级执行官,亚马逊旗下电视制作公司的主管,他的工作责任重大,因为他要负责选择亚马逊要制作的节目的原创内容。如何在众多剧本中选择一部真正非常优秀的电视剧就是罗伊普莱斯需要面临的最重要的考验。

也就是说,他必须找到上图中处在这根线最右端的剧,这跟曲线是,IMDB网站上大约2500个剧的打分分布,打分从1排到10,曲线的高度显示了有多少剧得到了这个分数,所以一部剧要是得了9分或以上,就是绝对优秀的电视剧,这里有前2%的剧,比如说《绝命毒师》、《权力的游戏》、《火线》等,这些都是能够令人上瘾的剧,他要找的就是这类型的电视剧本。

他不需要担心会选择出曲线最左端的电视剧,毕竟犯这么大的错误也是需要智商的,他担心的是,如何避免挑选出处于线条中间的这类平庸电视剧,他要保证的是能挑选出能真正达到线条最右端的高分电视剧,这就有很大的压力了。

于是他举办了一次“竞赛”,他用了一堆关于电视剧的创意,从这些创意中通过评估选出八个候选者,然后做了每一部剧的第一集,把它们放到网上供人们免费观看,最终有数百万人看到了这八部剧的第一集。人们不知道的是,当他们在看电视剧的时候,他们也在被观察着,罗伊普莱斯和他的团队记录下了一切:

人们什么时候点开播放

什么时候按下停止

跳过了哪一段

什么地方在重复看

......

他们收集到了几百万个数据点,以便利用这些数据去决定他们应该制作哪部剧,最终他们分析了所有数据,并且得出了结论:亚马逊应该做一部关于四位参议员的情景喜剧,有人知道这是哪部剧吗?

没错,这部剧就是《阿尔法屋》,很少人知道这部剧,因为它就是一部很平常的剧,上面那条曲线的平均分是7.4分,然而《阿尔法屋》的分数是7.5分。很显然这不是罗伊普莱斯和他的团队所追求的。。。

成功的Netflix

就在罗伊挑选电视剧的同时,在另一家公司,另一位执行官也使用数据分析,做出了一部顶级的电视剧,他的名字叫泰德,Netflix的首席内容官,他也需要不断地去发现精彩和伟大的电视剧,他也用了数据,不同的是他不是用的竞赛,而是和团队一起查看了Netflix观众对已有的电视剧打分的全部数据:

观看历史

观剧类型倾向

......

然后他们用数据发现了关于观众的点点滴滴,观众们:

喜欢什么样的剧

喜欢什么情节

喜欢什么演员

......

当泰德集齐这一切,他们就做了一个具有重大风险的决定,他们决定拍一部不是四位参议员的情景喜剧,而是一部一位参议员的连续剧。没错,这部剧就是《纸牌屋》,并且获得了极大的成功,《纸牌屋》在IMDB的评分是9.1分,这正是泰德想要达到的效果。

问题来了

现在的问题是,到底是什么原因,让两家都很有竞争实力的公司,同样都使用数据分析,都使用了数百万的数据,却取得的完全不同的效果,这究竟是为什么呢?

过去的数据分析常识和经验告诉我们,如果拥有了大量的优质数据,理论上应该能做出一个很好的决定,并且上述的要求也仅仅是想要找出一部好的电视剧而已,如果数据分析在这种小事上都不管用了,那就有点吓人了。因为在我们生活的时代,数据越来越重要,有许多比寻找一部优质的电视剧更加严肃的决定都需要依靠数据来做。

事实上,并不是类似于亚马逊这样的数据分析公司不知道如何处理数据,而是大多数数据分析公司都会做出错误的结果和决定。甚至谷歌有时候也会做错,2009年的时候谷歌宣布他们能够用数据分析预测流感的爆发,就用谷歌搜索的数据进行分析,他们做的很好,在当时的新闻中引起轰动,甚至在科学研究上取得了一个高峰,在《自然》杂志上发表了文章,很多年来他们都预测的很好,直到有一年他们失败了,没有人知道为什么,那一年的预测就是不准了。当然,这也成为了一个大新闻,谷歌从《自然》杂志上撤回了文章。

所以,最善于处理数据的亚马逊和谷歌有时也会出错,并且这些错误也迅速进入了实际生活的决策领域,在各个领域对人们的生活造成着影响。所以我们需要更好的保证数据能够帮助我们做出更好的决定。

成功的决定与失败的决定之间的区别

经过这么多年,我发现了一个规律或者是模式,能够用来解释用数据做出正确的决定和做失败的决定之间的区别,它是这样的:不论何时,当你解决复杂问题的时候,你总的来说是在做两件事。

数据分析通常都有两个重要的步骤:

1. 把问题拆分,好深度分析细节;

2. 把这些细节整合,然后得出结论。

然而现在最关键的是,数据和数据分析只对第一步来说是好的,数据和数据分析不论有多么强大,只能帮助你把问题分开来一点一点理解,而并不适合把每一个点的分析结果合拢起来得到结论。有另一个工具可以帮助我们来做合拢这件事,这个工具就是我们的头脑,我们的大脑是最擅长把各种碎片合拢然后得出结论的,特别是某领域的专家或者聪明人的脑子。

我相信这就是Netflix成功的原因,因为在他们的分析过程中分别使用了数据和头脑。他们首先使用数据理解观众的点点滴滴,然后通过这些点点滴滴的结论做出了一个冒着很大风险的决定。而另一方面,亚马逊所做的正好相反,他们一直用数据来引导他们的决定,当然这是一个很安全的决定,因为他们总是可以指着数据说,这个结论是数据告诉我们的,但是这不能导向他们所期待的惊人结果。

所以,数据当然是对做决定很有用的工具,但我相信,当决定被数据牵着走,就有哪里不对了,不管数据多有威力,它只是一个工具。所以特别是对于一个专家或者是想要在某个领域有突出表现的人而言,如果你想取得非凡的成就,还是需要冒一个险才会获得巨大的回报。

因为最终并不是数据,而是风险,才让你落在了成功曲线的最右端。

编后语:但是随着这几年人工智能越来越火热和成熟,不知道大家还认同以上这个看法吗?

阅读剩余内容
网友评论
相关内容
拓展阅读
最近更新