票房预测背后的黑盒子:算法通过《战狼2》预测《哪吒》必火无疑

时间:2019-09-11 来源: 国内新闻

以预测《哪吒》票房为例,猫眼指的是早期阶段的类型和得分因素,以《大圣归来》为参考电影。在《哪吒》的票房趋势被释放后,猫眼发现它类似于《战狼2》。0x9A8B的趋势调整了下一个票房预测。

《战狼2》自发行以来已有一个多月了,所以这部国产动画片的受欢迎程度超出了许多人的期望。

8月7日,Cat Eye预测《哪吒》总票房将达到46.8亿,超过《哪吒》。 8月31日,超过20天后,猫眼数据显示《流浪地球》票房正式超过《哪吒》,成为中国电影史上票房排名第二的电影。

在《流浪地球》屏幕后面,很多人也会有疑问:票房预测的基本原理是什么?在这方面,腾讯科技共同了解该平台并采访了猫眼数据专家,以揭示票房背后的黑匣子预测。

根据“DataHunter”的介绍,电影票房的主要原因有以下三个:

第一个想法可以在视觉上被理解为“捕捉老虎”。原则是市场上已经发布了大量的电影并积累了大量的票房变化数据。深度神经网络模型可以基于某个电影的大量用户行为。数据,票房预测的第一天可以在最终电影上映前一个月给出。

同时,系统自动屏蔽出最相似的电影,描绘将要拍摄的电影的未来票房图表,然后在发行期间预测电影的每日票房和最终的总票房。

Google使用的预测模型仅选择三个维度:电影预告片的搜索量,同一系列的前几部电影的票房表现,以及时间表的季节特征,最终获得94%的预测准确度。

由Google建立的框预测线性回归模型

这种方法的优点是简单直接,更接近传统的大数据分析“只反映趋势,不深入研究因果”的概念,发布时间越长,预测数据越准确,经常用来掌握大量的票房数据。企业。但缺点是它不能考虑电影放映过程中的许多复杂因素,因此常常存在诸如预测波动大且与实际值偏离较大等缺陷。

第二个想法更复杂,考虑因素中将包含更多因素。它首先根据历史票房的变化预测一定时期的票房总量,然后根据社交媒体讨论的数量,不同导演和演员的历史电影质量,预测每部电影的票房比例,评估用户,票房情况和SEO情况。之后,每部电影的实际票房都得到了全面的预测。

这种方法的优点是考虑了更重要的因素,如“电影评估”。电影导演的表现,预发布反馈等因素都用来判断电影的发展趋势,因此预测的准确性更好。影响。

第三个想法是大数据分析和手动决策的结合,即使用大数据分析对胶片的票房进行预先预测并输出可视化数据图表。

与此同时,专家将分析具体的电影,以识别潜在的爆炸或隐患,并评估其可能的影响,并将其纳入模型,以加权方式进行校正。该方法在预测爆炸物方面具有更好的性能。

在与猫眼的对话中,腾讯科技了解到Cat's Eye拥有相对完整的票房预测工具,包括实时票房(包括未来预售票房),日常票房预测(每日)每日3天市场票房预测)和总票房。预测算法(单件总票房)。

由于猫眼的大数据优势(累积了多年的实时票房详细数据,电影级票房和总票房样本以及猫眼平台交易数据),这些算法可以实现非常好的预测结果,如实时票房准确性。超过99%,第二天的票房预测准确率可达到约90%。

另外,除了算法工具外,猫眼还有票房预测专家,会根据经验提供一些建议,算法会产生一定的评审和校对数据,但总体来说算法输出,人为干预的比例很大小。

该算法的基本逻辑是:根据类似电影的票房法预测新电影的票房。类似电影的选择将具有一定的条件(如类型,评级,时间表,盒子大小,近期趋势等),然后根据这些类似的电影,构建一个预测日级票房的机器学习模型或总票房。

以预测《哪吒》票房为例,猫眼指的是早期阶段的类型和得分因素,以《哪吒》为参考电影。在《大圣归来》的票房趋势被释放后,猫眼发现它类似于《哪吒》。0x9A8B的趋势调整了下一个票房预测。在《战狼2》发布期间,预测票房根据多部电影的表现实时调整。

在国外,谷歌也有自己的算法预测模型。 Google的算法模型主要使用搜索,广告点击数据和影院列表来预测票房。 2013年,谷歌宣布其模型预测票房与真实票房相当于94%。

与此同时,谷歌分析了自己的数据,发现在上映的前四周,大部分电影预告片都是在这个时候发布的,并开始密集宣传。因此,现阶段的用户搜索信息与票房有关。会更近。

datahunter还提到了算法大数据预测票房的难点:很多大数据分析工具不考虑因果关系,只考虑相关性,往往会带来“假相关性”问题,也就是说,不能真正解释数据变化的归因。在大多数情况下,这样的预测不是问题,但在某些情况下,偏差预测仍然可能发生。

此外,不成熟的市场环境和潜在的风险因素也将对票房预测产生至关重要的影响。例如,在电影档期的选择和策略的推广上出现错误,可能会导致整部电影票房出现几倍的错误。来自关键演员的负面消息也可能产生不可预测的影响,例如导致《战狼2》被解雇的主演丑闻。

因此,这就引出了下一个问题:如何提高算法预测的精度?

datahunter认为,大数据分析与人工决策相结合的核心原则是利用人工思维的主观能动性和创造性,探索电影票房中潜在但关键的影响因素,并最终得出结论。

对此,猫眼提出的解决方案是:目前的算法是实时训练和预测,即实时选择相似的电影进行新电影的预测,并对模型和预测进行训练。模型的超参数是预先训练好的。短期内没有变化,且算法的精度随样本的增加而提高或更好。当新样本积累到一定程度时,猫眼会重新优化模型(模型选择、超参数优化)。

频道热点
新闻排行
  1. 正如我之前提到的,一位名叫本杰明格兰特的网友专门收集各种卫星图像,目的是改变人们看待地球的方式。以下

    正如我之前提到的,一位名叫本杰明格兰特的网友专门收集各种卫星图像,目的是改变人们看待地球的方式。以下...

  2. ?随着上半年经济数据披露即将结束,中国城市经济竞争格局已初具规模。最近,21数据新闻实验室编制并编制了上半年的经济数据,并获得了“2019年上半年城市GDP百强”。其中,南通上半年实现地区生产总值45

    ?随着上半年经济数据披露即将结束,中国城市经济竞争格局已初具规模。最近,21数据新闻实验室编制并编制了上半年的经济数据,并获得了“2019年上半年城市GDP百强”。其中,南通上半年实现地区生产总值45...

  3. 讴歌NSX可能不如保时捷911那么出名,但经验丰富的车迷必须知道这款日本车可谓是一款令人震惊的非常规日本跑

    讴歌NSX可能不如保时捷911那么出名,但经验丰富的车迷必须知道这款日本车可谓是一款令人震惊的非常规日本跑...

  4. 7月11日,华为新型SPN-AL00型机通过了工业和信息化部的网络访问许可。不幸的是,工业和信息化部没有给出机?

    7月11日,华为新型SPN-AL00型机通过了工业和信息化部的网络访问许可。不幸的是,工业和信息化部没有给出机?...

  5. 18:37:39农村情感在夏天的下午,在村子的广场上,在树荫下,三三两两的老太太坐在树下的长凳上,摇着扇子谈

    18:37:39农村情感在夏天的下午,在村子的广场上,在树荫下,三三两两的老太太坐在树下的长凳上,摇着扇子谈...

  6. 浩言正语455:我们知道,在跑马拉松比赛时,开始的速度有多快,多少力量无法解释。总有一种人可以跑到最后?

    浩言正语455:我们知道,在跑马拉松比赛时,开始的速度有多快,多少力量无法解释。总有一种人可以跑到最后?...

  7. 06:53:59娱乐圈哔哔王最近,郎朗带着这位妻子吉娜爱丽丝参加了一个活动仪式。在现场,郎朗穿着一身黑色西装

    06:53:59娱乐圈哔哔王最近,郎朗带着这位妻子吉娜爱丽丝参加了一个活动仪式。在现场,郎朗穿着一身黑色西装...

  8. 两个已经变成遗址!历史上,吉林省有五个朝代。那么,五大王朝中的哪一个今天呢?吉林站1.吉林市吉林市是吉林省第二大城市。松花江是一个非常适合居住的反S形城市。公元前2世纪,东北第一个少数民族国家成立。

    两个已经变成遗址!历史上,吉林省有五个朝代。那么,五大王朝中的哪一个今天呢?吉林站1.吉林市吉林市是吉林省第二大城市。松花江是一个非常适合居住的反S形城市。公元前2世纪,东北第一个少数民族国家成立。...

  9. 明天尽快!韩国将宣布是否废除韩日军事情报协议数据图(Yonhap)海外网,据韩国联合通讯社韩国总统宫廷清华泰8月21日21日表示,明天(22日)决定是否续约韩国和日本《军事情报保护协定》(GSOMI

    明天尽快!韩国将宣布是否废除韩日军事情报协议数据图(Yonhap)海外网,据韩国联合通讯社韩国总统宫廷清华泰8月21日21日表示,明天(22日)决定是否续约韩国和日本《军事情报保护协定》(GSOMI...

  10. ?今天,又一个大汉奸的家被堵了!  十几名香港市民手持写有“汉奸嘴脸暴露无遗”的标语在李柱铭家门外聚集,高喊“大汉奸!卖国贼!”等口号。  继香港市民10日到“乱港头目”黎智英住所外抗议后,13日,“

    ?今天,又一个大汉奸的家被堵了!  十几名香港市民手持写有“汉奸嘴脸暴露无遗”的标语在李柱铭家门外聚集,高喊“大汉奸!卖国贼!”等口号。  继香港市民10日到“乱港头目”黎智英住所外抗议后,13日,“...

友情链接