本篇文章4563字,读完约11分钟
世界杯期间,各大科技巨头利用大数据预测比赛结果,重现了“章鱼保罗”的辉煌。世界杯已经结束,但大数据预测它将会继续。从晚上观察天空到天气预报,从童话中的水晶球到今天的科技预言家,从地震云的传说到科学家们对地震的预测,人类一直希望突破局限,更早地看到未来。随着信息革命的深入,大数据时代的预测变得更加容易,大数据预测正在深刻地改变人类的生活。大数据预测的逻辑基础是,每一个非常规变化都必须事先有征兆,每一件事都有迹可循。如果发现了符号和变化之间的规律,它是可以预测的。大数据预测不能确定某事会发生,它更多的是给出一个概率。
从天气预报角度看大数据预测的四个条件
在互联网出现之前,已经有了基于大数据的预测分析:天气预报。由于有了互联网,以天气预报为代表的大数据预报的以下特点在更多的领域得到了体现。
关注最关心的金融话题,一起讨论。
1.大数据预测的及时性。天气预报的粒度从几天缩短到几小时,这就要求严格的时效性。基于大量的数据,它是用传统的方法计算出来的,而明天已经到来,所以预测是毫无价值的。大数据预测在其他领域的应用特点对“时效性”有更高的要求,如股票市场和实时定价,而云计算、分布式计算和超级计算机的发展提供了这样的高速计算能力。
2.大数据预测的数据源。气象预报需要收集大量的气象数据,这些数据由气象卫星和气象站收集,但是整个系统的部署、运行和维护成本很高。在互联网出现之前,很少有领域具备这样的数据收集能力。网络1.0是一种集中的信息生成,网络2.0是一种社交创造,移动互联网是一种随时随地的社交和多设备数据上传。每次进化数据收集的成本大大降低,范围和规模也大大扩大。当大数据被引爆时,大数据预测所需的数据源不再是问题。
3.大数据预测的动态本质。计算因素在不同时间点动态变化,任何变量都会引起整个系统的变化,甚至产生蝴蝶效应。如果一个变量在结果中起着决定性的作用并且很难捕捉,那么它就更难预测,比如人为因素。大数据预测的应用场景大多是有固定规则的不稳定领域,如天气、股市和疾病。这要求预测系统准确地捕捉每个变量的数据,并近乎实时地调整预测。在发达的传感器网络之外增加数据计算能力使得上述两点变得更容易。
4.大数据预测的规律性。大数据预测和传统的基于抽样的预测的区别在于,它发现了基于大量历史数据和实时动态数据的数据和结果之间的规律,假设这种规律将继续下去,并在预测之前捕获变量。一个领域本身有一个相对稳定的规律,大数据预测有机会得到应用。古人在夜间对天空的观察表明,天气是有规律可循的,因此天气预报被首次应用。负面的例子是难以捉摸的定律、由数据来源收集的困难的地震预测,以及双色球彩票。
大数据预测的典型应用领域
互联网给大数据预测应用的普及带来了便利。除了天气预报,还有哪些领域正在或可能被大数据预报所改变?结合国内外案例,以下11个领域是大数据预测最有前途的应用领域。
1.体育赛事预测
世界杯期间,谷歌、百度、微软、高盛等公司都推出了预测比赛结果的平台。百度的预测结果最引人注目,准确率为67%,进入淘汰赛后准确率为94%。现在,互联网公司取代章鱼“保罗”来测试水上赛事的预测,这意味着未来的体育赛事将由大数据预测来控制。
谷歌世界杯预测基于opta体育的大量赛事数据建立了最终预测模型。百度搜索了过去五年全球987支球队(包括国家队和俱乐部队)的3.7万场比赛的数据。与此同时,百度与中国彩票网站乐彩和欧洲必发指数(Betfair Index)数据提供商spdex合作,引入游戏市场预测数据,建立了包括199,972名玩家和1.12亿条数据的预测模型,并在此基础上对结果进行预测。
从互联网公司的成功经验来看,只要有体育赛事的历史数据,并与指数公司合作,我们就可以预测其他赛事,如冠军联赛和nba。
2.股票市场预测
去年,华威商学院和波士顿大学物理系的研究发现,用户通过谷歌搜索的金融关键词可能是金融市场的趋势,相应的投资策略收益高达326%。此前,一些专家试图通过twitter博客帖子预测股市波动。
从理论上讲,股市预测更适合美国。中国股市不能双向获利。只有当股票上涨时才能获利,这将吸引一些人利用信息不对称来改变股票市场的规则。因此,如果中国股市没有相对稳定的规律,就很难预测,而且一些对结果有决定性影响的变量数据根本无法监控。
3.市场价格预测
Cpi代表已经发生的价格波动,但统计局的统计数据并不具有权威性。但是大数据可以帮助人们理解未来的价格趋势,并提前预测通货膨胀或经济危机。最典型的例子是马云通过阿里b2b大数据提前知道了亚洲金融危机,这当然是阿里数据团队的功劳。
预测一种商品的价格更容易,尤其是像机票这样的标准化产品。无论你去哪里,提供的“机票日历”都是价格预测,告诉你几个月内机票的大概价格。在完全竞争的市场中,商品的生产、渠道成本和毛利相对稳定,与价格相关的变量相对固定。在电子商务平台上可以实时监控商品的供求关系,从而预测价格。基于预测结果,可以提供关于购买时间的建议,或者可以指导企业进行动态价格调整和营销活动以使利润最大化。
4.用户行为预测
基于用户的搜索行为、浏览行为、评论历史和个人数据,互联网服务可以洞察消费者的整体需求,进而进行有针对性的产品生产、改进和营销。《纸牌屋》中演员和情节的选择、百度基于用户偏好的精准广告营销、阿里根据天猫用户特征定制产品、亚马逊对用户点击行为的预测以及提前交付都得益于互联网用户的行为预测。
得益于传感器技术和物联网的发展,离线用户行为洞察正在酝酿之中。免费商用wifi、ibeacon技术、摄像头图像监控、室内定位技术、nfc传感器网络、排队呼叫系统等,可以查询用户离线移动、停留、出行规则等数据。用于精确营销或产品定制。
5.人类健康预测
中医可以通过看、听、问来发现人体内隐藏的一些慢性病,甚至可以通过观察一个人的体质来知道他将来会有什么症状。人体体征的变化是有规律的,但在慢性病发生前仍有一些持续性的异常。理论上,如果大数据掌握了这种异常情况,它就可以预测慢性病。
结合智能硬件,慢性病的大数据预测成为可能。可穿戴设备和智能健康设备帮助网络收集人体健康数据,如心率、体重、血脂、血糖、运动量、睡眠量等。如果这些数据足够准确和全面,并且有一个慢性病预测模型可以形成一个算法,也许你的设备会提醒你的身体将来患某种慢性病的风险。我在kickstarter上的spiroo可以收集哮喘患者的呼气数据,以指导医生诊断他们未来的疾病趋势。急性疾病难以预测,突变和随机性的特点使其难以预测。
6、疾病流行预测
基于人们的搜索和购物行为,最经典的“流感预测”就属于这一类。如果在某个地区对“流感”和“板蓝根”的搜索需求越来越大,可以推测那里有流感的趋势。
继世界杯、高考、景点和城市预测之后,百度最近推出了一款疾病预测产品。目前,我们可以全面监测中国各省和大多数地级市、区县在流感、肝炎、结核病和性传播疾病方面的活动和趋势图。未来,百度疾病预测监测的疾病类型将从目前的4种扩大到30多种,涵盖更多常见疾病和流行病。用户可以根据本地预测结果进行有针对性的预防。
7.灾害预测
气象预测是最典型的灾害预测。地震、洪水、高温和暴雨可以通过使用大数据能力提前预测和通报,将有助于防灾和救灾中的减灾和救灾工作。与以往不同,以往的数据采集方法存在死角和成本高等问题。在物联网时代,可以借助廉价的传感器摄像机和无线通信网络进行实时数据监测和采集,然后利用大数据预测和分析实现更准确的自然灾害预测。
8.环境变化预测
除了短期的微观天气和灾害预测外,它还可以进行长期和宏观的环境和生态变化预测。森林和农田面积的缩小、濒危野生动植物、上升的海岸线和温室效应是地球面临的“长期问题”。如果人类知道更多关于地球生态系统和天气模式的数据,就能更容易地模拟未来的环境变化,从而防止糟糕的变化发生。大数据帮助人类收集、存储和挖掘更多的地球数据,它也提供了一个预测工具。
9.交通行为预测
基于用户和车辆的lbs定位数据,分析人和车辆的个体和群体特征,预测交通行为。交通部门可以预测不同时间点不同道路的交通流量,进行智能车辆调度,或者应用潮汐车道;用户可以根据预测结果选择拥堵概率较低的道路。
百度基于地图应用的lbs预测覆盖范围更广。预测春节期间人们的迁移趋势可以指导火车路线和线路的设置,预测节假日期间的景点流量可以指导人们选择景点,百度热图通常会告诉用户城市商业区、动物园等地的人流情况,指导用户的出行选择和商家的选址。
10.能源消耗预测
加州电网系统运营中心管理着加州80%以上的电网,每年向3500万用户输送2.89亿兆瓦的电力,输电线长度超过25000英里。该中心采用时空洞察软件进行智能管理,综合分析来自气象、传感器、计量设备等各种数据源的海量数据。,预测各地能源需求的变化,进行智能电力调度,平衡整个网络的电力供需,快速应对潜在的危机。中国智能电网一直在尝试类似的大数据预测应用。
对于单个家庭,可以记录家庭成员的生活习惯,感知用户的舒适度,预测用户对温度控制和能源消耗的需求,控制智能温度控制装置,并结合阶梯电价表帮助用户省钱。Nest是基于大数据预测用户能耗需求的成功产品。
除了上面列出的10多个领域,大数据预测还可以应用于房地产预测、就业形势预测、高考分数预测、选举结果预测、奥斯卡奖预测、保险申请人风险评估、金融借款人还款能力评估等。,这样人类就有能力定量地、令人信服地、可验证地看待未来,大数据预测的魅力也正在释放。
作者微博@互联网阿超、微信超常发的文章是作者独立的观点,并不代表老虎嗅探网的立场
本文由罗超授权的老虎嗅探网络发布,老虎嗅探网络编辑。转载这篇文章必须得到作者的批准,并请附上来源(老虎嗅探网络)和本页的链接。http://www.huxiu/article/38003/1请作者加入语料库
三链:吃昆虫、吃厕所和油炸??3.模纸锻造,模具模具模具模具模具模具模具模具模具模具模具??. 95镣铐和镣铐??0.07%锝58.....
当前流行度:0
[娇娇]http://itougu.jrj/view/189514.j.....
当前流行度:0
1.1 .涓涓细流??邦邦、邦邦、邦邦、交邦和廖廖??要坚强,要坚强。.....
当前流行度:0
你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道,你知道........
当前流行度:0
缇落入三条锁链??3镝??6铥??0(乌桕脂含有3条链吗??4镝??4铥??0)死,死,死,死又死,4.72??......
当前流行度:0
那墙,墙,墙和墙呢??钳子里有丰富的镰刀、叉子、叉子、nan和链条,这些都是銮棒的来源.....
当前流行度:1
你想挑起镝,破坏哮喘吗??缇,汤,汤,3汤和柊镶嵌??链条??4."敌鲁,缇,汤,汤,汤."??.....
当前流行度:0
咸丰、大树、细垴、十二寸、相互涓涓??环秀细链,涓涓细流,砸铙钹,甩铙钹,砸铙钹,砸铙钹,砸响,砸得咝咝作响??葛格·岳格·柊.....
当前流行度:0