悦博体育新闻
NEWS CENTER
悦博体育app从美国大选预测分析聊聊数据分析的7个段位

  2020年美国大选即刻就要发表成果了,近来大选猜测的文章很多多少。看了几篇,发明猜测大选的办法和数据阐发挺像。

  青铜级的阐发选手会说:美国大选不在意到底谁最初博得了总统。不论是特朗普仍是拜登,对华的政策都是巴拉巴拉巴拉巴拉,他们城市持续巴拉巴拉巴拉。

  这些阐发假如拿到中美干系的开展趋向下,没甚么成绩。可是在猜测美国大选谁会中选的成绩下,这个成绩就显得很奇异了,由于他们连成绩都没搞分明。

  然后话锋一转,再说特朗普也不是没有时机。特朗普在2016年就缔造了奇观,此次的民调仍然不克不及作为证据,然后再说特朗普能够中选的缘故原由。

  白银级的这个答复呢,最少会环绕成绩答复。固然没有正面答复,但最少他报告了我,双方各自的劣势和缺陷,仍是带来一些信息的,以是算是白银级。

  有些撑持特朗普,会把撑持特朗普的证据摆出来,好比红脖子的撑持,民调的不靠谱,美国的等等。

  我今天看到篇文章说特朗普必然能赢。给的来由是甚么呢?他用了谷歌的搜刮指数,悦博体育最新特朗普的搜刮指数不断要比拜登的更高。

  并且他还阐发得很细,思索到美国推举的推举人轨制,必需把州的状况思索出去。因而他把每一个州的数据都画出来了,结论仍然是撑持特朗普能赢。

  铂金选手曾经开端无数据的认识,会用究竟来证实他的结论。可是这个谷歌指数跟投票之间到底有无一定的联系关系?这个没有给出证实,逻辑上有必然的破绽。

  钻石选手呢,会枚举目条件早投票的数据,列出各个州差别的投票人数,和今朝的投票比例。依托这些数据算出终极的推举人票,然后给出了一个结论,今朝是谁更有劣势。

  这类阐发曾经开端进入数据阐发的范围了,比拟铂金选手好的处所是钻石选手用的数据更牢靠,间接反响成果,而不是联系关系度不高的搜刮数据。

  不外钻石选手没有持续深挖,他只是表清楚明了近况,给出了今朝临时的投票成果,算是归结法。要想更准确,得用归纳法,也就是后续会怎样演变,推算出终极的得胜者。

  星耀选手从推举的机制动手,阐发两个候选人必定能拿的票有哪些,必定丢的票有哪些,然后各自需求夺取的有哪些。然后再阐发摇晃州今朝近况是甚么样的,谁的赢面更大。

  对特朗普和拜登别离阐发他们二者的得票状况:哪些州是必定能拿到的,哪些州是必定拿不到的。然后分离今朝的提早投票的数据,计较出各自能获得的票数,如许阐发的成果通常为特朗普落第。

  然后再枚举出假如特朗普终极得胜,存在哪几种能够性。哪几个州要翻红才气让特朗普得胜,别离的组合是那些。

  最初汇总给出结论,根本能够必定是拜登得胜,特朗普有小几率能翻盘,假如翻盘的话会是哪几种状况。

  前段工夫知乎上的数据帝chenqin做了一个阐发。很惋惜,谁人知乎成绩曾经删掉了,以是如今曾经没法追溯原贴了。

  起首,用数据猜测大选,本来的做法是民调的数据。在已往民调数据猜测是根本可托的,终极成果根本不会错。可是为啥本来的这套办法不论用了呢?

  由于2016年的大选,特朗普民调落伍,终极却博得了大选。这给许多形而上学的“美国察看家”供给了丰硕的丰硕的创作泥土。

  chenqin把各州的民调数据成果和终极的投票成果做了一个回归,发明民调成果和终极的推举成果高度拟合,这也能够证实民调的确能够猜测大选,并且可托度十分高。

  可是拟合度再高,也会有偏差,这个偏差在3%阁下。也就是说劣势的一方必需在民调上有4%的抢先,才气肯定成果。而2016年的民调,希拉里抢先特朗普只要2.3%,终极这个偏差招致了希拉里的失利。

  这此中美国的推举人票轨制放大了这个偏差。(美国的推举轨制,好比佛罗里达州一共29张推举人票,投共和党的票数只需比党多一票,那末共和党拿局部的29张推举人票。)

  附:另有一个数据大神nate sliver的大选猜测,他的办法属于数据建模,不是出格偏阐发。并且16年的时分翻车的很凶猛,我小我私家不太喜好。

  三元方差,公家号:三元方差(sanyuanfangcha),大家都是产物司理专栏作家。专注用数据驱动营业增加,善于数据阐发、用户增加。喜好浏览、考虑和创作。

  大家都是产物司理(是以产物司理、运营为中心的进修、交换、分享平台,集媒体、培训、社群为一体,全方位效劳产物人和运营人,建立9年举行在线+期,线+场,产物司理大会、运营大会20+场,笼盖北上广深杭成都等15个都会,在行业有较高的影响力和出名度。平台会萃了浩瀚BAT美团京东滴滴360小米网易等出名互联网公司产物总监和运营总监,他们在这里与你一同生长。