用户注册 登录
珍珠湾全球网 返回首页

岳东晓 -- 珍珠湾全球网 ... http://ydx.zzwave.com [收藏] [复制] [分享] [RSS] 岳东晓 -- 珍珠湾全球网

日志

数学不会撒谎--微分几何与美大选民意调查

热度 2已有 7932 次阅读2016-11-11 08:53 |系统分类:教育| 纽约时报, 洛杉矶, 民意调查, 南加州, 美国

我在《美国政治制度与2016竞选民调总结》一文中,引用了一个民意调查 http://cesrusc.org/election/,大家可能没有注意。这是 南加州大学-洛杉矶时报的“天刚破晓”调查 ( USC -LA TIMES daybreak poll)。在美国众多的调查中,这是唯一一个一直预测川普获胜的调查 -- 其余均预测克林顿获胜。它也因此遭到了反川普人士的猛烈攻击。《纽约时报》甚至发表了一篇长文,挑出其各种毛病。很多人对其百般嘲讽。

现在结果出来了,“天刚破晓”也就成了唯一正确预测2016年美国大选结果的调查--川普团队多次说根据他们的内部数学模型显示将很可能赢得威斯康辛与宾夕法尼亚,但毕竟不能作为独立机构的公允结果。“天晓”调查的设计者 Arie Kapteyn  其实是一个强烈反对川普当选的人士,他没有任何政治经验,其方法原本是用于经济调查,他内心很希望“天晓”调查结果错误,但眼睁睁看着川普获胜。他说:“I’m very unhappy” about Trump’s victory. But that’s the way it is.”

“天晓”调查的方法、算法、数据、甚至计算代码都是公开的,任人去研究。那么“天晓”调查有什么不同呢?

这个调查是事先随机挑选了几千名可能投票的选民,然后每天对其中几百人随机进行民意调查。所以其调查取样在这几千人范围内,但这不是跟其他调查的根本区别。其根据区别在于怎么计算每一个调查结果的权重。

在进行随机取样的时候,可能发生取样的数据构成偏离统计的现象。例如,一次取样·100人,可能正好有 45个女性调查对象,55个男性。而我们从人口统计知道,男女比例应该接近1:1。所以,这个取样本身就存在偏差。“天晓”调查会根据人口统计数据对权重进行调整。像举例的情况,因为女性少于统计比例,那么她们的选择会加大权重;男性抽取的数量超出了人口统计的比重,权重就会相应降低。

“天晓”调查不仅是根据性别,还根据很多其他指标进行权重的调整。如年龄、种族、教育、是否美国出生等等。这就需要对多个指标的权重调整进行迭代比例拟合计算 (iterative proportional fitting)。相关计算的收敛性 1970年由  FIENBERG 等运用微分几何进行了证明。不过,根据“天晓”调查网站的介绍,如果他们的代码进行 50 轮迭代计算还不能收敛,就中止了。

除了复杂的权重调整,“天晓”调查另一个特点是它不只是问调查对象会投谁的票,而是问得更为仔细,包括被调查者参加投票的几率以及投给谁的几率。这是一个重大差别。被调查者可能愿意投一个候选人的票,但是可能对支持候选人的热情度不够,懒得去投票站排队。另外投票者可能倾向投某一个人的票,但还没有完全决定。对每一份调查答案,“天晓”调查的计算中会把三个数乘起来,该人的权重 W,投票几率 V,投票给川普或克林顿的几率 R/D ,然后求和。

比起其他调查来,“天晓”调查显然更为 sophisticated。最终,数字没有撒谎,数学也没有撒谎。

路过

鸡蛋
2

鲜花

支持

雷人

难过

搞笑

刚表态过的朋友 (2 人)

 

发表评论 评论 (3 个评论)

回复 light 2016-11-11 20:55
老岳,这篇很好,可不可转帖?
回复 岳东晓 2016-11-12 06:07
light: 老岳,这篇很好,可不可转帖?
可以,请注明出处
回复 light 2016-11-12 17:28
岳东晓: 可以,请注明出处
那自然,不过贝壳会给你黑掉

facelist

您需要登录后才可以评论 登录 | 用户注册

Archiver|手机版|珍珠湾全球网

GMT+8, 2024-3-29 10:13 , Processed in 0.030647 second(s), 8 queries , Apc On.

Powered by Discuz! X2.5

回顶部