阿里云
阿里云多端小程序中小企业获客首选
发表主题 回复主题
  • 10993阅读
  • 5回复

[具体案例]世界杯竞猜背后的数据分析

发帖
276
云币
669
    这次世界杯无数的平台都在进行竞猜的活动,大致看了下网上的呼声,输多赢少,这次世界杯是有够奇葩的。 DCZG'eb  
     这是小编的世界杯竞赛帖喔,来参与!http://bbs.aliyun.com/read/162318.html?spm=5176.7189909.0.0.VfvPu8  <)~-]  
g] }!  
    小编此次世界杯的准确率目前为66%,那究竟是RP大爆发还是RP大爆发? tJ6Q7 J;n  
73 .+0x  
L[ D+=  
    玩笑开到此,小编己是一个数据分析爱好者,所以做了一个简(fu)单(za)的球队战斗力模型。 3h=kn@I  
+^esL9RG:  
k[ D,du')  
     对于一个不关注足球长达十五年的人来说,历史数据两眼一抹黑,而对于小编的数据分析理念而言,现实便是最好的嗅探器。 UjoA$A!Od;  
Z : xb8]y  
!vJ$$o6#  
    所以小编根据世界杯规则: rFzj\%xa[  
    小组前两名出线;积分相同者,净胜球多者出线; (t V T&eO  
    净胜球如还相同,进球数多者出线; u=W[ S)w  
    积分、净胜球、进球数如全部相同,比较1.相互交战积分,2.相互交战净胜球,3.相互交战进球数;    如再相同,抽签决定名次。 & C)1(  
)fIG4#%\  
    设定了以下参数作为原始参数: ,<#Rk 'y$  
uI?Z_  
DW9MX`!Xc  
    参赛场次,胜利次数,平局次数,失败次数,进球粒数,失球粒数,净球粒数,得分。 /J_ ],KdU  
例如: lkJxb~S  
FNF`Z  
> K,QP<B  
P/1YN  
f"j9C% '*  
=Hd#"9-  
Cx/J_Ro#  
    由于这些数据并不能完全勾勒出一支球队的现场表现,所以又设定以下参数作为数据源的修订: ~BuBma_   
    传球,传中,射门,射正,抢断,角球,任意球,越位,犯规,控球率 i6n,N)%H  
    例如:
球队传球传中射门射正抢断角球任意球越位犯规控球率
巴西45125146167191560.9
克罗地亚28120113213502039.1
1?|"33\03R  
Y %bb-|\W  
'5$@ I{z  
    根据原始数据来搜集球队整体战力,通过修正数据来搜集球队状态(也就是出乱子的概率) ?K:\WW  
u1y>7,Z6W  
PpG;5  
    于是便有了以下的信息: ^L d5<  
PcT]  
~>9G\/u j  
O9By5j 4  
"PRHQW  
<2 [vR|Q*  
Fs4shrt  
     这并不是数据分析的结束,也不能靠着这个一直继续下去,而是应该随着比赛的不同而进行修正。特别是对一些比赛的KEYPOINT调整权重和加分 $},XRo&R  
weu+$Kr  
p\;8?x  
     我们来看看其他大神如何预测世界杯的……………… D- C]0Jf3  
aBaiXv/*  
d-Z2-89K  
L7(FD v,?  
高盛:巴西夺冠阿根廷亚军  (个人觉得这个分析还是比较靠谱的,至于结果……) U7n#TPet  
dz/@]a  
高盛(Goldman Sachs)的量化分析师通过历史数据的回归分析,对淘汰赛的结果做出了预测。预测结果显示,半决赛为巴西对战德国、西班牙对战阿根廷,决赛为巴西对战阿根廷,最终巴西胜出。 &gS-.{w "  
A. tGr(r  
OwNM`xSa|\  
YfT D  
oVHe<zE.  
dg#Pb@7a  
k -R"e  
分析师构建了一个随机模型,由其产生2014年世界杯全部64场比赛的结果分布。每场比赛的预测基于对1960年以来所有正式国际比赛(即不含友谊赛)历史数据的回归分析。由此获得1.4万个数据点来估算模型的系数。回归分析的因变量是每场比赛双方的进球数量。 @o?Y[BR  
(#>X*~6  
具体来讲,高盛的预测主要分为两个部分:数据源和随机模型。前者是后者估算模型系数和验证调整算法的数据基础,也就是前面提到的从球队的历史数据分析得到的1.4万个数据点。随机模型中,高盛采用了蒙特卡洛演算方法,总共进行了10万次演算。 QbHX.:C  
pl@K"PRE  
e&i`/m5  
德银:“轮流转周期”,反正一定是英格兰夺冠 (嗯 抽脸的节奏) |H^v8^%>zm  
'Y ,2CN  
德银建立了量化分析模型,计算的参数包括球队的世界排名、以往战绩、球员构成和赌球市场赔率。德银的复杂计算得到了以下的一个夺冠概率表格。巴西名列第一,紧随其后的是德国、西班牙、法国。但是,德银认为这样的预测太乏味也太传统,于是德银引入了一系列条件,以求预测出最终的冠军得主。 7@gH{p1  
EMr|#}]#s  
L58H)V3Pn  
霍金:温度上升5℃,英格兰夺冠概率降低59% (人瘫脑不瘫 …… 知道下结论是不科学的做法) 0 !%G #~th  
这就是他的计算公式……小编花了0.1s的时间决定不去看这类根本看不懂的东西 ╮(╯▽╰)╭ a)r["*bTx  
[6g$;SicT  
kzCJs  
%4M,f.[e  
q~aj" GD  
_\k?uUo&,^  
Y[PC<-fyf  
*mj=kJ7(  
阿里云学院免费为讲师开通视频制作环境,需要的请与我联系!
级别: 小白
发帖
10
云币
211
只看该作者 沙发  发表于: 2014-06-30
Re世界杯竞猜背后的数据分析
祝贺小编,楼主深知越分享越有价值啊,你的准确率还会上升!
发帖
276
云币
669
只看该作者 板凳  发表于: 2014-06-30
数据越多,分析越准确。 |Axbx?  
但一定不能忘记一点,算出来的都是概率,而不是100%发生的事情。
阿里云学院免费为讲师开通视频制作环境,需要的请与我联系!
发帖
17
云币
53
只看该作者 地板  发表于: 2014-06-30
楼主炫耀智商!
发帖
276
云币
669
只看该作者 4楼 发表于: 2014-07-01
回 3楼(斯默默云飘) 的帖子
目测以脑洞结束 …… ╮(╯▽╰)╭
阿里云学院免费为讲师开通视频制作环境,需要的请与我联系!
发帖
276
云币
669
只看该作者 5楼 发表于: 2014-07-02
回 3楼(斯默默云飘) 的帖子
木哈哈哈哈哈 昨晚两场继续预测准确 全部是加时赛赢的 ,IE.8h)H  
艾玛 ~ ~\(≧▽≦)/~
阿里云学院免费为讲师开通视频制作环境,需要的请与我联系!
发表主题 回复主题
« 返回列表上一主题下一主题

限100 字节
如果您提交过一次失败了,可以用”恢复数据”来恢复帖子内容
 
验证问题: ECS是阿里云提供的什么服务? 正确答案:云服务器
上一个 下一个
      ×
      全新阿里云开发者社区, 去探索开发者的新世界吧!
      一站式的体验,更多的精彩!
      通过下面领域大门,一起探索新的技术世界吧~ (点击图标进入)