阿里云
阿里云多端小程序中小企业获客首选
发表主题 回复主题
  • 10995阅读
  • 5回复

[具体案例]世界杯竞猜背后的数据分析

发帖
276
云币
669
    这次世界杯无数的平台都在进行竞猜的活动,大致看了下网上的呼声,输多赢少,这次世界杯是有够奇葩的。 8X`tU<Ab  
     这是小编的世界杯竞赛帖喔,来参与!http://bbs.aliyun.com/read/162318.html?spm=5176.7189909.0.0.VfvPu8 3k# /{Z  
8p9bCE>\  
    小编此次世界杯的准确率目前为66%,那究竟是RP大爆发还是RP大爆发? \"^w'ng  
:Jy'# c  
SWQ5fcPu  
    玩笑开到此,小编己是一个数据分析爱好者,所以做了一个简(fu)单(za)的球队战斗力模型。 W$rH"_@m  
VUYmz)m5  
2 :mn</z  
     对于一个不关注足球长达十五年的人来说,历史数据两眼一抹黑,而对于小编的数据分析理念而言,现实便是最好的嗅探器。 h0-hT   
;3: q?&  
gk+h8 LZ  
    所以小编根据世界杯规则: Y&_&s7z  
    小组前两名出线;积分相同者,净胜球多者出线; ^Au _U  
    净胜球如还相同,进球数多者出线; + 33@?fl.  
    积分、净胜球、进球数如全部相同,比较1.相互交战积分,2.相互交战净胜球,3.相互交战进球数;    如再相同,抽签决定名次。 T[4<R 5}  
;._7jFj.  
    设定了以下参数作为原始参数: ~aOuG5 XK  
wUQw!%?>  
O:"*q&;J  
    参赛场次,胜利次数,平局次数,失败次数,进球粒数,失球粒数,净球粒数,得分。 D3^7y.u<)  
例如: OD 3f.fT  
%4 XJn@J  
0=q;@OIf  
9D}/\jM  
CI :`<PZ\-  
E%v?t1>/  
.G(llA}  
    由于这些数据并不能完全勾勒出一支球队的现场表现,所以又设定以下参数作为数据源的修订: vRxM4O~"  
    传球,传中,射门,射正,抢断,角球,任意球,越位,犯规,控球率 ;9ly'<up  
    例如:
球队传球传中射门射正抢断角球任意球越位犯规控球率
巴西45125146167191560.9
克罗地亚28120113213502039.1
mp?78_I)  
r"a5(Q;n  
hL;8pE8  
    根据原始数据来搜集球队整体战力,通过修正数据来搜集球队状态(也就是出乱子的概率) V$icWu  
x^y"<  
#8bsxx!s  
    于是便有了以下的信息: =w5O&(  
PN<C=gAe  
RUUk f({(  
@81Vc<dJ  
6uKMCQ=h  
@]c(V%x   
 "t$k  
     这并不是数据分析的结束,也不能靠着这个一直继续下去,而是应该随着比赛的不同而进行修正。特别是对一些比赛的KEYPOINT调整权重和加分 ?EpSC&S\  
XfE -fH1j  
pD2<fP_  
     我们来看看其他大神如何预测世界杯的……………… c8M2 ^{O,`  
]I.n\2R]om  
Za7q$7F7Bc  
,\d6VBP&  
高盛:巴西夺冠阿根廷亚军  (个人觉得这个分析还是比较靠谱的,至于结果……) j:&4-K};Z`  
1 s*.A6EP"  
高盛(Goldman Sachs)的量化分析师通过历史数据的回归分析,对淘汰赛的结果做出了预测。预测结果显示,半决赛为巴西对战德国、西班牙对战阿根廷,决赛为巴西对战阿根廷,最终巴西胜出。 + "}=d3E6  
Rqy0Q8K<  
GK}'R=   
{d%&zvJnD  
%Lrd6i_j  
[;.`,/  
J5[~LZKW  
分析师构建了一个随机模型,由其产生2014年世界杯全部64场比赛的结果分布。每场比赛的预测基于对1960年以来所有正式国际比赛(即不含友谊赛)历史数据的回归分析。由此获得1.4万个数据点来估算模型的系数。回归分析的因变量是每场比赛双方的进球数量。 ,j ',x\  
q$.{j"cZV  
具体来讲,高盛的预测主要分为两个部分:数据源和随机模型。前者是后者估算模型系数和验证调整算法的数据基础,也就是前面提到的从球队的历史数据分析得到的1.4万个数据点。随机模型中,高盛采用了蒙特卡洛演算方法,总共进行了10万次演算。 FvuGup`w  
z6~ H:k1G%  
BH@)QVs-  
德银:“轮流转周期”,反正一定是英格兰夺冠 (嗯 抽脸的节奏) -/dEsgO  
\cJ-Dd  
德银建立了量化分析模型,计算的参数包括球队的世界排名、以往战绩、球员构成和赌球市场赔率。德银的复杂计算得到了以下的一个夺冠概率表格。巴西名列第一,紧随其后的是德国、西班牙、法国。但是,德银认为这样的预测太乏味也太传统,于是德银引入了一系列条件,以求预测出最终的冠军得主。 n*'<uKpM  
qxMnp}O  
iH2n.M "  
霍金:温度上升5℃,英格兰夺冠概率降低59% (人瘫脑不瘫 …… 知道下结论是不科学的做法) CG&`16KN7  
这就是他的计算公式……小编花了0.1s的时间决定不去看这类根本看不懂的东西 ╮(╯▽╰)╭ /DO/Tqdfe  
.LRxP#B  
0l#)fJo  
m&oi8 P-6  
=}fd6ea(o  
Q_"\Q/=?Do  
uH^ PQ  
i=32KI(%  
阿里云学院免费为讲师开通视频制作环境,需要的请与我联系!
级别: 小白
发帖
10
云币
211
只看该作者 沙发  发表于: 2014-06-30
Re世界杯竞猜背后的数据分析
祝贺小编,楼主深知越分享越有价值啊,你的准确率还会上升!
发帖
276
云币
669
只看该作者 板凳  发表于: 2014-06-30
数据越多,分析越准确。 qMS}t3X  
但一定不能忘记一点,算出来的都是概率,而不是100%发生的事情。
阿里云学院免费为讲师开通视频制作环境,需要的请与我联系!
发帖
17
云币
53
只看该作者 地板  发表于: 2014-06-30
楼主炫耀智商!
发帖
276
云币
669
只看该作者 4楼 发表于: 2014-07-01
回 3楼(斯默默云飘) 的帖子
目测以脑洞结束 …… ╮(╯▽╰)╭
阿里云学院免费为讲师开通视频制作环境,需要的请与我联系!
发帖
276
云币
669
只看该作者 5楼 发表于: 2014-07-02
回 3楼(斯默默云飘) 的帖子
木哈哈哈哈哈 昨晚两场继续预测准确 全部是加时赛赢的 wGZ>iLe:  
艾玛 ~ ~\(≧▽≦)/~
阿里云学院免费为讲师开通视频制作环境,需要的请与我联系!
发表主题 回复主题
« 返回列表上一主题下一主题

限100 字节
如果您在写长篇帖子又不马上发表,建议存为草稿
 
验证问题: 阿里云官网域名是什么? 正确答案:www.aliyun.com
上一个 下一个
      ×
      全新阿里云开发者社区, 去探索开发者的新世界吧!
      一站式的体验,更多的精彩!
      通过下面领域大门,一起探索新的技术世界吧~ (点击图标进入)