发表主题 回复主题
  • 298阅读
  • 3回复

[大牛问答]ODPS的使用性能比RDS的差,什么原因?

级别: 论坛编辑
发帖
170
云币
494
问:ODPS(Maxcomput)是带存储功能的。其中的BI报表功能可以使用RDS、ADS、ECS以及ODPS存储的数据进行计算,但对比下来,ODPS的明显比ADS的慢(主要是join,语句相同),什么原因? !2x"'o  
7YbI|~  
答: < /y V  
ApsaraDB For Greenplum是基于开源Greenplum打造的一种MPP、Shared Nothing 分析型数据库,有着卓越的查询性能。 ]P0DPea  
}\u~He%  
提供丰富的机器学习库函数,扩展函数语言(R, python, perl),SQL 交互式接口。 1at$_\{.(  
?xf59mY7  
使用RDS+ApsaraDB for Greenplum , 给分析师快速试错的舞台,数据产生价值,打造数据闭环。 3w )S=4lB  
4qda!%  
ODPS 是任务型的产品,一个分析需要经历较长路径 : 建模、数据抽取、任务部署、任务调度、任务执行、返回结果、查看结果。 !W:QLOe6F  
whNRUOK:  
Greenplum是SQL接口,开箱即用,分析路径大大缩短,帮助飞速发展的企业提供快速的建模试错舞台。 快速让您的数据产生价值。 ~4}m'#!  
OxF\Hm)(  
《PostgreSQL 物流调度算法探索 - 基于PostGIS/pgrouting/机器学习》 7kn=j6I  
https://yq.aliyun.com/articles/57857 9szE^kHS9  
nVG\*#*]|  
《Greenplum 分布列与分区的黄金法则》 y<F$@  
https://yq.aliyun.com/articles/57822 sSG]I%oB3  
3|:uIoR{  
阿里云ApsaraDB RDS用户 - OLAP最佳实践》 q\#3G  
https://yq.aliyun.com/articles/57778 54F([w  
$ O!f*lG  
《Greenplum 资源隔离的原理与源码分析》 (kp}mSw  
https://yq.aliyun.com/articles/57763 8gC(N3/E"  
6lT'%ho}B  
《三张图读懂Greenplum在企业的正确使用姿势》 M/V >25`  
https://yq.aliyun.com/articles/57736 <Mc:Cg8>  
Tjs-+$P+  
《聊聊Greenplum的那些事》 y6*i/3  
https://yq.aliyun.com/articles/57606 !hH6!G  
l}Xmm^@)  
by__德哥 Wq{'ZN  
6l_8Q w*5I  
^\+6*YE 4  
答: E#ys-t 42  
ODPS是存储、计算分离,用MR进行计算。且数据是按块无规律存放,每次计算都需要进行数据整理与加载,更适合于大、超大数据量的运算。 zx'`'t4~  
}Xc|Z.6  
在小数据范围没法跟RDS这种存储、计算一体的对比。但在更大数据范围內,不是RDS做Scale-up能支持的,因此不具有可比性! }4 $EN  
Y"l!3^   
ADS是MPP, 在计算之前,数据是根据字段的值进行hash分片的; 因此数据相对有规律;且就地加载数据,只交换部分必要数据。 计算模型也比MR的三步骤要有优势,因此一定数据范围,在性能上ODPS可能会有差距。 |9\Lv $VJ  
#kb(2Td  
从另一方面,MPP的架构本身也意味,其能承载的数据量上无法与ODPS对比。在更大数据量上,MPP架构有可能会因为数据交换等原因,网络成为瓶颈,与ODPS无法对比。 JAiV7v4&R  
Ej34^*m9k  
ApsaraDB For Greenplum是基于开源Greenplum打造的一种MPP、Shared Nothing 分析型数据库,在一定数据范围內有着卓越的查询性能。近期公测阶段,可以到这里查阅更多信息https://www.aliyun.com/product/gpdb?spm=5176.7920929.237031.39.P7sS2g O_iX 1@SW  
H>7!+&M  
by__窦贤明
x
级别: 论坛版主
发帖
560
云币
861
只看该作者 沙发  发表于: 03-08
阿里云没有ODPS产品吧
级别: 论坛编辑
发帖
170
云币
494
只看该作者 板凳  发表于: 03-15
回 1楼(jesuiszb) 的帖子
德哥说有就是有。
x
级别: 论坛版主
发帖
560
云币
861
只看该作者 地板  发表于: 03-28
不好意思,今天云栖大会 上听了下德哥和其他老师的演讲才知道;原来max compute的前身就是odps。小的见识短了,别见怪;
发表主题 回复主题
« 返回列表上一主题下一主题

限100 字节
如果您提交过一次失败了,可以用”恢复数据”来恢复帖子内容
 
验证问题: 阿里云官网域名是什么? 正确答案:www.aliyun.com
上一个 下一个