阿里云
发表主题 回复主题
  • 432阅读
  • 3回复

[大牛问答]ODPS的使用性能比RDS的差,什么原因?

级别: 论坛编辑
发帖
248
云币
24
问:ODPS(Maxcomput)是带存储功能的。其中的BI报表功能可以使用RDS、ADS、ECS以及ODPS存储的数据进行计算,但对比下来,ODPS的明显比ADS的慢(主要是join,语句相同),什么原因? &oBJY'1  
We|*s2!  
答: +t f=  
ApsaraDB For Greenplum是基于开源Greenplum打造的一种MPP、Shared Nothing 分析型数据库,有着卓越的查询性能。 @gd-lcMYW  
D c^d$gh  
提供丰富的机器学习库函数,扩展函数语言(R, python, perl),SQL 交互式接口。 `#hy'S:e  
p\ASf  
使用RDS+ApsaraDB for Greenplum , 给分析师快速试错的舞台,数据产生价值,打造数据闭环。 b\?`721BG  
1D$k:|pP~  
ODPS 是任务型的产品,一个分析需要经历较长路径 : 建模、数据抽取、任务部署、任务调度、任务执行、返回结果、查看结果。 T!n<ya!  
O3Uu{'=0  
Greenplum是SQL接口,开箱即用,分析路径大大缩短,帮助飞速发展的企业提供快速的建模试错舞台。 快速让您的数据产生价值。  Cfi5r|S  
j>U.(K  
《PostgreSQL 物流调度算法探索 - 基于PostGIS/pgrouting/机器学习》  EpiagCS  
https://yq.aliyun.com/articles/57857 z9gZ/d   
;-3M  
《Greenplum 分布列与分区的黄金法则》 }v:h EMO  
https://yq.aliyun.com/articles/57822 m$kmoY/  
I^o^@C  
阿里云ApsaraDB RDS用户 - OLAP最佳实践》 uzS57 O%  
https://yq.aliyun.com/articles/57778 |D\ ukml  
?FLjvmE9  
《Greenplum 资源隔离的原理与源码分析》 wz ,woF|  
https://yq.aliyun.com/articles/57763 GxBj N7"  
|1neCP@ng  
《三张图读懂Greenplum在企业的正确使用姿势》 QRRZMdEGs[  
https://yq.aliyun.com/articles/57736 4B |f}7%\  
TnC'<zm9 !  
《聊聊Greenplum的那些事》 )TxhJB5|  
https://yq.aliyun.com/articles/57606 E yNCky  
35ng_,t $  
by__德哥 %c&h:7);  
aW"BN 5eM>  
Q5Wb)  
答: n9#@ e}r  
ODPS是存储、计算分离,用MR进行计算。且数据是按块无规律存放,每次计算都需要进行数据整理与加载,更适合于大、超大数据量的运算。 y(%6?a @  
_H-Lt{k  
在小数据范围没法跟RDS这种存储、计算一体的对比。但在更大数据范围內,不是RDS做Scale-up能支持的,因此不具有可比性! (LnKaf8  
RW3&]l=  
ADS是MPP, 在计算之前,数据是根据字段的值进行hash分片的; 因此数据相对有规律;且就地加载数据,只交换部分必要数据。 计算模型也比MR的三步骤要有优势,因此一定数据范围,在性能上ODPS可能会有差距。 {3l] /X3  
Alrk3I3{  
从另一方面,MPP的架构本身也意味,其能承载的数据量上无法与ODPS对比。在更大数据量上,MPP架构有可能会因为数据交换等原因,网络成为瓶颈,与ODPS无法对比。 H:CwUFL  
+ 5 05  
ApsaraDB For Greenplum是基于开源Greenplum打造的一种MPP、Shared Nothing 分析型数据库,在一定数据范围內有着卓越的查询性能。近期公测阶段,可以到这里查阅更多信息https://www.aliyun.com/product/gpdb?spm=5176.7920929.237031.39.P7sS2g |kjk{  
CrK}mbe  
by__窦贤明
x
级别: 论坛版主
发帖
1136
云币
1989
只看该作者 沙发  发表于: 03-08
阿里云没有ODPS产品吧
级别: 论坛编辑
发帖
248
云币
24
只看该作者 板凳  发表于: 03-15
回 1楼(jesuiszb) 的帖子
德哥说有就是有。
x
级别: 论坛版主
发帖
1136
云币
1989
只看该作者 地板  发表于: 03-28
不好意思,今天云栖大会 上听了下德哥和其他老师的演讲才知道;原来max compute的前身就是odps。小的见识短了,别见怪;
发表主题 回复主题
« 返回列表上一主题下一主题

限100 字节
如果您在写长篇帖子又不马上发表,建议存为草稿
 
验证问题: 93 - 14 = ?
上一个 下一个