阿里云
技术周刊订阅频道
发表主题 回复主题
  • 1383阅读
  • 3回复

[大牛问答]ODPS的使用性能比RDS的差,什么原因?

级别: 论坛编辑
发帖
1964
云币
3622
问:ODPS(Maxcomput)是带存储功能的。其中的BI报表功能可以使用RDS、ADS、ECS以及ODPS存储的数据进行计算,但对比下来,ODPS的明显比ADS的慢(主要是join,语句相同),什么原因? ] "_'o~  
EQ-~e   
答: qxh\umm+2  
ApsaraDB For Greenplum是基于开源Greenplum打造的一种MPP、Shared Nothing 分析型数据库,有着卓越的查询性能。 -n-X/M  
\GP c_m:qL  
提供丰富的机器学习库函数,扩展函数语言(R, python, perl),SQL 交互式接口。 h#9)M  
#^Y-*vf2  
使用RDS+ApsaraDB for Greenplum , 给分析师快速试错的舞台,数据产生价值,打造数据闭环。 9X~^w_cdk  
kPe9G  
ODPS 是任务型的产品,一个分析需要经历较长路径 : 建模、数据抽取、任务部署、任务调度、任务执行、返回结果、查看结果。 -TWo-iu^  
IA'AA|v  
Greenplum是SQL接口,开箱即用,分析路径大大缩短,帮助飞速发展的企业提供快速的建模试错舞台。 快速让您的数据产生价值。 )Ec;krb+  
49 D*U5o  
《PostgreSQL 物流调度算法探索 - 基于PostGIS/pgrouting/机器学习》 R<)uvW_@  
https://yq.aliyun.com/articles/57857 t z{]H9  
~ +Y;jA dU  
《Greenplum 分布列与分区的黄金法则》 rv%Xvs B  
https://yq.aliyun.com/articles/57822 Q7i^VN  
eGZId v1  
阿里云ApsaraDB RDS用户 - OLAP最佳实践》 y9:|}Vh  
https://yq.aliyun.com/articles/57778 @UD6qA  
>/Slk {  
《Greenplum 资源隔离的原理与源码分析》 jo+T!CUM'  
https://yq.aliyun.com/articles/57763 ='>k|s:  
89~)nV)  
《三张图读懂Greenplum在企业的正确使用姿势》 7HFw*;  
https://yq.aliyun.com/articles/57736 C}wmoYikV  
{n{ j*+  
《聊聊Greenplum的那些事》 $YFn$.70\  
https://yq.aliyun.com/articles/57606 _bFX(~37z?  
 _8t{4C  
by__德哥 DOf[?vbu  
4_)@Nq  
5q@o,d  
答: v;irk<5  
ODPS是存储、计算分离,用MR进行计算。且数据是按块无规律存放,每次计算都需要进行数据整理与加载,更适合于大、超大数据量的运算。 t hTY('m  
=p ^Sn,t  
在小数据范围没法跟RDS这种存储、计算一体的对比。但在更大数据范围內,不是RDS做Scale-up能支持的,因此不具有可比性! vA"yy"B+ V  
>|mmJ4T  
ADS是MPP, 在计算之前,数据是根据字段的值进行hash分片的; 因此数据相对有规律;且就地加载数据,只交换部分必要数据。 计算模型也比MR的三步骤要有优势,因此一定数据范围,在性能上ODPS可能会有差距。 *=)%T(^  
& Z*&&  
从另一方面,MPP的架构本身也意味,其能承载的数据量上无法与ODPS对比。在更大数据量上,MPP架构有可能会因为数据交换等原因,网络成为瓶颈,与ODPS无法对比。 &U!@l)<  
=[3I#s?V  
ApsaraDB For Greenplum是基于开源Greenplum打造的一种MPP、Shared Nothing 分析型数据库,在一定数据范围內有着卓越的查询性能。近期公测阶段,可以到这里查阅更多信息https://www.aliyun.com/product/gpdb?spm=5176.7920929.237031.39.P7sS2g p e |k}{  
 pb6z)8  
by__窦贤明
x
级别: 论坛版主
发帖
1942
云币
4087
只看该作者 沙发  发表于: 2017-03-08
阿里云没有ODPS产品吧
级别: 论坛编辑
发帖
1964
云币
3622
只看该作者 板凳  发表于: 2017-03-15
回 1楼(jesuiszb) 的帖子
德哥说有就是有。
x
级别: 论坛版主
发帖
1942
云币
4087
只看该作者 地板  发表于: 2017-03-28
不好意思,今天云栖大会 上听了下德哥和其他老师的演讲才知道;原来max compute的前身就是odps。小的见识短了,别见怪;
发表主题 回复主题
« 返回列表上一主题下一主题

限100 字节
批量上传需要先选择文件,再选择上传
 
验证问题: 75 + 5 = ?
上一个 下一个