阿里云
发表主题 回复主题
  • 1304阅读
  • 5回复

[运维讨论]来自Facebook的一些MySQL运维经验

级别: 码农
发帖
128
云币
331
1. 概要
p#CjkL  
每台机器都使用多实例的模型。 每个机器放多个实例,每个实例放多个DB。 8PzGUn;\  
一些信息可以参考: https://www.youtube.com/watch?v=UBHcmP2TSvk 6Cz O ztn  
多实例之间没有进行资源隔离,这么做是让每个实例都能发挥最大性能。 @)BO`;*$fF  
目前大部分核心业务已切换成MyRocks引擎,在机器硬件配置不变的情况,约可节省一半机器。 S3:AitGJ  
放在MyRocks上的核心业务主要有:Feed、Post、社交图谱等读写混合业务。 V"Z8-u  
MyRocks项目地址:https://github.com/facebook/mysql-5.6 {"+M%%`*#  
另外,MariaDB 10.2版本也即将整合MyRocks引擎。 \XPGA uEo  
2. 高可用机制
SIV !8mz  
采用基于GTID的一主多从结构,外加一个基于lossless semi-sync机制的mysqlbinlog实现的binlog server(可以理解为MySQL 5.7的loss zero replication)。 0|RofL&o  
基于多数派实现动选主。 +rJ6DZ  
基于配置中心实现切换,未使用VIP。 $'%GB $.  
在认为semi-sync复制可保证主从数据一致性的假设前提下,发生故障切换时,利用上述的binlog server中的日志进行补全后再选新主、切换。 y-db CYMc  
若个别情况下由于特殊原因,出现从库全部挂掉的情况,会将全部请求切到主库,由它扛起所有的业务服务压力。 Y@`uBB[  
某个从库挂掉时,可以动态摘除。 J7* o%W*V  
3. 备份机制
b!P,+!<  
所有的备份都是基于mysqldump实现,之所以采用mysqldump逻辑备份好处有:
  • 无需备份索引,只备份数据;
  • 备份文件压缩比高,更节省磁盘空间;
  • 改进了mysqldump,备份过程中还进行额外压缩;
V6X )L>!xx  
上面提到,因为采用多实例、多DB结构,备份时可以多DB并行备份。当然了,也会控制并行备份的数量,避免影响在线业务性能。 )Cl>%9  
备份放在集中存储(HDFS)上, 据说已达EB级别容量。 E=N$JM  
关于备份的作用定位:
  • 供数据分析环境拉数据
  • 供灾难恢复
16zReI(  
4. 如何快速部署从库
:YI5O/gsk?  
可使用xtrabackup在现有存活的SLAVE实例上备份,也可在主库上发起备份,再利用WDT(或者是BT)协议传输到异地,用于拉起从库。  d 2d-Mk  
关于WDT项目:https://github.com/facebook/wdt ' @RF  
5. 高度自动化
@"@|O>KJ  
面对大规模的数据库实例,手工处理完全不现实。目前在facebook主要是利用Python开发内部DB运维平台,所以Python技能方面要求比较高。 I&{T 4.B:U  
采用他们自已的osc工具执行Online DDL(也是本次DTCC大会上lulu的分享主题),它最早用PHP开发,虽早已开源,但实在不好用,所以几乎只在内部使用。这个工具不同于pt-osc,相对来说更有优势,比如可以避免使用pt-osc最常遇到的主从数据延迟问题 J5G<Y*q  
项目地址:https://github.com/facebookincubator/OnlineSchemaChange .;]WcC<3  
6. 团队结构及技能树
t,?, T~#9  
DBA团队更多的是负责私有DB云平台的建设。 (dq_ ,LI  
Schema设计及DB拆分等由性能优化团队负责。 WR{m?neE_N  
在线表结构变更:数据库资源申请由质量服务团队负责,做到资源的合理分布、分配,如果某个业务只需要个位数级别的DB实例,可以自行在私有DB云平台中申请部署,当数量比较大时,需要先经过质量服务团队评估通过。 +@QrGY  
数据库资源申请由质量服务团队负责,做到资源的合理分布、分配。如果某个业务需要小量DB实例,可以自行在私有DB云平台中申请部署;当数量比较大时,需要先经过质量服务团队评估通过才可以。
级别: 码农
发帖
128
云币
331
只看该作者 沙发  发表于: 01-31
级别: 码农
发帖
128
云币
331
只看该作者 板凳  发表于: 01-31
级别: 架构狮
发帖
1217
云币
1936
只看该作者 地板  发表于: 01-31
    
级别: 码农
发帖
128
云币
331
只看该作者 4楼 发表于: 02-01
    
级别: 小白
发帖
21
云币
26
只看该作者 5楼 发表于: 03-05
Re来自Facebook的一些MySQL运维经验
发表主题 回复主题
« 返回列表上一主题下一主题

限100 字节
如果您提交过一次失败了,可以用”恢复数据”来恢复帖子内容
 
验证问题: ECS是阿里云提供的什么服务? 正确答案:云服务器
上一个 下一个