博客 数栈运维案例:云上 RAC 部署、运维及实践案例

数栈运维案例:云上 RAC 部署、运维及实践案例

   小美   发表于 2023-02-01 10:07  264  0

数据库产品越来越多,各家云厂商也都推出基于开源 MySQL、Postgre 等的关系型数据库产品,多副本、高可用、读写分离、分库分表等功能更是集成在各类产品中,降低了机房建设和运维成本,助力更多的客户上云。

唯独鲜见 Oracle 的云产品输出,除非是 Oracle Cloud。

对于当前业务系统基于 Oracle 系统开发,且改造难度较大,如 OA、ERP 等系统;或对数据库要求较高,必须使用 Oracle 数据库的场景,如订单流水、金融交付系统,袋鼠云可以提供阿里、华为、腾讯公有云,阿里、Zstack 专有云上完善的云上 Oracle RAC 实施部署、运维方案,协助客户无缝上云。

云上单机还是集群,Oracle 的部署都遵循官方的指导文档,没有差别。

但是在基础配置上面,云环境将网络、服务器、磁盘等以产品化输出,有其特殊性:

  • 云交换机:建议云环境中所有的业务系统运行在专有网络 VPC 中,创建不同网段交换机,供给 RAC 集群、业务系统使用;同一个 VPC 网络默认互通
  • 云服务器:云环境有地域 / 可用区一说,同一地域不同可用区类似于同城不同机房,集群计算节点需要在同一个可用区中,购买在同地域不同可用区或不同地域的机器可用于部署业务 / 数据库灾备环境
  • 云盘:同样需要根据规划购买与 RAC 计算节点同地域同可用区的云盘,并挂载到计算节点上;

不同云环境对一台云服务器上挂载磁盘个数的有不同限制,在集群规划阶段需要考虑预估数据量大小以及云盘大小。

云服务器规格可以升配或减配,对于集群计算节点,可以逐一进行,降低对业务的影响。

一、云上 RAC 规划一览

2 节点 RAC 资源配置
主机cloudrac01Centos7.68C16G
cloudrac02Centos7.68C16G
云盘3*20G OCRDG1*100G GIMRDG2*500G DATADG
1*500G ARCHDG1*200G FRADG1*500G /backup
IP 信息Public IP192.168.33.151192.168.33.150
Private IP192.168.22.213192.168.22.214
VIP192.168.33.55192.168.33.56
Scan IP192.168.33.57

二、稳定高效运行

1、标准压力测试

Swingbench 可以构建真实 OLTP 事务场景,比如订单类业务、新建客户、订购、下单等流程操作,通过大批量增删改查操作,测试不同并发场景下数据库性能趋势和稳定性,同时结合其他监控工具,观察服务器内存、负载、磁盘等的性能趋势和稳定性;根据压测结果及早发现和优化问题,评估数据库的最佳使用方式。

依据袋鼠云的集群运维经验,短时间、低并发的压测无法验证集群的稳定性,所以在云上集群部署之后,会进行长时间(4 小时以上)、高并发的持续压测;

同时对压测出来的集群性能问题进行分析,优化集群参数配置,并主动提供云服务器、存储资源优化建议,以期交付一个稳定、高性能的数据库环境。

阿里云 2 节点 12.2.0.1RAC 压测举例:

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user6/article/6c2073e34add45906bdc83f8484fe9c1..png

2、业务回放测试

DBReplay 的测试方法,抓取生产环境某一时间段业务负载,单次 capture 可以多次 replay,更接近于正式的生产负载,更直观有效。主要用于数据库升级、迁移,应用程序部署等的预演,量化评估出变更实施后对现有的性能的影响程度。

对于平常压力较大的业务系统,在迁移割接之前有必要进行此类测试。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user6/article/591f1083dc23f23c8d2a9bb12c6411d8..png

三、案例分享

1、某日企客户

(1)需求分析

  • 业务整体上云,需要部署云上 Oracle RAC 12C/11G 各 1 套
  • 满足高可用、容灾等需求

(2)架构规划

  • 规划 20G*3 云盘做 OCR/Voting 组、60G*2 云盘做 REDODG1/2 组、200G*1 云盘做 ARCHDG 组、规划 500G*1 云盘做 DATADG 组、100G*1 云盘做 MGMTDG 组
  • 规划云服务 32C64G*2 作为计算节点
  • 建议客户采用业务分离的模式访问数据库

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user6/article/e2308c9de6621386ebed5352367ce7b8..png

2. 某国企招聘网站

(1) 需求分析

  • 需要同时满足 1w 人在线访问,并发事务 2000 以上
  • 自行搭建云上 Oracle 单机数据库,预计很快到达瓶颈
  • 需要高可用、容灾的架构保障业务的持续运行

(2) 架构规划

  • 新购高规格云 ECS 作为计算节点,保证充足的计算资源
  • 原单机数据库割接后作为 DG 备库运行
  • 配置合理备份策略,上传备份集到 OSS 对象存储,异地保存

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user6/article/e033da2f3ac159fcb434653282008d90..png

3、某省级专有云交管平台

汇总全省交管数据,并提供查询、分析平台。

(1)需求分析

  • 自建机房,部署在 Windows 服务器单机 Oracle11.2.0.1
  • 18T 数据,并在逐步上涨中
  • 业务调试需要和部里对接、调整,实际没有测试的可能
  • 可维护时间短

(2)架构规划

  • 专有云环境部署,2 节点 RAC 集群,并搭建容灾备库
  • 通过 ADG 实时同步机房数据,进行 DBRelay 压测
  • 继续使用备份一体机备份生产数据

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user6/article/99365b7051a1dc6de1c8dd637af2c80a..png

 

想了解或咨询更多有关袋鼠云大数据产品、行业解决方案、客户案例的朋友,浏览袋鼠云官网:https://www.dtstack.com/?src=bbs
同时,欢迎对大数据开源项目有兴趣的同学加入「袋鼠云开源框架钉钉技术群」,交流最新开源技术信息,群号码:30537511,项目地址:
https://github.com/DTStack

0条评论
社区公告
  • 大数据领域最专业的产品&技术交流社区,专注于探讨与分享大数据领域有趣又火热的信息,专业又专注的数据人园地

最新活动更多
微信扫码获取数字化转型资料
钉钉扫码加入技术交流群