博客 为什么高性能场景选用Postgres SQL 而不是 MySQL

为什么高性能场景选用Postgres SQL 而不是 MySQL

   数栈君   发表于 2024-02-05 10:35  80  0

一、 数据库简介 TLDR;


1.1 MySQL
MySQL声称自己是最流行的开源数据库,它属于最流行的RDBMS (Relational Database Management System,关系数据库管理系统)应用软件之一。LAMP中的M指的就是MySQL。构建在LAMP上的应用都会使用MySQL.
MySQL最初是由MySQL AB开发的,然后在2008年以10亿美金的价格卖给了Sun公司,Sun公司又在2010年被Oracle收购。Oracle收购导致MySQL的出现两个版本:商业版和社区版。对于后者,由于Oracle控制了MySQL的开发,受到了广大使用者的批评。


1.2 PostgreSQL
PostgreSQL标榜自己是世界上最先进的开源数据库,属于关系型数据库管理系统(ORDBMS), 是以加州大学计算机系开发的POSTGRES,4.2版本为基础的对象关系型数据库管理系统, 最初是1985年在加利福尼亚大学伯克利分校开发的,作为Ingres数据库的后继。PostgreSQL是完全由社区驱动的开源项目。
它提供了单个完整功能的版本,而不像MySQL那样提供了多个不同的社区版、商业版与企业版。PostgreSQL基于自由的BSD/MIT许可,组织可以使用、复制、修改和重新分发代码,只需要提供一个版权声明即可。



Note:


MySQL的层级关系: 实例 -> 数据库 -> 表


Postgres 的层级关系: 实例 -> 数据库 -> Schema -> 表


schema 可以理解为命名空间,不影响使用



二、性能对比


测试环境


markdown
复制代码
MySQL:
- 硬件配置: 4核心 16GB内存
- 版本: MySQL 8.0

Postgres SQL:
- 硬件配置: 4核心 16GB内存
- 版本:Postgres SQL 13

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/de4fc234187d70a7d3ae96bb2efb80d5..jpg


此次压测数据, SELECT 均为SELECT 按照主键查询, UPDATE按照主键进行UPDATE, INSERT则为一次INSERT一行数据。从压测数据上来看,我们可以得出以下几个结论:


  1. 在吞吐量上而言,Postgres SQL 在SELECT性能上优于MySQL一倍, 在INSERT上优于4-5倍, UPDATE 则优5-6倍

  2. 从平均耗时上来看, Postgres SQL优于MySQL不止数倍

  3. 尤其从热点行更新上看出,MySQL性能仅为Postgres SQL的, 1/8左右,耗时也增加了7倍

三、适用场景,如何选择?


相对于Postgres MySQL更简单, 所以有着更高的流行度, 在技术资料,以及技术组件支持上,支持的也更完善一些, 但不意味着它并不是不能替代的, 于笔者而言, MYSQL更像用于中小企业、个人的一款数据库工具, 因为会的人多, 文档资料比较完善,所以入手难度低。 但这些并不意味着MYSQL是最好的。


http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/ee71c8e42a824570f1e37f28ffe4942a..jpg

从上图来看Postgres SQL的发展势头非常迅猛,目前已经隐隐有追上MySQL的趋势, 而MySQL相对而言,使用情况受欢迎度一直呈现下降趋势。


MySQL适用的场景


MySQL适用于简单的应用场景,如电子商务、博客、网站等, 大中小型系统均可以使用MySQL, 它最高支持千万级别到数亿级别的数据量,
但是在高性能要求的情况下, 比如较快的响应和较高的吞吐量的时候, MYSQL的性能稍微捉襟见肘,
另外,在查询条件比较复杂、业务吞吐量要求不高,响应时长无要求,的时候,可以选择MYSQL,


Postgres SQL适用的场景


总的来说, Postgre SQL更适合复杂的数据结构、高级应用和大规模数据集, 当然如果数据规模比较小, 也可以选择Postgres SQL, 无论是什么场景,如果你想用Postgres SQL, 总可以找到对应的解决方法,
有且仅有, 在查询条件比较复杂,的时候不太适用, 因为根据我们实际线上的业务表现是 Postgre SQL可能会选错索引。


四、总结


PostgreSQL相对于MySQL的优势


  • Postgre SQL在性能上远远好于MYSQL, 通过上面的压测数据即可体现,无论是在耗时,还是在整体吞吐量上,有显著优势

  • Postgre SQL在单行更新上有明显优势,尤其是启用了HOT UPDATE后, 性能比MYSQL高了一个数量级

  • 在SQL的标准实现上要比MySQL完善,而且功能实现比较严谨,比较学院化;

  • Postgre SQL主表采用堆表存放,MySQL采用索引组织表,能够支持比MySQL更大的数据量。

  • Postgre SQL的主备复制属于物理复制,相对于MySQL基于binlog的逻辑复制,数据的一致性更加可靠,复制性能更高,对主机性能的影响也更小。

  • MySQL 的事务隔离级别 repeatable read 并不能阻止常见的并发更新, 得加锁才可以, 但悲观锁会影响性能, 手动实现乐观锁又复杂. 而 Postgre SQL 的列里有隐藏的乐观锁 version 字段, 默认的 repeatable read 级别就能保证并发更新的正确性, 并且又有乐观锁的性能.

Postgre SQL之于MySQL相对劣势:


  • Postgre SQL系统表设计相对复杂, 在进行一些系统表的统计、操作等方面比较复杂

  • Postgre SQL 的索引选择方面,选错的概率稍高一些(实测), 而且不能跟mysql 一样方便的使用force_index

  • Postgre SQL 存在vacuum, 需要结合具体使用场景,来调整vacuum的参数


免责申明:

本文系转载,版权归原作者winjeg所有,链接:https://juejin.cn/post/7324362442229891124,如若侵权请联系我们进行删除!

《数据治理行业实践白皮书》下载地址:https://fs80.cn/4w2atu

《数栈V6.0产品白皮书》下载地址:https://fs80.cn/cw0iw1

想了解或咨询更多有关袋鼠云大数据产品、行业解决方案、客户案例的朋友,浏览袋鼠云官网:https://www.dtstack.com/?src=bbs

同时,欢迎对大数据开源项目有兴趣的同学加入「袋鼠云开源框架钉钉技术群」,交流最新开源技术信息,群号码:30537511,项目地址:https://github.com/DTStack  
0条评论
社区公告
  • 大数据领域最专业的产品&技术交流社区,专注于探讨与分享大数据领域有趣又火热的信息,专业又专注的数据人园地

最新活动更多
微信扫码获取数字化转型资料
钉钉扫码加入技术交流群