当前, 全球范围内创新型数据库技术产品不断涌现, 市场格局剧烈变革, 数据库产业迎来快速爆发期。IDC 发布的数据显示,2022 年全球数据库市场规模有望突破 400 亿美元。另据中国信通院测算, 预计到 2025 年, 中国数据库市场总规模将达到 688 亿元, 市场年复合增长率为 23.4%。
在数据库市场越来越激烈的同质化竞争中, 企业怎样才能脱颖而出? 矩阵起源 (MatrixOrigin) 创始人王龙表示, 要想真正兑现市场潜力, 企业的技术实力是决定性因素:“市场有多大, 取决于我们在满足这么大的市场需求的过程中, 到底能够做到多好。”
运行速度比同类产品快 50% 以上
2022 年 2 月, 矩阵起源刚刚发布了新一代超融合异构数据库产品 MatrixOne 的 0.2 版本, 面向公众交出了自己的答卷。王龙的底气从何而来? 外界或可从这款产品的表现中一探究竟。
品牌官网发布的 MatrixOne 0.2.0 版本的性能测试报告显示, 根据在 SSB 测试集的测试结果,MatrixOne 的性能在同等只 PK 计算引擎的能力维度下, 表现已优于 ClickHouse。此次测试环境由 3 台 16 核 32G 内存的云主机搭建。在去除过滤、分区的前提下, 只比较计算能力, 在单表和多表测试查询中,MatrixOne 在每个查询上的运行速度均快于 Clickhouse, 平均快 50% 以上。
切实有效的创新点之一, 就是在计算引擎早期架构中即创新采用因子化拆解的工程实现提供自动化的计算下推, 在多表复杂 Join、分组聚合等核心算子实现上达到理论最优, 在非主键 join 场景下超过其他所有的 MPP 数据库计算引擎。在性能提升的同时, 也从架构上简化了查询优化器的相关设计, 在任意多表 join 上可以做到最坏情况下的理论最优解, 避免了传统优化器陷入局部次优解的局面。
另外一点是成功在向量化计算引擎内实现了高性能 Hash 表。为了避免 Golang 语言实现引起的开销,Hash 表在关键语句上引入了汇编来加速, 并做到了并行无锁执行, 连同因子化加速技术一道确保了计算引擎在多核的伸缩性上领先同类。
从以上测试结果和计算加速方案来看, 作为一款从零开始自主打造的国产数据库,MatrixOne 刚建设 8 个月就具备了和其他产品 PK 性能的积累, 进化速度着实令人惊叹。
更简单、更灵活, 持续打破数据边界
目前, 国际国内市场上数据库种类繁多, 企业或用户想要为自己的应用系统和数据智能平台选择数据库, 光选型、测试就要花很多时间和人力; 之后还要针对每个数据库系统做开发、部署、运维; 如果有新的需求变化或者是业务变化时, 这个流程又得走一遍。这些涉及的软硬件投入和人力投入都是巨大的, 并且在大多数情况下是可以优化和避免的。
简单地说,MatrixOne 的目标就是把用户选用数据智能系统的门槛降下来。MatrixOne 将会包含支持分析、事务和流计算负载的能力, 来满足大部分应用场景的需求。这样的多功能数据库, 第一可以在选型时治好用户的选择困难症, 并大大降低企业的运维和运营成本; 第二, 在遇到变化时, 也能够通过灵活‘变形’来最大可能的满足用户的需求, 从而帮助企业提高业务敏捷性。
王龙表示:“在 0.2 的版本里, 我们做到了数据实时插入可见且确保一致的情况下, 也能够满足高性能的数据分析需求。当然, 当更多这种看似矛盾的能力加进来的时候, 工作的复杂度也会几何级数地增加, 但是我们也有信心。把复杂留给自己, 把简单和灵活留给用户, 这就是我们想要提供的价值。”
MatrixOne 作为基础软件, 从开始走的就是开源路线。通过一套简单、松耦合的架构设计, 以及大量示范和文档, 矩阵起源希望能够打造一个具备极致创新空间的开源社区。目前, 有不少爱好者加入了 MatrixOne 开源社区, 一起参与讨论和贡献代码。接下来,MatrixOne 的前进道路还任重道远, 但其在 SSB 测试集和 NYC Taxi 测试集的亮眼性能表现, 已令人对 MatrixOne 的未来充满期待。
(原标题:国产数据库异军突起,矩阵起源发布 MatrixOne 更新版本)