分布式数据库从入门到实战
随着云计算、大数据和微服务架构的兴起,数据库技术也在不断演进,适应不断变化的业务需求,面对处理海量数据的挑战。从传统的关系型数据库到分布式、分析型数据库,每一种技术的诞生都是为了解决特定场景下的问题。
对于开发者和架构师来说,掌握数据库的基本原理和应用场景可以延长软件的生命周期。了解不同数据库的特性和适用场景,可以帮助我们在项目初期做出更合理的技术选型,避免未来可能出现的性能瓶颈和高昂的维护成本。此外,随着AI和物联网技术的兴起,对数据库的需求也在不断升级,对数据库知识的深入理解将助力我们更好地利用这些新兴技术。
基于此,我们邀请到了惟客数据总架构师彭旭老师,为你全面讲解数据库的基础知识,帮你掌握不同类型数据库的设计原理和适用场景。相信通过实战案例的分析和学习,你一定能够根据具体的业务需求选择合适的数据库解决方案,并具备优化数据库性能的能力。
课程设计
课程一共有5个章节。
- 基础篇
包括不同类型数据库的存储模型,编码与压缩的必要性,数据库事务的作用以及MVCC机制,LSM是如何优化读写速度的,如何合适地对海量数据进行分片,以及分布式场景下表Join的方式等等。对比主流数据库在基础设计及适用场景上的异同。 - HBase篇
HBase篇的案例是一个手机云服务存储的需求。基于这个案例,我们会一起分析MySQL分库分表下运维成本、硬件成本、扩展性上的问题,拆解HBase解决这些问题的过程。 - StarRocks篇
从一个典型的客户数据平台CDP案例需求出发,介绍StarRocks的基本架构与原理,以及基于StarRocks的表模型设计CDP相关表的方法。了解StarRocks优化数据查询性能,能够实现实时更新与极速查询的原因。 - ClickHouse篇
分析ClickHouse高性能的原理。同时沿用CDP的需求,理解表模型在ClickHouse中的设计,并行计算和调优。 - AI与向量数据库篇
了解向量化的需求的产生原因,和老师一起用向量查询引擎Faiss搭建一个人脸识别系统,通过Milvus结合大模型搭建一个RAG个人知识库。