《OReilly精品图书系列数据库系统内幕》[美]亚历克斯・彼得罗夫(AlexPe

《OReilly精品图书系列数据库系统内幕》[美]亚历克斯・彼得罗夫(AlexPe | PDF下载|ePub下载

OReilly精品图书系列数据库系统内幕 版权信息

  • 出版社:机械工业出版社
  • 出版时间:2020-05-01
  • ISBN:9787111655169
  • 条形码:9787111655169 ; 978-7-111-65516-9

OReilly精品图书系列数据库系统内幕 本书特色

本书旨在指导开发者理解现代数据库和存储引擎背后的内部概念,包含从众多书籍、论文、博客和多个开源数据库源代码中精心选取的相关材料。本书深入介绍了数据存储、数据构建块、分布式系统和数据集群,并且指出了现代数据库之间*重要的区别在于决定存储结构和数据分布的子系统。本书分为两部分:*部分讨论节点本地的进程,并关注数据库系统的核心组件——存储引擎,以及*重要的一个特有元素;第二部分探讨如何将多个节点组织到一个数据库集群中。本书主要面向数据库开发人员,以及使用数据库系统构建软件的人员,如软件开发人员、运维工程师、架构师和工程技术经理。

OReilly精品图书系列数据库系统内幕 内容简介

这本书既不是关于关系型数据库的书,也不是关于NoSQL的书,而是关于在各种数据库系统中使用的算法和概念的书,重点是存储引擎和负责数据分布的组件。第壹部分讨论节点本地的进程,并着重于存储引擎这个数据库系统的核心组件以及*重要的一个特有元素。第二部分讨论负责数据分布的子系统和组件,介绍如何将多个节点组织到一个数据库集群中。

OReilly精品图书系列数据库系统内幕 目录

前言 1 **部分 存储引擎 第1章 简介与概述 13 1.1 数据库架构 14 1.2 内存数据库与磁盘数据库 16 1.3 面向列与面向行的数据库 17 1.3.1 面向行的数据布局 18 1.3.2 面向列的数据布局 19 1.3.3 区别与优化 20 1.3.4 宽列式存储 20 1.4 数据文件和索引文件 21 1.4.1 数据文件 22 1.4.2 索引文件 23 1.4.3 间接的主索引 24 1.5 缓冲、不可变性和有序性 25 1.6 本章小结 26 第2章 B树基础知识 28 2.1 二分搜索树 28 2.1.1 树的平衡 29 2.1.2 基于磁盘存储的树 31 2.2 基于磁盘的结构 32 2.2.1 机械硬盘 32 2.2.2 固态硬盘 32 2.2.3 磁盘存储结构 34 2.3 无处不在的B树 35 2.3.1 B树的层次结构 36 2.3.2 分隔键 38 2.3.3 B树查找复杂度 39 2.3.4 B树查找算法 39 2.3.5 键的数目 40 2.3.6 B树的节点分裂 40 2.3.7 B树的节点合并 42 2.4 本章小结 43 第3章 文件格式 45 3.1 动机 45 3.2 二进制编码 46 3.2.1 原始类型 46 3.2.2 字符串和变长数据 48 3.2.3 按位打包的数据:布尔值、枚举值和标志 48 3.3 通用原理 49 3.4 页的结构 51 3.5 分槽页 51 3.6 单元格布局 53 3.7 将单元格放进分槽页 54 3.8 管理变长数据 55 3.9 版本 56 3.10 校验和 57 3.11 本章小结 58 第4章 B树的实现 59 4.1 页头 59 4.1.1 魔数 59 4.1.2 同级指针 60 4.1.3 *右指针 60 4.1.4 节点的高键 61 4.1.5 溢出页 62 4.2 二分搜索 64 4.3 传播分裂与合并 65 4.4 再平衡 67 4.5 仅在右侧追加 68 4.6 压缩 69 4.7 清扫与维护 70 4.7.1 更新和删除导致的碎片 70 4.7.2 页的碎片整理 71 4.8 本章小结 72 第5章 事务处理与恢复 74 5.1 缓冲区管理 75 5.1.1 缓存语义 77 5.1.2 缓存回收 77 5.1.3 在缓存中锁定页 78 5.1.4 页置换 79 5.2 恢复 82 5.2.1 日志语义 83 5.2.2 操作日志与数据日志 84 5.2.3 steal和force策略 84 5.2.4 ARIES 85 5.3 并发控制 86 5.3.1 可串行化 86 5.3.2 事务隔离 87 5.3.3 读异常和写异常 88 5.3.4 隔离级别 88 5.3.5 乐观并发控制 90 5.3.6 多版本并发控制 91 5.3.7 悲观并发控制 91 5.3.8 基于锁的并发控制 91 5.4 本章小结 98 第6章 B树的变体 101 6.1 写时复制 101 6.2 抽象节点更新 103 6.3 惰性B树 103 6.3.1 WiredTiger 104 6.3.2 惰性自适应树 105 6.4 FD树 106 6.4.1 分段级联 106 6.4.2 对数级的有序段 108 6.5 Bw树 108 6.5.1 更新链 109 6.5.2 用CAS控制并发 109 6.5.3 结构修改操作 110 6.5.4 合并和垃圾收集 111 6.6 缓存无关B树 112 6.7 本章小结 114 第7章 日志结构存储 116 7.1 LSM树 117 7.1.1 LSM树的结构 118 7.1.2 更新与删除 122 7.1.3 LSM树的查找 123 7.1.4 合并迭代 124 7.1.5 协调 126 7.1.6 LSM树的维护 126 7.2 读写放大与空间放大 129 7.3 实现细节 130 7.3.1 有序字符串表 130 7.3.2 布隆过滤器 132 7.3.3 跳表 133 7.3.4 磁盘访问 135 7.3.5 压缩 136 7.4 无序LSM存储 136 7.4.1 Bitcask 137 7.4.2 WiscKey 138 7.5 LSM树中的并发 139 7.6 日志堆叠 140 7.6.1 闪存转换层 141 7.6.2 文件系统日志记录 142 7.7 LLAMA与精心堆叠 144 7.8 本章小结 145 **部分总结 147 第二部分 分布式系统 第8章 简介与概述 151 8.1 并发执行 151 8.2 分布式计算的误区 153 8.2.1 处理 154 8.2.2 时钟和时间 155 8.2.3 状态一致性 156 8.2.4 本地和远程执行 157 8.2.5 处理故障的需要 157 8.2.6 网络分区和部分故障 157 8.2.7 级联故障 158 8.3 分布式系统抽象 160 8.4 两将军问题 165 8.5 FLP不可能定理 166 8.6 系统同步性 167 8.7 故障模型 167 8.7.1 崩溃故障 168 8.7.2 遗漏故障 168 8.7.3 任意故障 169 8.7.4 故障处理 169 8.8 本章小结 169 第9章 故障检测 171 9.1 心跳和ping 172 9.1.1 无超时的故障检测器 173 9.1.2 外包心跳 174 9.2 phi增量故障检测器 175 9.3 Gossip和故障检测 175 9.4 反向故障检测 176 9.5 本章小结 177 第10章 领导者选举 179 10.1 霸道选举算法 180 10.2 依次故障转移 181 10.3 候选节点/普通节点优化 182 10.4 邀请算法 183 10.5 环算法 184 10.6 本章小结 185 第11章 复制和一致性 187 11.1 实现可用性 188 11.2 臭名昭著的CAP理论 188 11.2.1 小心使用CAP 189 11.2.2 收成与产量 190 11.3 共享内存 191 11.4 顺序 192 11.5 一致性模型 193 11.5.1 严格一致性 194 11.5.2 可线性化 194 11.5.3 顺序一致性 198 11.5.4 因果一致性 199 11.6 会话模型 202 11.7 *终一致性 204 11.8 可调一致性 204 11.9 见证者副本 206 11.10 强*终一致性和CRDT 207 11.11 本章小结 209 第12章 反熵和传播 212 12.1 读修复 213 12.2 摘要读 214 12.3 提示移交 215 12.4 Merkle树 215 12.5 位图版本向量 216 12.6 Gossip传播 218 12.6.1 Gossip技术细节 219 12.6.2 覆盖网络 219 12.6.3 混合Gossip 220 12.6.4 局部视图 221 12.7 本章小结 222 第13章 分布式事务 224 13.1 多个操作的原子性 225 13.2 两阶段提交 226 13.2.1 2PC中的参与者故障 227 13.2.2 2PC中的协调者故障 228 13.3 三阶段提交 229 13.4 Calvin分布式事务 231 13.5 Spanner分布式事务 233 13.6 数据库分区 235 13.7 Percolator分布式事务 236 13.8 协调避免 238 13.9 本章小结 240 第14章 共识 243 14.1 广播 244 14.2 原子广播 245 14.2.1 虚同步 245 14.2.2 Zookeeper原子广播 246 14.3 Paxos 248 14.3.1 Paxos算法 249 14.3.2 Paxos的Quorum 250 14.3.3 故障场景 251 14.3.4 Multi-Paxos 253 14.3.5 快速Paxos 254 14.3.6 平等Paxos 255 14.3.7 柔性Paxos 257 14.3.8 共识的推广解法 259 14.4 Raft 261 14.4.1 Raft中的领导者角色 263 14.4.2 故障场景 264 14.5 拜占庭共识 266 14.5.1 PBFT算法 266 14.5.2 恢复和检查点 268 14.6 本章小结 269 第二部分总结 272 参考文献 275

OReilly精品图书系列数据库系统内幕 相关资料

“本书全面介绍了数据库系统领域的各种知识,譬如存储引擎、存储文件系统、分布式理论和算法,可以帮助你快速全面了解相关的知识。本书是开发工程师、运维工程师、存储工程师深入了解数据库系统的必备书籍。” ——付磊,快手资深数据库工程师 “本书从底层原理层面剖析了存储和分布式的技术细节,能让你更好地认知数据库底层系统。” ——楼江航,阿里云数据库高级技术专家 canal、otter作者 “本书选取数据存储和分布式理论两大现代数据库的重要组成部分,带领读者走进数据库的核心地带,详细剖析了它们的工作原理及内部运行机制,是一本数据库开发和运维人员深入理解数据库原理不可多得的优秀书籍。” ——牛新庄,中国邮政储蓄银行首席信息官 “数据库是计算机*核心的基础软件之一,本书系统地介绍了数据库存储引擎与分布式系统知识,详细地介绍了数据库常见内部存储实现结构与分布式算法,能帮助读者掌握数据库实现的原理。” ——叶正盛,阿里云数据库资深专家

OReilly精品图书系列数据库系统内幕 作者简介

作者简介 Alex Petrov是一位数据基础架构工程师,数据库和存储系统的狂热爱好者,Apache Cassandra 提交者和PMC成员,精通存储、分布式系统和算法。
译者简介 黄鹏程 毕业于北京邮电大学,过去八年一直专注于数据库和大数据平台研发与架构工作。毕业后就职于中国民生银行,历任软件工程师及大数据基础架构团队负责人,目前为阿里云高级产品专家,负责阿里云数据库相关产品的设计与规划工作。你可以通过搜索“gnuhpc”在LinkedIn或者微信上找到他。 傅宇 毕业于南京大学计算机系,专注于数据库技术,现任阿里云技术专家,担任 PolarDB-X 分布式关系型数据库内核研发工作,在分布式事务、查询优化器、执行器等方向略有经验,对数据库和大数据领域充满热情。个人博客:https://ericfu.me,知乎账号 Eric Fu,欢迎与我交流! 张晨 毕业于上海交通大学。大数据、数据库、分布式系统和函数式编程爱好者。现于Indeed东京担任软件工程师一职。你可以通过 我的个人主页chasezhang.me了解更多信息。

备用下载地址:

链接2:点击下载 (百度网盘备用,解压密码: 8986)

链接3:点击下载 (UC网盘备用,解压密码: 8986)

链接4:点击下载 (迅雷网盘备用,解压密码: 8986)