1. 概论
    1. 大数据DBMS分类
      1. 并行数据库 水平划分+SQL查询分区执行
        • 缺:低伸缩、低容错(事务级别的容错,导致整个任务重新执行)
      2. NoSQL ( Not only SQL, NoREL)
        • 简单数据模型
        • 元数据与应用数据分离:一致性需求不同
        • 弱一致性:最终一致性、时间轴一致性
        • 优:低复杂性、高吞吐、高伸缩、避免ORM
        • 缺:缺乏数学基础、不支持ACID、功能简单导致应用层工作量较大、无统一的查询模型
      3. NewSQL 优化RDBMS实现大数据时的高性能,RDBMS的性能问题包括:
        • 通信:ODBC/JDBC开销大
        • 日志:磁盘IO
        • 锁:表锁
        • 闩(短期锁):一些数据结构的共享
        • 缓冲区:缓冲区的页管理和磁盘IO开销 两类解决方法:
        • 在分布式架构上应用RDBMS
        • 提高RDBMS性能,使得无需考虑伸缩问题 与NoSQL的界限并不是非常明确,有些NewSQL开始去模式化,有些NoSQL开始支持SQL和ACID
      4. 云数据管理(我认为这个分类和之前的不是同一维度)
        • 优:透明、高伸缩、高性价比
  2. 数据一致性理论
    1. C(强一致)AP
      • CA:两阶段提交,例:传统和集群DB、GFS、LDAP
      • CP:悲观锁,例:分布式DB
      • AP:乐观锁,例:DNS
    2. 数据一致性模型