博客
关于我
《Mysql是怎样运行的》读书笔记四
阅读量:810 次
发布时间:2019-03-24

本文共 949 字,大约阅读时间需要 3 分钟。

MySQL的InnoDB存储引擎以页面为基本读写单位,记录数据以.page结尾。作为常用的事务型数据库引擎,InnoDB具有持久化特性,即使服务器关闭数据也不会丢失。为了高效管理数据,InnoDB采用了行存储格式,其中COMPACT是最基础的行格式之一。以下将详细介绍COMPACT行格式的存储原理。

记录的组成结构

一条记录可以分为三个主要部分:额外信息、记录头信息和真实数据。这些部分共同构成记录存储在磁盘上的结构。

1. 记录的额外信息

(1) 变长字段长度列表

InnoDB行存储在磁盘上时,需要处理那些长度不固定(如VARCHAR、TEXT等变长字段)的数据。为了记录这些字段所占空间,COMPACT行格式采用了一个变长字段长度列表,该列表位于记录的开头部分。列表中的每个值代表相应变长字段所占用的字节数,存储顺序为列的访问顺序逆序排列。

例如:

  • 列1变长字段长度为100字节
  • 列2变长字段长度为150字节
  • 列3变长字段长度为200字节

(2) NULL值列表

InnoDB记录中某些列可能存在NULL值,以优化存储和查询效率,NULL值列表用于记录哪些列存在NULL值。该列表的存储方式采用位操作:

  • 每一个位代表一列
    • 位值为1:表示该列的值为NULL
    • 位值为0:表示该列的值不为NULL
  • 所需二进制位的字节数由记录中允许存储NULL值的列数量决定。如果二进制位数不足一个字节,高位补充0。

(3) 记录头信息

记录头由5个固定的字节组成,主要用于描述记录的存储属性和管理信息。这些字节包含以下内容:

  • 行格式类型(如COMPACT)
  • 是否存在Sort_key列(用于索引排序)
  • 行长度(固定大小或动态扩展)

2. 记录的真实数据

CPACT行格式的真实数据部分存储了定义的列及其对应的值,除此之外,InnoDB还为每条记录默认增加了以下隐藏列:

  • row_id: 行唯一标识符,6字节(用于唯一标识记录)
  • trx_id: 事务唯一标识符,6字节(用于标记当前记录所参与的事务)
  • roll_pointer: 事务回滚指针,7字节(用于记录回滚操作的位置)

通过上述结构,InnoDB能够高效地存储和管理各种数据类型,确保数据一致性和完整性。理解这些存储机制有助于优化数据库性能和磁盘使用效率。

转载地址:http://auhkk.baihongyu.com/

你可能感兴趣的文章
Pandas 对数据框的布尔比较
查看>>
Pandas 将多个数据帧与时间戳索引对齐
查看>>
pandas 将通话数据分割为15分钟的间隔
查看>>
pandas 找到局部最大值和最小值
查看>>
Pandas 按年份分组,按销售列排名,在具有重复数据的数据框中
查看>>
pandas 按日期和年份分组,并汇总金额
查看>>
pandas 数据帧到PostgreSQL表中使用的是没有SQLAlChemy的心理复制2吗?
查看>>
pandas 数据帧多行查询
查看>>
Pandas 数据框:使用线性插值重新采样
查看>>
pandas 数据框将 INT64 列转换为布尔值
查看>>
pandas 数据框将列类型转换为字符串或分类
查看>>
pandas 数据框条件 .mean() 取决于特定列中的值
查看>>
pandas 数据框至海运分组条形图
查看>>
Pandas 数据透视表:列顺序和小计
查看>>
pandas 时序统计的高级用法!
查看>>
pandas 时间序列重新采样结束给定的一天
查看>>
pandas 根据不是常量的第三列的值将值从一列复制到另一列
查看>>
pandas 根据值从多列中的一列查找
查看>>
Pandas 根据布尔条件选择行和列
查看>>
pandas 滚动窗口 - datetime64[ns] 未实现
查看>>