迁移Zabbix数据库到TokuDB-爱开源

背景介绍

线上的Zabbix数据库有几个大表数据量疯狂增长，单表已经超过500G，而且在早期也没做成分区表，后期维护非常麻烦。比如，想删除过期的历史数据，在原先的模式下，history、history_uint等几个大表是用 (itemid, clock) 两个字段做的联合主键，只用 clock 字段检索效率非常差。

TokuDB 是一个高性能、支持事务处理的 MySQL 和 MariaDB 的存储引擎。TokuDB 的主要特点是高压缩比，高 INSERT 性能，支持大多数在线修改索引、添加字段，特别适合像 Zabbix 这种高 INSERT，少 UPDATE 的应用场景。

迁移准备

欲使用 TokuDB 引擎，服务层可以选择和 MariaDB ，也可以选择 Percona ，鉴于我以往使用 Percona 的较多，因此本次也选择使用 Percona 版本集成 TokuDB 引擎。

按照正常方式安装即可，配置文件中增加3行：

malloc-lib= /usr/local/mysql/lib/mysql/libjemalloc.so
plugin-dir = /usr/local/mysql/lib/mysql/plugin/
plugin-load=ha_tokudb.so

如果不加载jemalloc，启动时就会有类似下面的报错：

[ERROR] TokuDB not initialized because jemalloc is not loaded
[ERROR] Plugin 'TokuDB' init function returned error.
[ERROR] Plugin 'TokuDB' registration as a STORAGE ENGINE failed.

并且，修改内核配置，禁用transparent_hugepage，不关闭的话可能会导致TokuDB内存泄露（建议写到 /etc/rc.local 中，重启后仍可生效）：

echo never > /sys/kernel/mm/redhat_transparent_hugepage/defrag
echo never > /sys/kernel/mm/redhat_transparent_hugepage/enabled
echo never > /sys/kernel/mm/transparent_hugepage/enabled
echo never > /sys/kernel/mm/transparent_hugepage/defrag

如果不修改内核设置，启动时就会有类似下面的报错：

Transparent huge pages are enabled, according to /sys/kernel/mm/redhat_transparent_hugepage/enabled
Transparent huge pages are enabled, according to /sys/kernel/mm/transparent_hugepage/enabled
[ERROR] TokuDB will not run with transparent huge pages enabled.
[ERROR] Please disable them to continue.
[ERROR] (echo never > /sys/kernel/mm/transparent_hugepage/enabled)
[ERROR]
[ERROR] ************************************************************
[ERROR] Plugin 'TokuDB' init function returned error.
[ERROR] Plugin 'TokuDB' registration as a STORAGE ENGINE failed.

然后，初始化数据库，启动即可。

我的服务器配置：E5-2620 * 2，64G内存，1T可用磁盘空间（建议datadir所在分区设置为xfs文件系统），下面是我使用的相关选项，仅供参考：

#
#my.cnf
#
# Percona-5.6.17, TokuDB-7.1.6，用于Zabbix数据库参考配置
# 我的服务器配置：E5-2620 * 2，64G内存，1T可用磁盘空间（建议datadir所在分区设置为xfs文件系统）
# TokuDB版本：Percona-5.6.17, TokuDB-7.1.6(插件加载模式)
#
# created by yejr(http://imysql.com), 2014/06/24
#
[client]
port            = 3306
socket          = mysql.sock
#default-character-set=utf8
 
[mysql]
prompt="\u@\h \D \R:\m:\s [\d]>
#pager="less -i -n -S"
tee=/home/mysql/query.log
no-auto-rehash
 
[mysqld]
open_files_limit = 8192
max_connect_errors = 100000
 
#buffer & cache
table_open_cache = 2048
table_definition_cache = 2048
max_heap_table_size = 96M
sort_buffer_size = 2M
join_buffer_size = 2M
tmp_table_size = 96M
key_buffer_size = 8M
read_buffer_size = 2M
read_rnd_buffer_size = 16M
bulk_insert_buffer_size = 32M
 
#innodb
#只有部分小表保留InnoDB引擎，因此InnoDB Buffer Pool设置为1G基本上够了
innodb_buffer_pool_size = 1G
innodb_buffer_pool_instances = 1
innodb_data_file_path = ibdata1:1G:autoextend
innodb_flush_log_at_trx_commit = 1
innodb_log_buffer_size = 64M
innodb_log_file_size = 256M
innodb_log_files_in_group = 2
innodb_file_per_table = 1
innodb_status_file = 1
transaction_isolation = READ-COMMITTED
innodb_flush_method = O_DIRECT

#tokudb
malloc-lib= /usr/local/mysql/lib/mysql/libjemalloc.so
plugin-dir = /usr/local/mysql/lib/mysql/plugin/
plugin-load=ha_tokudb.so
 
#把TokuDB datadir以及logdir和MySQL的datadir分开，美观点，也可以不分开，注释掉本行以及下面2行即可
tokudb-data-dir = /data/mysql/zabbix_3306/tokudbData
tokudb-log-dir = /data/mysql/zabbix_3306/tokudbLog
 
#TokuDB的行模式，建议用 FAST 就足够了，如果磁盘空间很紧张，建议用 SMALL
#tokudb_row_format = tokudb_small
tokudb_row_format = tokudb_fast
tokudb_cache_size = 44G
 
#其他大部分配置其实可以不用修改的，只需要几个关键配置即可
tokudb_commit_sync = 0
tokudb_directio = 1
tokudb_read_block_size = 128K
tokudb_read_buf_size = 128K

迁移过程

建议在一台全新的服务器上启动Percona(TokuDB)实例进程，初始化新的Zabbix数据库，直接将大表转成TokuDB引擎，并且开启分区模式。这样相比直接在线ALTER TABLE或者INSERT…SELECT导入数据都要来的快一些（我简单测试了下，差不多能快2-3倍，甚至更高）。

在做数据迁移时，建议在目标服务器上做库表结构初始化，在源服务器上采用分段方式导出，一个表导出多个备份文件，方便在恢复时可以并发导入。在导入时，并且记得临时关闭 binlog，最起码设置 sync_binlog = 0 以及 tokudb_commit_sync = 0，以提高导入速度。采用 mysqldump 增加 -w 参数即可实现根据条件分段导出，具体可参考上一次的文章：[MySQL FAQ]系列— mysqldump加-w参数备份，或者是用MySQLDumper。

需要用到外键的表继续保留InnoDB引擎，其他表都可以转成TokuDB，history_str、trends、trends_uint、history、history_uint等几个大表是一定要转成TokuDB的，events由于需要用到外键，所以继续保留InnoDB引擎。

我将表结构初始化SQL脚本提供下载了，一份是没有采用分区表的，一份是采用分区表的，大家可自行选择。一般如果记录数超过1亿，就建议使用分区表，根据时间字段(clock)分区，方便后期维护，例如删除过期历史数据什么的。

收尾

剩下的基本没啥可做的了，就是观察下运行状态，是否还有个别慢查询堵塞。在我的环境中，一开始把items表也转成TokuDB了，结果有个画图的SQL执行计划不准确，非常慢。后来发现items表也需要用到外键，于是又转回InnoDB表，这个SQL也恢复正常了。

数据库初始化脚本我整理后提供下载了，大家可以直接使用。

附件1：不使用分区表

附件2：使用分区表

适用版本：

Zabbix版本：Zabbix 2.2.0
TokuDB版本：Percona-5.6.17, TokuDB-7.1.6(插件加载模式)

转载请注明：爱开源 » 迁移Zabbix数据库到TokuDB

迁移Zabbix数据库到TokuDB

背景介绍

迁移准备

迁移过程

收尾

与本文相关的文章

您必须登录才能发表评论！

背景介绍

迁移准备

迁移过程

收尾

与本文相关的文章

您必须 登录 才能发表评论！

您必须登录才能发表评论！