来自:Bruce Dou的一篇好文

MYSQL 应该是最流行了 WEB 后端数据库。WEB 开发语言最近发展很快,PHP, Ruby, Python, Java 各有特点,虽然 NOSQL 最近越來越多的被提到,但是相信大部分架构师还是会选择 MYSQL 来做数据存储。

MYSQL 如此方便和稳定,以至于我们在开发 WEB 程序的时候很少想到它。即使想到优化也是程序级别的,比如,不要写过于消耗资源的 SQL 语句。但是除此之外,在整个系统上仍然有很多可以优化的地方。

  1. 选择合适的存储引擎: INNODB

除非你的数据表使用来做只读或者全文检索 (相信现在提到全文检索,没人会用 MYSQL 了),你应该默认选择 INNODB 。

你自己在测试的时候可能会发现 MYISAM 比 INNODB 速度快,这是因为: MYISAM 只缓存索引,而 INNODB 缓存数据和索引,MYISAM 不支持事务。但是 如果你使用 innodb_flush_log_at_trx_commit = 2 可以获得接近的读取性能 (相差百倍) 。

1.1 如何将现有的 MYISAM 数据库转换为 INNODB:

mysql -u [USER_NAME] -p -e "SHOW TABLES IN [DATABASE_NAME];" | tail -n +2 | xargs -I '{}' echo "ALTER TABLE {} ENGINE=INNODB;" > alter_table.sql
perl -p -i -e 's/(search_[a-z_]+ ENGINE=)INNODB/\1MYISAM/g' alter_table.sql
mysql -u [USER_NAME] -p [DATABASE_NAME] < alter_table.sql

1.2 为每个表分别创建 INNODB FILE:

innodb_file_per_table=1

这样可以保证 ibdata1 文件不会过大,失去控制。尤其是在执行 mysqlcheck -o –all-databases 的时候。

  1. 保证从内存中读取数据,讲数据保存在内存中

2.1 足够大的 innodb_buffer_pool_size

推荐将数据完全保存在 innodb_buffer_pool_size ,即按存储量规划 innodb_buffer_pool_size 的容量。这样你可以完全从内存中读取数据,最大限度减少磁盘操作。

2.1.1 如何确定 innodb_buffer_pool_size 足够大,数据是从内存读取而不是硬盘?

方法 1

mysql> SHOW GLOBAL STATUS LIKE 'innodb_buffer_pool_pages_%';
+----------------------------------+--------+
| Variable_name                    | Value  |
+----------------------------------+--------+
| Innodb_buffer_pool_pages_data    | 129037 |
| Innodb_buffer_pool_pages_dirty   | 362    |
| Innodb_buffer_pool_pages_flushed | 9998   |
| Innodb_buffer_pool_pages_free    | 0      |  !!!!!!!!
| Innodb_buffer_pool_pages_misc    | 2035   |
| Innodb_buffer_pool_pages_total   | 131072 |
+----------------------------------+--------+
6 rows in set (0.00 sec)

发现 Innodb_buffer_pool_pages_free 为 0,则说明 buffer pool 已经被用光,需要增大 innodb_buffer_pool_size

INNODB 的其他几个参数

innodb_additional_mem_pool_size = 1/200 of buffer_pool
innodb_max_dirty_pages_pct 80%

方法 2
或者用 iostat -d -x -k 1 命令,查看硬盘的操作。

2.1.2 服务器上是否有足够内存用来规划

执行 echo 1 > /proc/sys/vm/drop_caches 清除操作系统的文件缓存,可以看到真正的内存使用量。

2.2 数据预热

默认情况,只有某条数据被读取一次,才会缓存在 innodb_buffer_pool。所以,数据库刚刚启动,需要进行数据预热,将磁盘上的所有数据缓存到内存中。数据预热可以提高读取速度。

对于 InnoDB 数据库,可以用以下方法,进行数据预热:

  1. 将以下脚本保存为 MakeSelectQueriesToLoad.sql

    SELECT DISTINCT

    CONCAT('SELECT ',ndxcollist,' FROM ',db,'.',tb,
    ' ORDER BY ',ndxcollist,';') SelectQueryToLoadCache
    FROM
    (
        SELECT
            engine,table_schema db,table_name tb,
            index_name,GROUP_CONCAT(column_name ORDER BY seq_in_index) ndxcollist
        FROM
        (
            SELECT
                B.engine,A.table_schema,A.table_name,
                A.index_name,A.column_name,A.seq_in_index
            FROM
                information_schema.statistics A INNER JOIN
                (
                    SELECT engine,table_schema,table_name
                    FROM information_schema.tables WHERE
                    engine='InnoDB'
                ) B USING (table_schema,table_name)
            WHERE B.table_schema NOT IN ('information_schema','mysql')
            ORDER BY table_schema,table_name,index_name,seq_in_index
        ) A
        GROUP BY table_schema,table_name,index_name
    ) AA
    

    ORDER BY db,tb
    ;

  1. 执行

    mysql -uroot -AN < /root/MakeSelectQueriesToLoad.sql > /root/SelectQueriesToLoad.sql

  2. 每次重启数据库,或者整库备份前需要预热的时候执行:

    mysql -uroot < /root/SelectQueriesToLoad.sql > /dev/null 2>&1

2.3 不要让数据存到 SWAP 中

如果是专用 MYSQL 服务器,可以禁用 SWAP,如果是共享服务器,确定 innodb_buffer_pool_size 足够大。或者使用固定的内存空间做缓存,使用 memlock 指令。

  1. 定期优化重建数据库

    mysqlcheck -o –all-databases 会让 ibdata1 不断增大,真正的优化只有重建数据表结构:

    CREATE TABLE mydb.mytablenew LIKE mydb.mytable;
    INSERT INTO mydb.mytablenew SELECT * FROM mydb.mytable;
    ALTER TABLE mydb.mytable RENAME mydb.mytablezap;
    ALTER TABLE mydb.mytablenew RENAME mydb.mytable;
    DROP TABLE mydb.mytablezap;

  1. 减少磁盘写入操作

4.1 使用足够大的写入缓存

innodb_log_file_size

但是需要注意如果用 1G 的 innodb_log_file_size ,假如服务器当机,需要 10 分钟来恢复。

推荐 innodb_log_file_size = 0.25 innodb_buffer_pool_size

4.2 innodb_flush_log_at_trx_commit

这个选项和写磁盘操作密切相关:

innodb_flush_log_at_trx_commit = 1 则每次修改写入磁盘
innodb_flush_log_at_trx_commit = 0/2 每秒写入磁盘

如果你的应用不涉及很高的安全性 (金融系统),或者基础架构足够安全,或者 事务都很小,都可以用
0 或者 2 来降低磁盘操作。

4.3 避免双写入缓冲

innodb_flush_method=O_DIRECT
  1. 提高磁盘读写速度

RAID0 尤其是在使用 EC2 这种虚拟磁盘 (EBS) 的时候,使用软 RAID0 非常重要。

  1. 充分使用索引

6.1 查看现有表结构和索引

SHOW CREATE TABLE db1.tb1\G

6.2 添加必要的索引

索引是提高查询速度的唯一方法,比如搜索引擎用的倒排索引是一样的原理。
索引的添加需要根据查询来确定,比如通过慢查询日志或者查询日志,或者通过 EXPLAIN 命令分析查询。

ADD UNIQUE INDEX
ADD INDEX

6.2.1 比如,优化用户验证表:

添加索引

ALTER TABLE users ADD UNIQUE INDEX username_ndx (username);
ALTER TABLE users ADD UNIQUE INDEX username_password_ndx (username,password);

每次重启服务器进行数据预热

echo “select username,password from users;” > /var/lib/mysql/upcache.sql

添加启动脚本到 my.cnf

[mysqld]
init-file=/var/lib/mysql/upcache.sql

6.2.2 使用自动加索引的框架或者自动拆分表结构的框架

比如,Rails 这样的框架,会自动添加索引,Drupal 这样的框架会自动拆分表结构。会在你开发的初期指明正确的方向。所以,经验不太丰富的人一开始就追求从 0 开始构建,实际是不好的做法。

  1. 分析查询日志和慢查询日志

记录所有查询,这在用 ORM 系统或者生成查询语句的系统很有用。
log=/var/log/mysql.log
注意不要在生产环境用,否则会占满你的磁盘空间。

记录执行时间超过 1 秒的查询

long_query_time=1
log-slow-queries=/var/log/mysql/log-slow-queries.log
  1. 激进的方法,使用内存磁盘

现在基础设施的可靠性已经非常高了,比如 EC2 几乎不用担心服务器硬件当机。而且内存实在是便宜,很容易买到几十G内存的服务器,可以用内存磁盘,定期备份到磁盘。

将 MYSQL 目录迁移到 4G 的内存磁盘

mkdir -p /mnt/ramdisk
sudo mount -t tmpfs -o size=4000M tmpfs /mnt/ramdisk/
mv /var/lib/mysql /mnt/ramdisk/mysql
ln -s /tmp/ramdisk/mysql /var/lib/mysql
chown mysql:mysql mysql
  1. 用 NOSQL 的方式使用 MYSQL

B-TREE 仍然是最高效的索引之一,所有 MYSQL 仍然不会过时。
用 HandlerSocket 跳过 MYSQL 的 SQL 解析层,MYSQL 就真正变成了 NOSQL。

  1. 其他

单条查询最后增加 LIMIT 1,停止全表扫描。
将非”索引”数据分离,比如将大篇文章分离存储,不影响其他自动查询。
不用 MYSQL 内置的函数,因为内置函数不会建立查询缓存。
PHP 的建立连接速度非常快,所有可以不用连接池,否则可能会造成超过连接数。当然不用连接池 PHP 程序也可能将
连接数占满比如用了 @ignore_user_abort(TRUE);
使用 IP 而不是域名做数据库路径,避免 DNS 解析问题

  1. 结束

你会发现优化后,数据库的性能提高几倍到几百倍。所以 MYSQL 基本还是可以适用大部分场景的应用的。优化现有系统的成本比系统重构或者迁移到 NOSQL 低很多。

天梯,原意是登天的阶梯,后被隐申用于积分系统或排名系统之意。比较知名的是暴雪Battle.net的排名 系统即被译为天梯系统。现在提到天梯,更多的是对显卡和处理器的性能排名,尤其以显卡天梯最为知名。天梯图是以公版显卡及默认频率的性能来排名次的,对 GPU核心或显存超频版的显卡不在此列。
bjb.jpg
很多网友看到笔记本电脑的显卡数字一头雾水,看着数字很大,却不知真正的性能基本取决于第二位数字的大小。对笔记本显卡的性能非常疑惑,特别是一些出现频率不多的显卡,往往很多人就被导购所谓的什么2G显存之类的忽悠了。这里推荐一个很好用的东西:笔记本显卡天梯图。其实太平洋电脑网很早前就有台式机的天梯图了,之 后有人就按这个做了个笔记本的。最新版笔记本显卡天梯图为:

可以很明确的看到各个显卡的性能对比,比如7470M其实是跟610M一样的初级显卡。至少拿这个出去不会被人轻易忽悠了。另外这个图的左边还可以看到某 款移动显卡性能相对应的台式机显卡。基本上笔记本里非常NB非常高端的GTX580M也就有台式机中端显卡GTX460的水平,而主流的显卡一般也就在 GT430-HD6670之间。这样一看就很容易理解一般所谓的“娱乐笔记本”很少使用1920X1080的分辨率了:一来高清屏要贵一些;再一个如果用 高清屏的话,很多本来可以跑的游戏就跑不了了。所以想玩爽游戏的有条件还是上台式机吧。另外,图中比较有价值的几点包括:G610M略好于 GT520M,IVB集成的HD4000与GT520M性能持平,GT630M略好于GT540M等。

附带一张台式机显卡天梯:
ts.jpg

打开/前往
⌘T 前往文件
⌘⌃P 前往项目
⌘R 前往 method
⌘⇧P 命令提示
⌃G 前往行
⌃ ` python 控制台
编辑
⌘L 选择行 (重复按下将下一行加入选择)
⌘D 选择词 (重复按下时多重选择相同的词进行多重编辑)
⌃⇧M 选择括号内的内容
⌘⇧↩ 在当前行前插入新行
⌘↩ 在当前行后插入新行
⌃⇧K 删除行
⌘KK 从光标处删除至行尾
⌘K⌫ 从光标处删除至行首
⌘⇧D 复制(多)行
⌘J 合并(多)行
⌘KU 改为大写
⌘KL 改为小写
⌘ / 注释
⌘⌥ / 块注释
⌘Y 恢复或重复
⌘⇧V 粘贴并自动缩进
⌃ space 自动完成(重复按下选择下一个提示)
⌃M 跳转至对应的括号
XML/HTML
⌘⇧A 选择标签内的内容
⌘⌥ . 闭合当前标签
查找/替换
⌘F 查找
⌘⌥F 替换
⌘⌥G 查找下一个符合当前所选的内容
⌘⌃G 查找所有符合当前所选的内容进行多重编辑
⌘⇧F 在所有打开的文件中进行查找
拆分窗口/标签页
⌘⌥1 单列
⌘⌥2 双列
⌘⌥5 网格 (4组)
⌃[1,2,3,4] 焦点移动至相应组
⌃⇧[1,2,3,4] 将当前文件移动至相应组
⌘[1,2,3…] 选择相应标签页
书签
⌘F2 添加/去除书签
F2 下一个书签
⇧F2 前一个书签
⌘⇧F2 清除书签
标记
⌘K space 设置标记
⌘KW 从光标位置删除至标记
⌘KA 从光标位置选择至标记
⌘KG 清除标记