En raison des limitations de MySQL, de nombreux sites adoptent l'architecture MySQL Memcached.
Certains autres sites ont abandonné MySQL et ont adopté NoSQL, comme TokyoCabinet/Tyrant et ainsi de suite.
Il est indéniable que NoSQL est beaucoup plus rapide que MySQL lors de l'exécution de certaines requêtes simples (en particulier les requêtes de clé primaire). Et la grande majorité des requêtes sur le site Web sont des requêtes simples comme celle-ci.
Mais DeNA utilise MySQL et Memcached et a créé un record de 750 000 requêtes simples par seconde sur un seul serveur ordinaire.
Peut-être que vous ne croirez pas qu'un seul MySQL peut atteindre 750 000 qps, mais c'est un fait. Parlons-en en détail ci-dessous.
Les applications de la société DeNA nécessitent souvent une requête de clé primaire (PK). Par exemple, les informations utilisateur sont récupérées en fonction de l'identifiant de l'utilisateur et le contenu du journal est récupéré en fonction de l'identifiant du journal. Memcached et NoSQL conviennent très bien à ce genre de choses.
Si memcached est testé, il est très probable que 400 000 opérations get puissent être effectuées par seconde, même si memcached et le client sont situés sur des serveurs différents.
Sur un serveur doté d'une carte réseau Nehalem 3 kiloM à 8 cœurs à 2,5 GHz, libmemcached et memcached peuvent effectuer 420 000 opérations d'obtention par seconde.
Et mysql5 ? Combien de requêtes PK peuvent être effectuées par seconde ?
innodb :
[matsunobu@host ~]$ mysqlslap --query="select user_name,.. from test.user where user_id=1" / --number-of-queries=10000000 --concurrency=30 --host=xxx -uroot -p
De plus, vous pouvez également utiliser des outils tels que sysbench ou super-smack.
Ouvrez une nouvelle coque et jetez-y un œil :
[matsunobu@host ~]$ mysqladmin extended-status -i 1 -r -uroot / | grep -e "Com_select" | Com_select | 107069 | | Com_select | 108873 | | Com_select | 108921 | | Com_select | 109511 | | Com_select | 108084 | | Com_select | 108115 |
100 000 qps représentent environ 1/4 de Memcached.
Pourquoi est-ce si lent ?
Le serveur dispose de suffisamment de mémoire et toutes ces données doivent être en mémoire.
C'est aussi une opération de mémoire, pourquoi mysql est-il tellement plus lent que memcached ?
les données vmstat sont les suivantes :
[matsunobu@host ~]$ vmstat 1 r b swpd free buff cache in cs us sy id wa st 23 0 0 963004 224216 29937708 58242 163470 59 28 12 0 0 24 0 0 963312 224216 29937708 57725 164855 59 28 13 0 0 19 0 0 963232 224216 29937708 58127 164196 60 28 12 0 0 16 0 0 963260 224216 29937708 58021 165275 60 28 12 0 0 20 0 0 963308 224216 29937708 57865 165041 60 28 12 0 0
% Le processeur occupé par l'utilisateur et %le système est assez élevé.
Regardez les informations statistiques d'oprofile :
ps : Cet outil est bon, niveau noyau.
samples % app name symbol name 259130 4.5199 mysqld MYSQLparse(void*) 196841 3.4334 mysqld my_pthread_fastmutex_lock 106439 1.8566 libc-2.5.so _int_malloc 94583 1.6498 bnx2 /bnx2 84550 1.4748 ha_innodb_plugin.so.0.0.0 ut_delay 67945 1.1851 mysqld _ZL20make_join_statistics P4JOINP10TABLE_LISTP4ItemP16st_dynamic_array 63435 1.1065 mysqld JOIN::optimize() 55825 0.9737 vmlinux wakeup_stack_begin 55054 0.9603 mysqld MYSQLlex(void*, void*) 50833 0.8867 libpthread-2.5.so pthread_mutex_trylock 49602 0.8652 ha_innodb_plugin.so.0.0.0 row_search_for_mysql 47518 0.8288 libc-2.5.so memcpy 46957 0.8190 vmlinux .text.elf_core_dump 46499 0.8111 libc-2.5.so malloc
MYSQLparse est en version 5.x, et YYparse en 4.x
MYSQLparse() et MYSQLlex() sont appelés lorsque mysql analyse les instructions SQL.
make_join_statistics() et JOIN::optimize() sont appelés pendant la phase d'optimisation des requêtes.
C'est précisément à cause de l'utilisation d'instructions SQL qu'il existe ces charges supplémentaires.
Les conclusions suivantes peuvent être tirées de la sortie d'oprofile :
La couche SQL affecte sérieusement les performances des requêtes MySQL.
Par rapport à Memcached et SQL, MySQL doit effectuer un travail supplémentaire :
* Analyse des instructions SQL Analyse des instructions SQL
* Ouverture, verrouillage des tables Ouverture et verrouillage des tables
* Faire des plans d'exécution SQL ???
* Déverrouiller, fermer des tables Déverrouiller et fermer des tables
Remarque de Hua Rong : utilisez l'API d'instructions préparées dans mysqli pour éviter d'analyser les instructions SQL.
Mysql doit également effectuer de nombreux contrôles de concurrence. Par exemple, lors de l'envoi/réception de paquets de données réseau, fcntl() sera appelé de très nombreuses fois.
Mutex globaux : LOCK_open LOCK_thread_count est également appelé fréquemment.
Donc, dans la sortie d'oprofile, le deuxième est my_pthread_fastmutex_lock(). Et le CPU occupé par %system est assez élevé (28%).
En fait, l'équipe de développement MySQL et certains groupes de développement périphériques comprennent l'impact d'un grand nombre de contrôles de concurrence sur les performances
Ils ont résolu certains problèmes dans MySQL 5.5. Dans le futur MySQL, %system occupera de moins en moins de CPU.
Mais que faire des 60 % de processeur occupés par %user ?
Mutex contentions result in %system increase, not %user increase
Même si tous les problèmes de concurrence sont résolus, on estime qu'il sera difficile d'atteindre 300 000 qps.
Peut-être avez-vous entendu dire que les performances de l'instruction HANDLER sont également bonnes.
Mais l'instruction HANDLER nécessite une analyse des requêtes et une table d'ouverture/fermeture.
Cela ne sera pas d’une grande aide.
Si seulement une petite partie des données peut entrer la mémoire, puis l'instruction SQL. La charge supplémentaire d'analyse n'est rien.
Parce que les opérations d'E/S disque prendront plus de temps.
Dans notre serveur MySQL, la mémoire est énorme et presque toutes les données peuvent être mises en mémoire.
La couche SQL devient une charge supplémentaire et consomme beaucoup de ressources CPU.
在线上的应用中,我们要进行大量的PK查询。即使70-80%的查询都是在同一张表上进行的, mysql还是每次都要parse/open/lock/unlock/close,看起来就感觉效率低下。
We needed to execute lots of primary key lookups(i.e. SELECT x FROM t WHERE id=?) or limited range scans. Even though 70-80% of queries were simple PK lookups from the same table (difference was just values in WHERE), every time MySQL had to parse/open/lock/unlock/close, which seemed not efficient for us.
花荣注:难道说mysql中的table_open_cache不是用来减少table open的次数的么。。
如果你使用mysql cluster, NDBAPI会是最佳解决方案。
It’s recommended using NDBAPI for frequent access patterns, and using SQL + MySQL + NDB for ad-hoc or infrequent query patterns.
1 faster access API.
2 sql语句仍然要可用,以处理一些特定的或者复杂的查询。
最好的办法是在mysql内部实现一个NoSQL的网络服务。daemon plugin。
它监听在某个端口,接受NoSQL 协议/API的数据包,使用Mysql internal storage engine API直接在innodb数据表上进行操作,并且返回相应的数据。
关于mysql internal storage engine API可以看这个文档:
这个概念首先被Cybozu Labs 的Kazuho Oku 提出,然后他写了一个MyCached UDF,用的是memcached的协议。
随后,Akira Higuchi 写了另外一个plugin: HandlerSocket。
从图中可以看到,客户端既可以使用普通的mysql api来操作mysql(3306端口),
也可以使用HandlerSocket API对数据库进行PK查询,以及INSERT/UPDATE/DELETE操作(9998与9999端口)。
在使用HandlerSocket操作的时候,省去了SQL parsing, Opening table, Making Query Plans, Closing table等步骤。
在HandlerSocket操作innodb数据表的时候,显然也需要open/close table。
由于open/close table非常耗时,并且会带来严重的mutex竞争,所以这种改进,极大地提升了性能。
Of course HandlerSocket closes tables when traffics become small etc so that it won’t block administrative commands (DDL) forever.
memcached主要用来缓存数据集(database records)。
CREATE TABLE user ( user_id INT UNSIGNED PRIMARY KEY, user_name VARCHAR(50), user_email VARCHAR(255), created DATETIME ) ENGINE=InnoDB;
mysql> SELECT user_name, user_email, created FROM user WHERE user_id=101; +---------------+-----------------------+---------------------+ | user_name | user_email | created | +---------------+-----------------------+---------------------+ | Yukari Takeba | yukari.takeba@dena.jp | 2010-02-03 11:22:33 | +---------------+-----------------------+---------------------+
1 下载
2 编译 HandlerSocket客户端和服务器端程序:
./configure --with-mysql-source=... --with-mysql-bindir=... ; make; make install
3 安装插件
mysql> INSTALL PLUGIN 'HandlerSocket' SONAME 'HandlerSocket.so';
目前HandlerSocket客户端只有C++ 和 Perl的库。还没有php和C的。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 Copier après la connexion | #!/usr/bin/perl use strict; use warnings; use Net::HandlerSocket; #1. establishing a connection my $args = { host => 'ip_to_remote_host', port => 9998 }; my $hs = new Net::HandlerSocket($args); #2. initializing an index so that we can use in main logics. # MySQL tables will be opened here (if not opened) my $res = $hs->open_index(0, 'test', 'user', 'PRIMARY', 'user_name,user_email,created'); die $hs->get_error() if $res != 0; #3. main logic #fetching rows by id #execute_single (index id, cond, cond value, max rows, offset) $res = $hs->execute_single(0, '=', [ '101' ], 1, 0); die $hs->get_error() if $res->[0] != 0; shift(@$res); for (my $row = 0; $row < 1; ++$row) { my $user_name= $res->[$row + 0]; my $user_email= $res->[$row + 1]; my $created= $res->[$row + 2]; print "$user_name/t$user_email/t$created/n"; } #4. closing the connection $hs->close(); Copier après la connexion |
这段脚本从user表中取出来了 user_name, user_email 和created字段。
[matsunobu@host ~]$ perl sample.pl Yukari Takeba yukari.takeba@dena.jp 2010-02-03 11:22:33
对于HandlerSocket,推荐使用persistent connection。以减少数据库连接的次数。
HandlerSocket协议 is a small-sized text based protocol。
[matsunobu@host ~]$ telnet 9998 Trying Connected to xxx.dena.jp ( character is '^]'. P 0 test user PRIMARY user_name,user_email,created 0 1 0 = 1 101 0 3 Yukari Takeba yukari.takeba@dena.jp 2010-02-03 11:22:33
CPU: Nehalem 8 cores, E5540 @ 2.53GHz RAM: 32GB (all data fit in the buffer pool) MySQL Version: 5.1.50 with InnoDB Plugin memcached/libmemcached version: 1.4.5(memcached), 0.44(libmemcached) Network: Broadcom NetXtreme II BCM5709 1000Base-T x 3
SELECT user_name, user_email, created FROM user WHERE userid=?
approx qps server CPU util MySQL via SQL 105,000 %us 60% %sy 28% memcached 420,000 %us 8% %sy 88% HandlerSocket 750,000 %us 45% %sy 53%
samples % app name symbol name 984785 5.9118 bnx2 /bnx2 847486 5.0876 ha_innodb_plugin.so.0.0.0 ut_delay 545303 3.2735 ha_innodb_plugin.so.0.0.0 btr_search_guess_on_hash 317570 1.9064 ha_innodb_plugin.so.0.0.0 row_search_for_mysql 298271 1.7906 vmlinux tcp_ack 291739 1.7513 libc-2.5.so vfprintf 264704 1.5891 vmlinux .text.super_90_sync 248546 1.4921 vmlinux blk_recount_segments 244474 1.4676 libc-2.5.so _int_malloc 226738 1.3611 ha_innodb_plugin.so.0.0.0 _ZL14build_template P19row_prebuilt_structP3THDP8st_tablej 206057 1.2370 HandlerSocket.so dena::hstcpsvr_worker::run_one_ep() 183330 1.1006 ha_innodb_plugin.so.0.0.0 mutex_spin_wait 175738 1.0550 HandlerSocket.so dena::dbcontext::cmd_find_internal(dena::dbcallback_i&, dena::prep_stmt const&, ha_rkey_function, dena::cmd_exec_args const&) 169967 1.0203 ha_innodb_plugin.so.0.0.0 buf_page_get_known_nowait 165337 0.9925 libc-2.5.so memcpy 149611 0.8981 ha_innodb_plugin.so.0.0.0 row_sel_store_mysql_rec 148967 0.8943 vmlinux generic_make_request
$ mysqladmin extended-status -uroot -i 1 -r -p| grep “InnoDB_rows_read” …| Innodb_rows_read | 750192 | | Innodb_rows_read | 751510 | | Innodb_rows_read | 757558 | | Innodb_rows_read | 747060 | | Innodb_rows_read | 748474 | | Innodb_rows_read | 759344 | | Innodb_rows_read | 753081 | | Innodb_rows_read | 754375 |
unique key也可以。
limit 语句也可以。
IN 也没问题。
不使用索引的操作不被支持。 Operations that do not use any index are not supported。
HandlerSocket employs epoll() and worker-thread/thread-pooling architecture,the number of MySQL internal threads is limited 。
所以放心地使用persistent connection吧。不会导致mysql connection太高的。
Not only HandlerSocket eliminates SQL related function calls, but also it optimizes around network/concurrency issues
不会导致mysql connection太高。
*** Can reduce the number of fsync() calls
*** Can reduce replication delay
我们使用memcached的时候,数据会同时缓存到innodb的buffer pool与memcached中。
HandlerSocket自身没有缓存,它完全听从InnoDB storage engine。
innodb-flush-log-at-trx-commit=1 加上这句就更保险了。
HandlerSocket作为插件运行于mysql内部,所以mysql的操作,比如SQL, 热备份,主从,Nagios监视等等,都是支持的。
通过 show global status, show engine innodb status , show processlist 这些都可以看到HandlerSocket的状态。
不过目前只在mysql5.1 5.5 InnoDB的环境下进行过测试和应用。
We use HandlerSocket on servers that almost all data fit in memory.
The results are great!
We’ve been very satisfied with the results。 Since HandlerSocket plugin is Open Source, feel free to try. We’d be appreciated if you give us any feedback.
