MySQL utf8mb4 utf8 文字セット 違い

今回新規に契約したさくらのレンタルサーバーにてデータベースを作成しようとしたところ、
「utf8mb4」という文字があったので何だこりゃ?と思って調べてみました。

UTF8で4バイト文字を扱う事が出来るものらしいです。絵文字や中国漢字、日本語でも特殊漢字などは4バイトが含まれています。
utf8mb4文字セットは、言語文字だけでなくシンボル、新しく導入されたemojisなどを格納する。。。
ということなのだけれど、
そもそも
MySQLの文字コードセット「utf8」は3バイトまでのサポート
MySQLバージョン5.5以降からサポートしている文字コードセット「utf8mb4」は4バイトをサポート

みたいです。
なるほどなるほど、今から何か新しいシステムを作るのであれば何も考えずにutf8mb4を選んでおいても良さそうですね。
過去の産物を新サーバーに・・・みたいなことをやる時にutf8mb4を選ぶと苦労しそう。
utf8mb4を選ぶと、というよりもMySQLのバージョンの問題か。使えない構文なんかが出てきてエラーとか見てますからね~。

MySQL

Posted by bistro