SEO用語集
2バイト文字
【英語表記】 2-byte character
2バイト文字とは、2バイトのデータで表現出来る文字。
文字コードによって異なるが、伝統的にはひらがなや全角カタカナ、漢字、全角記号などのことを指す。
これに対して半角のアルファベットや数字、カタカナなどを1バイト文字という。
1バイト(8ビット)で表現できるのは256通りだが、2バイトだと6万5536通りにもなる。
アルファベットのように文字の種類が少ない場合は、1バイトの文字コードで十分なのだが、漢字は使用頻度の最も多いJIS第1水準で約3000字、続くJIS第2水準で約3400字あるなど極めて文字数が多い。
このため、2バイトで表現する文字コードが用意された。
現在、主に使われている2バイト文字コードは国ごとに別々に定めてあり、例えばシフトJISコードのテキストは標準的な中国語環境では正しく表示できない。そのため、世界各国の文字体系に対応できる統一的な文字コードとしてUnicode(ユニコード)が開発された。
さらに、このUnicode(ユニコード)では従来の1バイト文字も2バイトで表現でき、また3バイト以上で1文字を構成するコード体系も存在する。
そのため、ASCIIの範囲に収まらない文字の総称として「多バイト文字」(multibyte characters)という用語も使われる。






