文字コード

文字や記号をコンピュータで扱うために、文字や記号一つ一つに割り当てられた固有の数字のことです。

欧米などで使われる英数字の文字コードは1バイトで表現されるが、これでは256文字しか表現できず、日本語の漢字などは収録できないため、日本や韓国、中国などではそれぞれ独自に2バイト(最大65536文字)のコード体系を定め、それぞれ自国内で使用しています。

1バイトの文字コードとしてはASCIIが世界標準となっているが、一部の大型コンピュータではIBM社のEBCDICを使うものもあります。 日本語の文字コードは、JIS(日本工業規格)で標準化されたJISコードの他、主にUNIXなどで使われるEUC、WindowsやMac OSなどで使われるシフトJISの3種類が利用されています。

最近では、世界のほとんどの主要な言語をサポートした2バイトの統一文字コード体系であるUnicodeの規格化が進み、一部で利用が始まっています。

コメントする
このブログ記事について

このページは、tdirが2008年8月28日 15:29に書いたブログ記事です。

ひとつ前のブログ記事は「テキストエディタ」です。

次のブログ記事は「OS」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。

ウェブページ