使用する文字を指定する文字コード



文字コードとは


「文字コード」とは、コンピューターの信号を文字に変換するためのリストのこと言います。
コンピューターが扱うのは、数字の「0」と「1」の2つの信号を、何個も並べて信号として伝達します。
その信号の列を照合して、「ひらがな」「漢字」「アルファベット」「数字」に変換しています。
信号と字の照合に使われるのが、「文字コード」です。

文字コードには、いくつかの種類が存在します。
なので、文字コードを明記していないと、正しく文字へ変換できなくなります。
たまに見る文字化けと言うのは、送った側の文字コードと、受け取った側の文字コードが異なっているために起こる現象です。
信号を正しく受け取っても、文字コードを間違えるだけで、全く意味が分からない文字が表示されてしまいます。




文字コードの一覧

文字コード解説
UTF-8 UTF-8(ユーティーエフはち、ユーティーエフエイト)はISO/IEC 10646(UCS)とUnicodeで使える8ビット符号単位の文字符号化形式及び文字符号化スキーム。
正式名称
「ISO/IEC 10646」=「UCS Transformation Format 8」
「Unicode」=「Unicode Transformation Format-8」
両者はISO/IEC 10646とUnicodeのコード重複範囲で互換性があり。
RFCにも仕様がある。
「データ交換方式」「ファイル形式」では、一般的にUTF-8が使われる傾向。
Linuxでは、OSの標準文字エンコードとして使用されてもいる。
UTF-16
UTF-32
ISO-2022-JP ISO-2022-JPは、インターネット上(特に電子メール)などで使われる日本の文字用の文字符号化方式。
「JISコード」とも呼ばれる。
EUC-JP EUC-JP(Extended UNIX Code Packed Format for Japanese、日本語EUC)は、UNIX上で日本語の文字を扱う場合にもっとも多く利用されている文字コード(符号化方式)のひとつ。
UNIX以外のOS上で使われることもある。