HTMLは使用する文字コードを指定する必要があります。(厳密には指定しなくても大丈夫ですが、文字化けを防ぐためにも通常は文字コードを指定します。
正確には「文字コード」ではなく「エンコード(符号化)方式」ですが、当ページは一般的に言われている「文字コード」としています。
日本語で利用される代表的な文字コードは以下となります。
charset | HTMLの使用 |
---|---|
UTF-8 | 現在、主流の文字コード(エンコード)で、多くのサイトでUTF-8が使用されている。 HTML5の規格ではUTF-8が推奨されています。 |
Shift_JIS | もともとWindows環境がShift-JISベースであったため、サイト作成時もShift-JISが使用されてきた。 |
EUC-JP | UNIX(Linux)用に開発された日本語エンコードであったが、現在はUTF-8に置き換わってきている。 |
charasetはIANAで定義されており250程度の種類があります。 参考:charaset一覧 |
charsetに指定する文字コードは大文字でも小文字でも区別されません。
「UTF-8」と「utf-8」は同じとなります。
HTML全体の文字コードは<meta>タグで指定します。
<meta>で文字コードを指定することは必須ではありませんが、文字化けを防ぐために通常は指定します。
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
または
<meta charset="UTF-8">
外部JavaScriptがHTMの文字コードと異なる場合は<script>タグで指定します。
<script src="sample.js" charset="UTF-8"></script>
または
<script src="sample.js" type="text/javascript" charset="UTF-8"></script>
外部JavaScriptがHTMLと同じ文字コードの場合は指定する必要がありません。
また、HTML内部の<script>タグには「charset」を指定することは出来ません。