文字コード:コンピュータが文字を読むルール

文字コードとは?

コンピュータは数字しか扱えません。そのため「この数字は『あ』という文字にする」という対応表が必要です。このルールのことを文字コードと呼びます。送り手と受け手でルールが違うと、有名な「文字化け」が発生します。

例:縺ゅ>縺∴縺 (あいうえお)

現代の鉄則 Web制作では「UTF-8」一択です!

世界中の文字を一つのルールで扱えるため、現在のインターネットの標準となっています。新規作成するファイルは、必ず UTF-8 (BOMなし) で保存しましょう。

主要な文字コードの種類

名前特徴・使いどころ
UTF-8 世界標準。日本語、英語、絵文字もこれ一つでOK。Web制作はこれ以外使いません。
Shift_JIS 昔のWindows標準。古いWebサイトや、ExcelでCSVファイルを扱う際によく使われます。
EUC-JP 昔のUnix/Linuxサーバーで主流だった形式。現在はほとんど見かけません。

なぜ「UTF-8」なのか?

HTMLでの宣言

ファイル自体をUTF-8で保存するだけでなく、ブラウザに「このファイルはUTF-8ですよ」と教えてあげる必要があります。

<meta charset="UTF-8">

※これをHTMLの <head> 内に書くことで、ブラウザが迷わずに文字を表示できます。