HTMLページが文字化けしていて読めないことがある。ここでは文字化けが起きる原因と解消方法について記述する。
HTMLが文字化けする理由
パソコンではデータを数値的に取り扱う必要があり、パソコンが文字を読み込むために使うのが、「文字コード」であり、ASCIIなどが挙げられる。また、日本語はひらがな、カタカナ、漢字があり文字数が多いために日本語に対応した文字コード(Shift_JISやEUC-JPなど)がある。最近は英語やドイツ語、フランス語や中国語など様々な言語に対応し、またASCIIコードとの互換性が高い文字コードである「UTF-8(Unicode Transformation Format-8)」が主流になってきている。
HTMLの文字化けが起きる原因は、文字コードにある。文字コードには、様々な種類があるが実際にHTMLで用いられている文字コードと、表示するブラウザが解釈する文字コードが違っている時に、文字化けが発生する。例えば、文字コードShift_JISで保存されたHTMLファイルを、ブラウザがUTF-8であると勘違いして表示してしまうと文字化けが発生する。特にHTMLファイルの作成者が正しく文字コードを指定しない場合に現象が発生する。
文字化けを解消する方法
Internet Explorer やFirefoxの場合、Altキーを押して表示される「表示」からテキストエンコーディングを選択し、適切な文字コードを指定すれば文字化けしたHTMLを読むことが可能になる。例えば、デフォルトでUnicodeに設定されているブラウザで、文字コードShift-JISで記述されたHTMLファイルを閲覧しようとした場合には、文字化けすることがあるため、上記のテキストエンコーディングから設定する必要が生じる。(最近に作成されたHTMLではUTF-8などが主流のため文字化けして読めないケースは少なくなっているが、以前に作成されたHTMLを閲覧しようとするとしばしば文字化けが発生する。