文字コードセットのエンコードについて
■SJIS/JIS/EUC
・制限
JIS X 0213及びJIS X 0212(SJISで表現できない)には対応していません。
・保存に関して
IBM選定IBM拡張文字はNEC選定IBM拡張文字に変更されてからSJIS→JIS/EUCに変換されます。
JISで保存する場合のエスケープシーケンスは次の通りです。
ローマ字 ESC ( B
半角カタカナ ESC ( I
漢字・全角文字 ESC $ B
注意
JISの半角カタカナは規格違反です。使用しないでください
■UTF-16/UTF-16BE/UTF-8/UTF-7/CESU-8
・制限
(sakura:1.6.6.0以前)
サクラエディタの内部コードがSJISのため、SJISに含まれない文字は変になります。
サロゲートペア(UTF-16)には未対応です。
(sakura:2.0.0.0以降)
サクラエディタの内部コードがUnicodeのため、Unicodeに含まれない文字は変になります。
サロゲートペア(UTF-16)に対応しています。
■UTF-8
・制限
3バイトコードまでしか対応していません。
■自動選択
1. BOMをチェックします。UTF-8,16LE,16BE,7のBOMがあった場合、そのBOMのコードに決定します。
2. 先頭付近にmeta文字列がないかチェックします。(sakura:2.2.0.0以降)
2-1. XML宣言の「<?xml encoding="utf-8"」のような文字列
2-2. HTML4.01の「<meta http-equiv="Content-Type" content="text/html; charset=UTF-8>」のような文字列
2-3. HTML5の<meta charset="utf-8">のような文字列
2-4. 「# coding: utf-8」「「# coding=utf-8」」のようなエディタ用エンコーディング指定
をそれぞれ検出すると、そのコードに決定します。対応しているエンコード名にはコードページも含みます。
3. UTF-16のCRLF検出器でUTF-16/UTF-16BEを判定します。
4. Shift_JIS/EUC/JIS/UTF-8/UTF-7での固有文字情報(ASCII以外の文字の検出)を元に決定します。
5. すべてASCIIなどの文字または空のファイルの場合は、タイプ別設定のデフォルト文字コードを利用します。