> 区 点 JIS SJIS EUC UTF-8 UTF-16 字
> 02 69 2265 81E3 A2E5 E2889A 221A √
> 13 85 2D75 8795 ADF5 ------ ------ √
> (参照先:
http://ash.jp/code/unitbl21.htm)SJIS 8795 には対応する UTF-16 文字がありませんね。
81E3 と同じ 221A に変換して内部保持するようにすれば、
表示は化けないと思いますが、上書き保存すると
元の 8795 ではなく81E3 になってしまうと思います。
メモ帳や他の内部UNICODEエディタの多くはそうなる
みたいです。
サクラでは上書き保存しても中身が変わらないように
していて、その代償として表示のほうを諦めているの
ではないかと思います。
ANSI版でも似たような話('~'記号など)は昔からあって、
表示を諦めてでも中身を壊さないで欲しいという要望
のほうがいつも優先されているような気がします。
http://sakura.qp.land.to/?FAQ%2F24> 1) v1.6.5 で、 SJISコード8795の記号√を書いた
> テキストファイルを作成する。
僕の環境では v1.6.5 でもそのようなファイルを作成
することができません。
IME パッドから 8795 を指定しても 81E3 が入ります。
ATOK 文字パレットからの 8795 指定でも 81E3 が入ります。
(もちろんバイナリエディタなら 8795 入力できますけど)
8795 に関しては普通には入力できない気がするので
問題ないのでわ?
他にどんな文字が表示できないか知りませんが、それも
いわゆる機種依存文字(使用は非推奨)に含まれる文字
のうち、ごく一部の文字ではないかと。
> unicode版とはいえ、「SJISで開く」というモード
> があるのになんで文字化けするの?という気がしますが、
ANSI版とはいえ、「Unicodeで開く」というモード
があるのにSJIS範囲外文字が文字化けするのと同じ
だと思いますけど。
> このとき、実際にどの文字が文字化けする可能性があるか
> を知る手段はないでしょうか?
今のところその手段はなさそうな気がしますね。