ようやくキリのいいところで落ち着けそうなので、
文字コード判別改善のお試しバイナリをお披露目します。
http://sakura.qp.land.to/?Junk%2F26以下は関連する記事です。
#1. >>data:5853 「文字コード誤認識します」by すすさん
#2. >>data:6053 「文字コードの読み取りミス?by はこねさん
#3. >>dev:4553 「デフォルト文字コード設定」by fumさん
#4. >>dev:5074 「UTF-8 が SJIS に?」by らぐなさん
#1.の問題は、EUCJP 派と SJIS 派で好みを選択できるように
タイプ別設定に優先したい文字を、
SJIS, JIS, EUC, UTF-8, UTF-7 の5つの中から設定できるように
しました。(thanks to fumさん)
(UTF-16 系は絶対的な目印として BOM があるので、Unicode,
UnicodeBE をリストから外しました。)
#4.の問題は確認してないんですけれど、実のところ・・・、
UTF-8 の文字検査をするビット演算が非常に怪しいのです。
わかり易く書き直したので変化があるかな・・・
というくらいです。
fumさんのパッチにあった究極的なオプションとして(笑い)、
自動判別機能を切り離す設定も漏らさずついてます。
(ただし Unicode, UnicodeBE, UTF-8 の BOM 検出機能は
オフに出来ません。)自動判別しないで UTF-7 を優先したい
などの場合はお気をつけ下さい (^^;)
以上です。