[5317] 文字認識テスト版げんた 2006年07月01日 13:59

ラスティブさんが作成された文字コードの自動認識方式の変更を入れてテスト版バイナリを作成しました．
最新リリース版1.5.10.1とは互換性がありますので同時起動が可能です．

http://members.at.infoseek.co.jp/sakura_editor/snapshot/sakura_2006-07-01_charcodetest.zip

ソースはsakura/trunk#982＋ラスティブさん作パッチ Patches #1513775 です．バージョン番号は末尾を333としてあります．
認識状況を見るために，ファイル(F)→ファイルのプロパティ(T)にて認識状況の詳細が出るようにしてあります．

オリジナル版では誤認識した物が直った，あるいはその逆というものがありましたら情報をお寄せください．

[5319] Re:文字認識テスト版 ryoji 2006年07月01日 15:07

UTF-8漢字の認識がきちんとできるようになっているようですね。
真魚の作者さんの日記ページにある誤認識文字パターン
http://wantech.ikuto.com/diary/02soft/2006/06_0405_1024.htm
も従来版はNGでしたがOKになってます。

一方、漢字がひらがな・カタカナと同格になったためでしょうが、
（判定における「ひらカタ」の優先度が相対的に下がっていて）
半角カナのみのEUCファイルはS-JISと認識されます。
まぁ、これはS-JIS漢字と完全にかぶっている箇所なので
しかたない話と思いますが。

あと、これは Patches にコメントしたほうがいいかもしれないことですが、
ソースコードの記述は入念にされている印象を受けました。
コメントがきちんと書かれているのがいいですね。
コメント中の参考URLから出典等も辿れますし、
大筋は結構なモノのように思いました。
私は文字コード関連には疎いので、レビューするよりむしろ勉強させて
いただくのに良いなぁ、なんて思ったりして... (^^;
- [5320] Re2:文字認識テスト版 ryoji 2006年07月01日 15:21
  
  あ、あとBOM無しUTF-32も自動認識してくれるようになってますね。
  - [5322] Re3:文字認識テスト版 ryoji 2006年07月01日 17:33
    
    > あ、あとBOM無しUTF-32も自動認識してくれるようになってますね。
    すんません。UTF-16の誤記です。(^^ゞ
[5321] Re:文字認識テスト版トーリス・ガリー 2006年07月01日 16:31

▼ げんたさん
> オリジナル版では誤認識した物が直った，あるいはその逆というものがありましたら情報をお寄せください．

早速使ってみました。
SJISとUTF-8しか試していませんが、とてもいい感じです！
UTF-8のファイルでダイアログ出ずに非常に快適です。
ありがとう、ラスティブさん！げんたさん！

[5317] 文字認識テスト版 げんた 2006年07月01日 13:59

[5319] Re:文字認識テスト版 ryoji 2006年07月01日 15:07

[5320] Re2:文字認識テスト版 ryoji 2006年07月01日 15:21

[5322] Re3:文字認識テスト版 ryoji 2006年07月01日 17:33

[5321] Re:文字認識テスト版 トーリス・ガリー 2006年07月01日 16:31

[5317] 文字認識テスト版げんた 2006年07月01日 13:59

[5321] Re:文字認識テスト版トーリス・ガリー 2006年07月01日 16:31