◀一般トップへ
  • 5317 文字認識テスト版
    • 5319 Re:文字認識テスト版
      • 5320 Re2:文字認識テスト版
        • 5322 Re3:文字認識テスト版
    • 5321 Re:文字認識テスト版
  • [5317] 文字認識テスト版 げんた 2006年07月01日 13:59

    ラスティブさんが作成された文字コードの自動認識方式の変更を入れてテスト版バイナリを作成しました.
    最新リリース版1.5.10.1とは互換性がありますので同時起動が可能です.

    http://members.at.infoseek.co.jp/sakura_editor/snapshot/sakura_2006-07-01_charcodetest.zip

    ソースはsakura/trunk#982+ラスティブさん作パッチ Patches #1513775 です.バージョン番号は末尾を333としてあります.
    認識状況を見るために,ファイル(F)→ファイルのプロパティ(T)にて認識状況の詳細が出るようにしてあります.

    オリジナル版では誤認識した物が直った,あるいはその逆というものがありましたら情報をお寄せください.
    • [5319] Re:文字認識テスト版 ryoji 2006年07月01日 15:07

      UTF-8漢字の認識がきちんとできるようになっているようですね。
      真魚の作者さんの日記ページにある誤認識文字パターン
      http://wantech.ikuto.com/diary/02soft/2006/06_0405_1024.htm
      も従来版はNGでしたがOKになってます。

      一方、漢字がひらがな・カタカナと同格になったためでしょうが、
      (判定における「ひらカタ」の優先度が相対的に下がっていて)
      半角カナのみのEUCファイルはS-JISと認識されます。
      まぁ、これはS-JIS漢字と完全にかぶっている箇所なので
      しかたない話と思いますが。

      あと、これは Patches にコメントしたほうがいいかもしれないことですが、
      ソースコードの記述は入念にされている印象を受けました。
      コメントがきちんと書かれているのがいいですね。
      コメント中の参考URLから出典等も辿れますし、
      大筋は結構なモノのように思いました。
      私は文字コード関連には疎いので、レビューするよりむしろ勉強させて
      いただくのに良いなぁ、なんて思ったりして... (^^;
      • [5320] Re2:文字認識テスト版 ryoji 2006年07月01日 15:21

        あ、あとBOM無しUTF-32も自動認識してくれるようになってますね。
        • [5322] Re3:文字認識テスト版 ryoji 2006年07月01日 17:33

          > あ、あとBOM無しUTF-32も自動認識してくれるようになってますね。
          すんません。UTF-16の誤記です。(^^ゞ
    • [5321] Re:文字認識テスト版 トーリス・ガリー 2006年07月01日 16:31

      ▼ げんたさん
      > オリジナル版では誤認識した物が直った,あるいはその逆というものがありましたら情報をお寄せください.

      早速使ってみました。
      SJISとUTF-8しか試していませんが、とてもいい感じです!
      UTF-8のファイルでダイアログ出ずに非常に快適です。
      ありがとう、ラスティブさん!げんたさん!