◀ANSI版開発トップへ
  • 4646 文字コード判別処理改善(再び)
    • 4648 Re:文字コード判別処理改善(再び)
      • 4650 Re2:文字コード判別処理改善(再び)
        • 4652 Re3:文字コード判別処理改善(再び)
    • 4649 RE: 文字コード判別処理改善(再び)
      • 4653 Re2: 文字コード判別処理改善(再び)
  • [4646] 文字コード判別処理改善(再び) ラスティブ 2006年12月17日 15:35

    暫定的なんですが文字コード判別処理の件,
    以下のページにアップロードしました.
    こちらの手違いでタグ名…,みたいなの(←よく知らない;;)を
    重複させてしまいましたので,
    「akura_2006-11-10_charcode の改良版の」という
    フレーズで,あいまいさを回避しております(汗)

    http://sakura.qp.land.to/?Junk%2F1

    >>data:5690 にあります,
    以前より悪化するケースがあるかどうかについては,
    出来るだけマルチバイト系文字コードを優先させて
    みましたので,比較的“無い”に近い状態だと思います.
    ただ,マルチバイト系文字コードの判定処理をポイント制に
    しまして,それが実用に絶えうるかどうかがわかりません.
    が,お試しください...
    • [4648] Re:文字コード判別処理改善(再び) ラスティブ 2006年12月17日 19:14

      すみません,デフォルト文字コードを
      CODE_JIS としてた箇所がありましたので,
      早速アップロードしなおしました m(..)m

      http://sakura.qp.land.to/?Junk%2F1
      • [4650] Re2:文字コード判別処理改善(再び) げんた 2006年12月20日 23:36

        >すみません,デフォルト文字コードを
        >CODE_JIS としてた箇所がありましたので,
        >早速アップロードしなおしました m(..)m
        >http://sakura.qp.land.to/?Junk%2F1
        こちらに入っているパッチは,前回のパッチ+これでという理解でよろしいでしょうか.
        そのようにしてコンパイルしたらCProperty.cppが抜けているようでコンパイルエラーになってしまったのですけど.
        • [4652] Re3:文字コード判別処理改善(再び) ラスティブ 2006年12月21日 18:40

          SourceForge.net パッチ#1513775 のほうに,
          パッチファイル(rev1035)をアップしました.

          ▼ げんたさん
          > >http://sakura.qp.land.to/?Junk%2F1
          > こちらに入っているパッチは,
          > 前回のパッチ+これでという理解でよろしいでしょうか.

          そこまで考慮に入れていなかったもので…,
          確認が取れません.添付されてるソースは,
          判別のやり方の変更内容の詳細資料として
          見ていただければ幸いです A^^;
    • [4649] RE: 文字コード判別処理改善(再び) げんた 2006年12月20日 23:33

      >出来るだけマルチバイト系文字コードを優先させて
      >みましたので,比較的“無い”に近い状態だと思います.
      >ただ,マルチバイト系文字コードの判定処理をポイント制に
      >しまして,それが実用に絶えうるかどうかがわかりません.
      >が,お試しください...
      ちょっとしか試していませんが,Unicodeに限ってはアクセントの混ざった欧文ファイルUnicodeへの誤認識は出なくなりました.
      それでいて,WordやExcelのファイルはUnicodeと認識してくれます.

      コードをまだきちんと読んでないのですが,マルチバイトの方をポイント制に変えたというのはどういうことでしょうか.
      加点方式というのとはまた異なるんでしょうか.

      いや,マルチバイトの判定方式も変わっているとするとUTF-8の文書とか再度評価しないとGoとは言えないのかなと思いまして.
      • [4653] Re2: 文字コード判別処理改善(再び) ラスティブ 2006年12月21日 18:52

        ▼ げんたさん
        > マルチバイトの方をポイント制に変えたというのは
        > どういうことでしょうか.
        > 加点方式というのとはまた異なるんでしょうか.

        特有バイト数(加点ポイント)から
        不正バイト数(減点ポイント)を引いた値によって
        評価する,てことなので,
        以前とあまり変わらないとは思うのですけれど,
        再評価する羽目になると思います;;