◀一般トップへ
  • 6476 貼り付けでの文字化け
    • 6477 RE: 貼り付けでの文字化け
      • 6480 Re2: 貼り付けでの文字化け
    • 6478 Re:貼り付けでの文字化け
  • [6476] 貼り付けでの文字化け nanon 2007年11月22日 00:43

    ブラウザ(Firefox,IEとも)でUTF-8のページを表示し,
    ページ中の文字をコピー,貼り付けすると文字化けします.

    元の文字列
    *--title <title>

    sakura貼り付け後に表示される文字列(そのままコピペしてあります)
    *""title <title>

    元のページ
    http://www.bunkus.org/videotools/mkvtoolnix/doc/mkvmerge.html

    修正,よろしくお願いします.
    • [6477] RE: 貼り付けでの文字化け maru 2007年11月22日 01:35


      >元のページ
      >http://www.bunkus.org/videotools/mkvtoolnix/doc/mkvmerge.html
      >*""title <title>

      元ページを見に行きましたが、これはUnicodeにしかない文字で、U+2212のようです。
      ANSIのハイフンマイナスと似ていますが異なる文字です。

      現行のサクラエディタは内部的にSJISで動作するため、この貼り付け結果は仕様としか言いようがないです。
      こういうケースでの対応は仕様として2通り考えられ、似た文字に変換するか、文字化けを無視して元データを維持するかのどちらかです。
      サクラエディタは、後者「元データを維持」の支持派が多いため、現在のような動作になっています。

      いずれUnicode版サクラエディタがリリースされれば解決します。

      細かい突っ込みですが、常識的に考えてU+2212をオプションスイッチ文字として使用するとは思えないので、ハイフン(0x2D)が正解なのだと思います。なので、このドキュメントは間違ってますね。
      • [6480] Re2: 貼り付けでの文字化け nanon 2007年11月23日 06:24

        ▼ maruさん
        >
        > 元ページを見に行きましたが、これはUnicodeにしかない文字で、U+2212のようです。
        > ANSIのハイフンマイナスと似ていますが異なる文字です。
        >
        > 現行のサクラエディタは内部的にSJISで動作するため、この貼り付け結果は仕様としか言いようがないです。
        > こういうケースでの対応は仕様として2通り考えられ、似た文字に変換するか、文字化けを無視して元データを維持するかのどちらかです。
        > サクラエディタは、後者「元データを維持」の支持派が多いため、現在のような動作になっています。
        ▼ ryojiさん
        > > 元の文字列
        > > *--title <title>
        > 上の-は、HTML上は&minus;と書かれているものですね。
        > &minus;はUnicodeの0x2212で、通常の - (Unicodeだと0x002d)
        とは微妙に違う文字です。

        なるほど,文字コードを扱う上での問題,および元のページのミスだったのですね.
        了解しました,Unicode版を楽しみにしておきます.
    • [6478] Re:貼り付けでの文字化け ryoji 2007年11月22日 01:56

      > 元の文字列
      > *--title <title>
      上の-は、HTML上は&minus;と書かれているものですね。
      &minus;はUnicodeの0x2212で、通常の - (Unicodeだと0x002d)とは微妙に違う文字です。

      > 修正,よろしくお願いします.
      現行のsakuraは内部SJISのため修正のしようがないと思います。
      開発中のUnicode版のほうでは正しく表示できています。