◀ANSI版開発トップへ
  • 642 UTF8の扱い
    • 720 Re:UTF8の扱い
      • 723 Re2:UTF8の扱い
  • [642] UTF8の扱い すとーにぃ 2001年07月23日 12:31

    現在、sakuraではUTF-8(BOMあり)とUTF-8n(BOMなし)を区別していませんが、両者を区別するようにしたほうがよいと思います。
    sakuraで扱われるUTF-8は、正確にはUTF-8nですので、ファイルオープンダイアログの表記もそちらのほうが望ましいです。

    UTF-8 先頭に EF BB BF がつく
    UTF-8n いきなり本文が始まる
    • [720] Re:UTF8の扱い じぇぷろ 2001年10月01日 18:25

      レスなしでどんどん忘れ去られていく記事が・・・

      ▼ すとーにぃさん
      > 現在、sakuraではUTF-8(BOMあり)とUTF-8n(BOMなし)を区別していませんが、両者を区別するようにしたほうがよいと思います。
      > sakuraで扱われるUTF-8は、正確にはUTF-8nですので、ファイルオープンダイアログの表記もそちらのほうが望ましいです。
      >
      > UTF-8 先頭に EF BB BF がつく
      > UTF-8n いきなり本文が始まる

      通常UTF-8といえばどっちなのですか? 「通常」と見なされている方がよく使うものでしょうから必要ならソースの方を修正するのが筋でしょう。
      • [723] Re2:UTF8の扱い すとーにぃ 2001年10月01日 19:45

        ▼ じぇぷろさん
        > 通常UTF-8といえばどっちなのですか?

        UTF-8の歴史的な経緯として、

        ・最初は先頭の識別文字(BOM)は使用されてなかった。
        ・その後、UNICODEファミリー間での区別のため、先頭に識別文字列をつけることを推奨するようになった。
        ・旧来の先頭に何もつかないUTF-8はUTF-8nと呼んで区別するようになった。

        なので、他のエディタでも「UTF-8と称しているが本来はUTF-8nと表記すべき」というものが結構あります。