[642] UTF8の扱いすとーにぃ 2001年07月23日 12:31

現在、sakuraではUTF-8(BOMあり)とUTF-8n(BOMなし)を区別していませんが、両者を区別するようにしたほうがよいと思います。
sakuraで扱われるUTF-8は、正確にはUTF-8nですので、ファイルオープンダイアログの表記もそちらのほうが望ましいです。

UTF-8 先頭に EF BB BF がつく
UTF-8n いきなり本文が始まる

[720] Re:UTF8の扱いじぇぷろ 2001年10月01日 18:25

レスなしでどんどん忘れ去られていく記事が・・・

▼ すとーにぃさん
> 現在、sakuraではUTF-8(BOMあり)とUTF-8n(BOMなし)を区別していませんが、両者を区別するようにしたほうがよいと思います。
> sakuraで扱われるUTF-8は、正確にはUTF-8nですので、ファイルオープンダイアログの表記もそちらのほうが望ましいです。
>
> UTF-8 先頭に EF BB BF がつく
> UTF-8n いきなり本文が始まる

通常UTF-8といえばどっちなのですか？　「通常」と見なされている方がよく使うものでしょうから必要ならソースの方を修正するのが筋でしょう。
- [723] Re2:UTF8の扱いすとーにぃ 2001年10月01日 19:45
  
  ▼ じぇぷろさん
  > 通常UTF-8といえばどっちなのですか？
  
  UTF-8の歴史的な経緯として、
  
  ・最初は先頭の識別文字(BOM)は使用されてなかった。
  ・その後、UNICODEファミリー間での区別のため、先頭に識別文字列をつけることを推奨するようになった。
  ・旧来の先頭に何もつかないUTF-8はUTF-8nと呼んで区別するようになった。
  
  なので、他のエディタでも「UTF-8と称しているが本来はUTF-8nと表記すべき」というものが結構あります。

[642] UTF8の扱い すとーにぃ 2001年07月23日 12:31

[720] Re:UTF8の扱い じぇぷろ 2001年10月01日 18:25

[723] Re2:UTF8の扱い すとーにぃ 2001年10月01日 19:45

[642] UTF8の扱いすとーにぃ 2001年07月23日 12:31

[720] Re:UTF8の扱いじぇぷろ 2001年10月01日 18:25

[723] Re2:UTF8の扱いすとーにぃ 2001年10月01日 19:45