◀一般トップへ
6476
貼り付けでの文字化け
6477
RE: 貼り付けでの文字化け
6480
Re2: 貼り付けでの文字化け
6478
Re:貼り付けでの文字化け
[6476]
貼り付けでの文字化け
nanon
2007年11月22日 00:43
ブラウザ(Firefox,IEとも)でUTF-8のページを表示し,
ページ中の文字をコピー,貼り付けすると文字化けします.
元の文字列
*--title <title>
sakura貼り付け後に表示される文字列(そのままコピペしてあります)
*""title <title>
元のページ
http://
www.
bunkus.
org/
videotoo
ls/
mkvtooln
ix/
doc/
mkvmerge
.
html
修正,よろしくお願いします.
[6477]
RE: 貼り付けでの文字化け
maru
2007年11月22日 01:35
>元のページ
>http://www.bunkus.org/videotools/mkvtoolnix/doc/mkvmerge.html
>*""title <title>
元ページを見に行きましたが、これはUnicodeにしかない文字で、U+2212のようです。
ANSIのハイフンマイナスと似ていますが異なる文字です。
現行のサクラエディタは内部的にSJISで動作するため、この貼り付け結果は仕様としか言いようがないです。
こういうケースでの対応は仕様として2通り考えられ、似た文字に変換するか、文字化けを無視して元データを維持するかのどちらかです。
サクラエディタは、後者「元データを維持」の支持派が多いため、現在のような動作になっています。
いずれUnicode版サクラエディタがリリースされれば解決します。
細かい突っ込みですが、常識的に考えてU+2212をオプションスイッチ文字として使用するとは思えないので、ハイフン(0x2D)が正解なのだと思います。なので、このドキュメントは間違ってますね。
[6480]
Re2: 貼り付けでの文字化け
nanon
2007年11月23日 06:24
▼ maruさん
>
> 元ページを見に行きましたが、これはUnicodeにしかない文字で、U+2212のようです。
> ANSIのハイフンマイナスと似ていますが異なる文字です。
>
> 現行のサクラエディタは内部的にSJISで動作するため、この貼り付け結果は仕様としか言いようがないです。
> こういうケースでの対応は仕様として2通り考えられ、似た文字に変換するか、文字化けを無視して元データを維持するかのどちらかです。
> サクラエディタは、後者「元データを維持」の支持派が多いため、現在のような動作になっています。
▼ ryojiさん
> > 元の文字列
> > *--title <title>
> 上の-は、HTML上は−と書かれているものですね。
> −はUnicodeの0x2212で、通常の - (Unicodeだと0x002d)
とは微妙に違う文字です。
なるほど,文字コードを扱う上での問題,および元のページのミスだったのですね.
了解しました,Unicode版を楽しみにしておきます.
[6478]
Re:貼り付けでの文字化け
ryoji
2007年11月22日 01:56
> 元の文字列
> *--title <title>
上の-は、HTML上は−と書かれているものですね。
−はUnicodeの0x2212で、通常の - (Unicodeだと0x002d)とは微妙に違う文字です。
> 修正,よろしくお願いします.
現行のsakuraは内部SJISのため修正のしようがないと思います。
開発中のUnicode版のほうでは正しく表示できています。