[307] [バグ?]英文テキストがUTF-7でじぇぷろ 2001年04月01日 19:40

日本語のないテキストでTeXコマンドが入っているファイル、要するに.texですが、これがUTF-7で読み込まれることがある。
だいたいはSJISで読み込まれて、それで問題ないのだが、UTF-7として読み込まれたことを知らずに保存すると、TeXの下付き添え時x_+などがx_+-となってえらい迷惑する。
というよりも、マイナスがミスタイプで消えたと思って打ち直したら、プレビューで-がダブって「？」となる、というのが実際。
正確にはx_+-xのように+-があるときのよう。これはFAQにある現象である。FAQにはSJISで読み込み直すとあるが、一々UTF-7で読み込まれたことをチェックするのも面倒な話。
それに読み直しても履歴が消えるとまたUTF-7と誤認するし、根本的解決になってない。
普通の英文はSJISとなるのに、なぜUTF-7と判断してしまうのか？何とかSJISで読み込まれるようにならんものだろうか？あるいは要望にある様に(これはたけ氏の要望を私が記載した)
UTF-7を使わないユーザは誤判読しないために自動判別対象から外せるようになればいいのだが。。。
そもそもUTF-7、8がようわからん。たけ氏もヘルプに「たぶん日本語しか処理できません。よく知りません。」とあるが。。。実装が不完全？

[313] Re: [バグ?]英文テキストがUTF-7でげんた 2001年04月02日 08:57

▼じぇぷろ
>x_+-x
添え字に+という記号を使うんですか。

>普通の英文はSJISとなるのに、なぜUTF-7と判断してしまうのか？
というか、判定できない＝SJISとなっているだけでは？

やっていることは各文字コードに特有の文字を数えて、一番それらしいものを選んでいるだけです。ふつうのアルファベットはどのコードからもカウント対象外なので、漢字がない＝漢字コードカウント0で1文字でもUTF-7の文字があるとUTF-7に1票入ってしまうので誤認されます。

> 何とかSJISで読み込まれるようにならんものだろうか？
+→+-の変換をUTF-7のポイント対象外とします。一応うまく動いているようです。
- [314] Re2: [バグ?]英文テキストがUTF-7でじぇぷろ 2001年04月02日 12:38
  
  ▼ げんたさん
  > ▼じぇぷろ
  > >x_+-x
  > 添え字に+という記号を使うんですか。
  よく使います。式が煩雑にならないよう、$x_{k+1}-x_k$を簡潔に表現したい場合添え字kを省略し、+1のほうだけ+で表します。
  
  > >普通の英文はSJISとなるのに、なぜUTF-7と判断してしまうのか？
  > というか、判定できない＝SJISとなっているだけでは？
  判定しなくていいいんです、orできなくしてくれればいいんです。(^_^;)
  これで思いついたけど、「自動判別しない」=例えば「自分はSJISオンリーだ！」という設定にできてもいいですね。(メモ帳みたい(^^ゞ)
  たまにEUCで文字化けしたときだけ読み直せばいい。もっともこれは判別対象を選択できて、そのうちSJISにしかチェックしなければ、結果的に固定となるから、やっぱり「自動判別の選択」があればいいということになるかな。
  
  > > 何とかSJISで読み込まれるようにならんものだろうか？
  > +→+-の変換をUTF-7のポイント対象外とします。一応うまく動いているようです。
  そうしていただくとありがたいですね。TeXのinputでファイルを複数読み込んでいる時、あるファイルはSJISで、あるファイルはUTF-7で読み込まれている状態では作業効率が悪いんです。

[307] [バグ?]英文テキストがUTF-7で じぇぷろ 2001年04月01日 19:40

[313] Re: [バグ?]英文テキストがUTF-7で げんた 2001年04月02日 08:57

[314] Re2: [バグ?]英文テキストがUTF-7で じぇぷろ 2001年04月02日 12:38

[307] [バグ?]英文テキストがUTF-7でじぇぷろ 2001年04月01日 19:40

[313] Re: [バグ?]英文テキストがUTF-7でげんた 2001年04月02日 08:57

[314] Re2: [バグ?]英文テキストがUTF-7でじぇぷろ 2001年04月02日 12:38