moriyamaさんのヒトコト

UTF-8の問題はバイト列のまま処理しようとするから面倒になる。内部処理の文字コードをワイド文字にしてしまって、ワイド文字への変換の際に不正なバイト列を弾くようにすればいいじゃん。

イイネ: umq yaemon
 

konqueror は eucJP-open を POST できる。 http://www2d.biglobe.ne.jp/~msyk/cg... さすがに Firefox では、eucJP-open の小文字のローマ数字やはしご高を表示できない。

 

「はてな」は、EUC-JP を Perl Encode の euc-jp でデコードして Unicode で処理して euc-jp にエンコードし出力しているみたいだ。「はてな」で、cp51932 の NEC選定IBM拡張文字を入力すると iconv -f euc-jisx0213 -t euc-jp と同じ変換がかかる。

 

Ubuntu 9.04 の unzip って、オリジナル版で -O CP932 オプションつければ sjis ファイル名を解凍できるね。ja 版だと -O オプションが無視されるみたいで… オリジナル版を使って ~/.bashrc とかで日本語ロケールの時は、エイリアス設定するだけで OK なんじゃないかなぁ… なんか落とし穴あるのかな?

イイネ: hasegawa
 

Ruby って CSI を標榜していたんじゃなかたっけ? http://blade.nagaokaut.ac.jp/cgi-bi...

イイネ: umq iratqq
 

JavaCC って Compiler Compiler なのね。

 

> egbridgeは復活する鴨ですよ。 by いわた
きっと IVS 対応するでしょうね。

イイネ: iratqq
 

cp932, cp51932, cp5022x の文字コード変換の簡易テストとしては、"~√①Ⅰ彅髙" を変換してみると良いです。詳細はブログに書くつもり。

イイネ: hasegawa masugata iratqq