2009 年 9 月 3 日

日本語文字コードの「だめ文字」

コンピューターの世界に日本語のだめ文字があることを知りました。それは、

「―ソЫIX噂浬欺圭構蚕十申曾箪貼能表暴予禄兔喀媾彌拿杤歃濬畚秉綵臀藹觸軆鐔饅鷭」

などです。これは、もともとコンピューターで日本語を表わす文字コードの問題に起因しています。それは日本のPCで最も使われている日本語文字コード:Shift_JISの場合,2バイト文字の2バイト目の部分に 0x5C(イスケープ文字)が使われていることに原因があります。これを回避する抜本的な開発方法は、プログラム、データベースで、Shift_JISではなくUTF-8やEUCを使うようにすることです。そして、ブラウザの<META>タグのcharset指定もUTF-8やEUCを記述することも忘れずに。

Filed under: あいてぃボックス — wtnbnoy @ 11:00 PM

コメントはまだありません »

No comments yet.

RSS feed for comments on this post.

Leave a comment

(C)2006-2015 テクノクッキー