2014年3月3日月曜日

英語版Windows、バイト数の問題

バイト数とは?
文字コード
パソコンは、英語圏で開発。

情報量、ビット。On/Off 1ビット。
切れ目のいい。
CPU←→メモリ 通信 区切れのいい大きさ。1 octet → 1byte 1word(Intel 2bytes) 1dword(Intel 4bytes)

パソコンは、英語圏で開発→1バイト(0-255)256通り。A-Za-z0-9 26+26+10 56文字。「十分に収まるやん! (^-^)」
文字は7ビット目まで。(0-127)で表現しなさい。

日本語。2,000文字!?
256に収まらない!?
文字コード。日本語やアラビア語、韓国語、中国語、各々の国で自国語を表現するルール→文字コード
・Shift_JIS (Microsoft) 日本語表現可能。一般的。Windowsも使う。1バイト2バイトで済む。
・JIS (NEC) 日本語表現可能。8ビット目使わず。メールに最適。表現が複雑。ここから英数ですよ。ここから日本語ですよ。切り替えを含む。
・EUC (UNIX文化)。3バイトまで。
・Unicode 多国語 (UTF-8 UCS16 UTF-32)。表現方法により1-4バイト変換する。わが社のドルフィンは、これ。

ーーー
Windows(32ビットから)内部では2種類の文字コード。
・ANSI(ローカル)(Windows95,98,Me内部ではこちら)
→日本語Windowsでは、CP932 (Shift_JIS)
→中国語Windowsでは、GB???
→韓国語Windowsでは、???
・Unicode(UCS16)。内部ではこちら→Windows NT3.1 3.5 3.51 4.0 2000 XP 2003 Vista 7 2008 8 2008R2 8.1の、WindowsではすべてUnicode。

アプリの質。
A→Ansi。一部の古いアプリ。
W→Unicode。Internet Explorer←DD Firefox←DD Chrome←DD ddproxy5(.NET)←DD Windows (NT)標準アプリ 日本語入力アプリ Word Excel PowerPoint AdobeReader

ーーー
英語環境。
・英語版Windows買う
・Amazon EC2で、Windows Serverを時間借りして検証する。。。


0 件のコメント:

コメントを投稿