翻訳と辞書
Words near each other
・ EU3
・ EUA
・ euanthium theory
・ EUB
・ eubacteria
・ eubacterium
・ EUC
・ EUC-CN
・ EUC-JIS-2004
・ EUC-JISX0213
・ EUC-JP
・ Euc-jp
・ EUC-KR
・ EUC-TW
・ eucalyptus oil
・ eucarpy
・ eucaryocyte
・ eucaryon
・ eucaryote
・ eucaryotic cell


Dictionary Lists
翻訳と辞書 辞書検索 [ 開発暫定版 ]
スポンサード リンク

EUC-JP : ウィキペディア日本語版
EUC-JP
EUC-JPExtended UNIX Code Packed Format for Japanese、日本語EUC)はUNIX上で日本語の文字を扱う場合に利用されている文字コード符号化方式)のひとつである。UNIX以外のOS上で使われることもある。
1980年代前半、日本語UNIXシステム諮問委員会がUNIXで日本語を扱うための文字コードについて議論を行い、議論の結果をもとに1985年4月に同委員会から報告書がAT&Tに出され、AT&Tにより定められたのがEUC-JPの起こりである。AT&Tから、''EUC''(Extended UNIX Codeの略)として日本語に限らず多言語に対応できるように定められ、EUCのうち日本語を扱うものを特にEUC-JPなどと呼ぶ。他に、EUC-KR(韓国語)、EUC-CN(簡体中国語)等がある。
EUCのエンコード方式上にASCIIJIS X 0208文字集合を配置したもので、半角カナ (JIS X 0201) とJIS補助漢字 (JIS X 0212) も含むことができる。半角カナと補助漢字を使用しない場合は、JIS X 0208で規定されている符号化方式「国際基準版・漢字用8ビット符号」と同一となる。ISO/IEC 2022に適合する。
日本語文字はJIS X 0208をGR領域に表現したものを基本としており、2バイトで表現され、1バイト目、2バイト目ともに0x80 - 0xFFの範囲内にある。このため英数字と日本語文字の区別がしやすく、プログラム上での扱いが楽である。ただし、補助漢字は制御文字SS3(シングルシフトスリー、0x8F)に続けて現れるので、都合3バイトを要する。
JIS X 0213:2004に対応するEUCコードはEUC-JIS-2004(2000年初版時はEUC-JISX0213)。
UNIX系OSの標準的な文字エンコードとして広く使用されてきたが、近年(いつ?)ではUTF-8を使用したシステムも普及している。
== EUC-JPの亜種 ==
EUC-JPには亜種が存在する。二種類を以下に解説する。
eucJP-msは、オープン・グループ及び日本ベンダ協議会が策定した文字符号化方式。実装例はMySQL v5.0以降等。
CP51932マイクロソフトWindowsで使用しているWindows-31JのEUC-JP互換表現。実装例はInternet Explorer4.0以降、EmEditor秀丸エディタ等。このコードはNECPC-9800シリーズの漢字コード(9区から12区の特殊文字を除外したもの)をGR表現したような体裁を持つ。ただし、PC-9800シリーズの漢字コードはJIS C 6226-1978をベースにするのに対して、CP51932はJIS X 0208-1990をベースとする点が異なる。

抄文引用元・出典: フリー百科事典『 ウィキペディア(Wikipedia)
ウィキペディアで「EUC-JP」の詳細全文を読む




スポンサード リンク
翻訳と辞書 : 翻訳のためのインターネットリソース

Copyright(C) kotoba.ne.jp 1997-2016. All Rights Reserved.