ASCII コード ファイルでは、英語の文字は 1 バイトを占め、中国語の文字は 2 バイトのスペースを占めます。ASCII コードは、指定された 7 ビットまたは 8 ビットの 2 進数の組み合わせを使用して 128 または 256 を表します。バイトとはバイナリ データの単位で、通常 1 バイトの長さは 8 ビットです。
#この記事の動作環境: Windows 7 システム、Dell G3 コンピューター。
ASCII コード ファイル内で 1 つの英語文字は何バイトを占めますか?
ASCII コードでは、1 つの英語文字 (大文字小文字に関係なく) が 1 バイトのスペースを占めます。 1 つの漢字は 2 バイトのスペースを占めます。
ASCII:
ASCII ((American Standard Code for Information Interchange): American Standard Code for Information Interchange) は、主にラテン文字に基づくコンピュータコーディングシステムです。 used 現代英語およびその他の西ヨーロッパ言語を表示します。これは最も一般的な情報交換標準であり、国際標準 ISO/IEC 646 と同等です。 ASCII は 1967 年に初めて標準化されたタイプとして公開され、1986 年に最後に更新されました。これまでに合計 128 文字が定義されています。
ASCII コードは、指定された 7 ビットまたは 8 ビットの 2 進数の組み合わせを使用して、128 または 256 個の可能な文字を表します。標準 ASCII コード (基本 ASCII コードとも呼ばれます) は、7 つの 2 進数 (残りの 1 つの 2 進数は 0) を使用して、すべての大文字と小文字、0 ~ 9 の数字、句読点、およびアメリカ英語で使用される特殊なコントロールを表します。 ] 。このうち
0 ~ 31 と 127 (計 33 個) は制御文字または特殊通信文字 (残りは表示可能な文字) で、制御文字: LF (改行)、CR (キャリッジ リターン) などです。 、FF(改ページ)、DEL(削除)、BS(バックスペース)、BEL(リング)など、通信特殊文字:SOH(本文の先頭)、EOT(本文の末尾)、ACK(確認)など。 ; ASCII 値の 8、9、10、13 はそれぞれバックスペース、タブ、ラインフィード、キャリッジリターン文字に変換されます。特定のグラフィック表示はありませんが、さまざまなアプリケーションに応じてテキスト表示にさまざまな効果をもたらします [1] 。
32~126(計95)は文字(32はスペース)で、そのうち48~57は0~9までの10個のアラビア数字です。
65 ~ 90 は 26 文字の大文字英字、97 ~ 122 は 26 文字の小文字英文字、残りは句読点や算術記号などです。
標準 ASCII では、その最上位ビット (b7) がパリティ ビットとして使用されることにも注意してください。いわゆるパリティチェックとは、符号伝送時にエラーが発生していないかをチェックする方法であり、大きく分けて奇数チェックと偶数チェックの2種類に分けられます。奇数パリティ ルール: 正しいコードのバイト内の 1 の数は奇数である必要があります。奇数でない場合は、最上位ビット b7 に 1 を追加します。偶数パリティ ルール: 正しいコードのバイト内の 1 の数。正しいコードは偶数である必要があります。偶数でない場合は、最上位ビット b7 に 1 を加算します。
最後の 128 は拡張 ASCII コードと呼ばれます。多くの x86 ベースのシステムは、拡張 (または「高」) ASCII の使用をサポートしています。拡張 ASCII では、各文字の 8 番目のビットを使用して、追加の 128 個の特殊記号文字、外国文字、およびグラフィック記号を決定できます。
バイト:
バイトはバイナリ データの単位です。通常、1 バイトの長さは 8 ビットです。ただし、一部の古いコンピューター アーキテクチャでは異なる長さが使用されます。混乱を避けるため、ほとんどの海外文献ではバイトではなくバイトという言葉が使用されています。ほとんどのコンピュータ システムでは、バイトは 8 ビットのデータ単位であり、文字、数字、その他の文字を表すためにバイトが使用されます。バイトは一連のバイナリ ビットを表すこともできます。一部のコンピュータ システムでは、4 バイトが 1 ワードを表します。これは、コンピュータが命令を実行する際に効率的に処理できるデータの単位です。一部の言語記述では、文字を表すために 2 バイトが必要であり、これを 2 バイト文字セットと呼びます。一部のプロセッサは、ダブルバイトまたはシングルバイトの命令を処理できます。バイトは「B」と省略されることが多く、ビットは通常小文字の「b」と省略されます。コンピュータ メモリのサイズは通常、バイト単位で表されます。
さらに関連する知識については、FAQ 列をご覧ください。
以上がASCII コード ファイル内で英語の文字は何バイトを占めますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。