ASCII 코드는 몇 바이트를 차지합니까?

百草
풀어 주다: 2023-09-07 16:03:25
원래의
5873명이 탐색했습니다.

ASCII 코드는 1바이트를 차지합니다. ASCII 코드는 문자를 표현하는 데 사용되는 코딩 표준입니다. 7비트 이진수를 사용하여 문자, 숫자, 문장 부호, 특수 문자 등을 포함하여 128개의 문자를 표현합니다. 바이트는 컴퓨터 저장 장치의 기본 단위입니다. 8개의 이진수 비트로 구성됩니다. 각 이진수 비트는 0 또는 1일 수 있습니다. 1바이트는 256개의 서로 다른 값을 나타낼 수 있으므로 ASCII 코드의 모든 문자를 나타낼 수 있습니다.

ASCII 코드는 몇 바이트를 차지합니까?

이 튜토리얼의 운영 체제: Windows 10 시스템, DELL G3 컴퓨터.

ASCII 코드(American Standard Code for Information Interchange)는 문자를 표현하는 데 사용되는 인코딩 표준입니다. 7비트 이진수를 사용하여 문자, 숫자, 문장 부호, 특수 문자 등을 포함한 128개의 문자를 표현합니다. 컴퓨터에서 ASCII 코드는 일반적으로 8비트 이진수로 표시됩니다. 즉, 하나의 ASCII 코드가 1바이트(8비트)의 저장 공간을 차지합니다.

ASCII 코드 문자는 컴퓨터에서 7비트 또는 8비트 바이너리 인코딩으로 표현되며 1바이트로 저장됩니다. 즉, 하나의 ASCII 코드가 1바이트를 차지합니다.

바이트(Byte)는 컴퓨터 저장 장치의 기본 단위로 8개의 바이너리 비트로 구성되며, 각 바이너리 비트는 0 또는 1이 될 수 있습니다. 1바이트는 256(2^8)개의 서로 다른 값을 나타낼 수 있으므로 ASCII 코드의 모든 문자를 나타낼 수 있습니다.

컴퓨터 기술의 발전과 국제화에 대한 요구로 인해 ASCII 코드는 점차 유니코드와 같은 보다 보편적인 코딩 표준으로 대체되었습니다. 유니코드는 16비트 또는 32비트를 사용하여 문자를 나타내며 다양한 언어의 문자 및 기호를 포함하여 더 많은 문자 집합을 나타낼 수 있습니다.

유니코드 인코딩을 사용하면 한 문자가 여러 바이트의 저장 공간을 차지할 수 있습니다. 차지하는 구체적인 바이트 수는 UTF-8, UTF-16 또는 UTF-32 등과 같이 사용되는 유니코드 인코딩 체계에 따라 다릅니다. UTF-8은 가변 길이 인코딩을 사용하는 일반적인 유니코드 인코딩 체계입니다. 문자의 인코딩 길이는 1~4바이트입니다.

요약하자면, ASCII 코드는 일반적으로 1바이트(8비트)의 저장 공간을 차지합니다. 그러나 유니코드 인코딩이 널리 적용되면서 문자는 여러 바이트의 저장 공간을 차지할 수 있습니다. 차지하는 구체적인 바이트 수는 사용되는 유니코드 인코딩 체계에 따라 다릅니다.

ASCII 코드는 몇 바이트를 차지합니까?

ASCII 코드는 표준 ASCII 코드와 확장 ASCII 코드로 나눌 수 있습니다.

표준 ASCII 코드는 기본 ASCII 코드라고도 하며 7개의 이진수(나머지 1개의 이진수는 0)를 사용하여 모든 대문자와 소문자, 숫자 0~9, 구두점 및 미국 영어에서 사용되는 문자를 나타냅니다. 특수 제어 문자. 그 중:

  • 0~31과 127(총 33개)은 제어 문자 또는 통신 전용 문자(나머지는 표시 가능한 문자)입니다.

    제어 문자 등: LF(줄 바꿈), CR(캐리지 리턴) , FF(복귀) 페이지), DEL(삭제), BS(백스페이스), BEL(링) 등

    통신용 특수 문자: SOH(텍스트 머리글), EOT(텍스트 끝), ACK(확인) ) 등

    ASCII 값은 8, 9, 10, 13으로 각각 백스페이스, 탭, 줄 바꿈 및 캐리지 리턴 문자로 변환됩니다. 특정 그래픽 표시가 없지만 응용 프로그램에 따라 텍스트 표시에 다른 효과가 있습니다.

  • 32~126(총 95개)은 문자(32는 공백)이며, 그 중 48~57은 0부터 9까지의 10개의 아라비아 숫자입니다.

  • 65~90은 영문 대문자 26자, 97~122는 영문 소문자 26자, 나머지는 구두점, 산술 기호 등입니다.

또한 표준 ASCII에서는 가장 높은 비트(b7)가 패리티 비트로 사용됩니다. 소위 패리티 검사(parity check)는 코드 전송 중에 오류가 발생하는지 확인하는 데 사용되는 방법을 말하며 일반적으로 홀수 검사와 짝수 검사의 두 가지 유형으로 구분됩니다. 홀수 패리티는 다음을 규정합니다. 올바른 코드의 바이트에 있는 1의 수는 홀수여야 합니다. 홀수가 아닌 경우 가장 높은 비트 b7에 1을 추가합니다. 짝수 패리티는 다음을 규정합니다. 올바른 코드는 짝수여야 합니다. 짝수가 아닌 경우 가장 높은 비트 b7에 1을 더합니다.

마지막 128개를 확장 ASCII 코드라고 합니다. 많은 x86 기반 시스템은 확장(또는 "고급") ASCII 사용을 지원합니다. 확장 ASCII를 사용하면 각 문자의 8번째 비트를 사용하여 추가 128개의 특수 기호 문자, 외국 문자 및 그래픽 기호를 결정할 수 있습니다.

ASCII 코드 표준표는 다음과 같습니다

11 9 0x09 HT (가로탭) 캐피탈 L 대문자 M 캐피털N 캐피털O Q 캐피탈Q 0101 0010 캐피탈 S 캐피탈 T 캐피털U 0131 0132 0133
ASCII 표
Bin
(바이너리)
Oct
(8진수)
Dec
(10진수)
Hex
(16진수)
약어/문자
설명
0000 0000
00
0
0x00
NUL(null)
null 문자
0000 0001
01
1
0x01
SOH(제목 시작)
제목 시작
0000 0010
02
2
0x02
STX(텍스트 시작)
텍스트 시작
0000 0011
03
3
0x03
ETX (텍스트 끝)
텍스트 끝
0000 0100
04
4
0x04
EOT(전송 종료)
전송 종료
0000 0101
05
5
0x05
ENQ(문의)
Request
0000
06
6
0 x06
ACK(확인)
알림 받기
0000 0111
07
7
0x07
BEL(벨)
0000 1000
010
가로 탭
0000 1010
012
10
0x0A
LF(NL 줄 바꿈, 새 줄)
줄 바꿈 키
0000 1011
013
11
0x0B
VT(세로 탭)
V 수직 탭
0000 1100
014
12
0x0C
FF(NP 양식 피드, 새 페이지)
페이지 키
0000 1101
015
13
0x0D
CR(캐리지 리턴)
Enter 키
0000 1110
016
14
0x0E
SO(교대 아웃)
전환할 필요가 없습니다
0000 1111
0001 000
020
16
0x10
DLE(데이터 링크 탈출)
데이터 링크 탈출
0001 0001
021
17
0x11
DC1(장치 제어 1)
장치 제어 1
0001
02 2
18
0x12
DC2(장치 제어 2)
장치 제어 2
0001 0011
023
19
0x13
DC3(장치 제어 3)
장치 제어 3
0001 0100
024
20
0x14
DC4(장치 제어 4)
장치 제어 4
0001 0101
025
21
0x15
NAK(부정 인정)
거부됨
0001 0110
026
22
0x16
SYN(동기 유휴) )
동기화 유휴
0001 0111
027
23
0x17
ETB(trans.block)
End of trans.block
0001 1000
030
24
0x18
CAN(취소)
Cancel
0001
03 1
25
0x19
EM( 매체 끝)
매체 끝
0001 1010
032
26
0x1A
SUB(대체)
대신
0001 1011
033
27
0x1B
ESC(이스케이프)
Escape(오버플로)
0001 1100
034
28
0x1C
FS(파일 구분 기호)
파일 구분 기호
0001 1101
035
29
0x
GS(그룹 구분 기호)
그룹화 기호
0001 1110
036
30
0x1E
RS(레코드 구분 기호)
기록 구분 기호
0001 1111
037
31
0x1F
US(단위 구분 기호)
단위 구분 기호
0010 0000
040
32
0x20
(공간)
space
0010 0001
041
33
0x21
!
느낌표
0010 0010
042
34
0x22
"
큰따옴표
0 010 0011
043
35
0x23 ㅋㅋㅋ 0x24
$
달러 기호
0010 0101
045
37
0x25
%
백분율
0010 0110
046
38
0x26
&
화号
0010 0111
047
39
0x27
'
작은따옴표 닫기
0010 1000
050
40
0x28
(
여는 괄호
0010 1001
051
41
0x29
)
닫는 브래킷
0 1010
052
ㅠㅠ
43
0x2B
+
Plus
0010 1100
054
44
0x2C
,
쉼표
0010 1101
055
45
0x2D
-
마이너스/대시
0010 1110
056
46
0x2E
.
Period
0010 1111
057
47
0x2F
/
슬래시
0011 0000
060
48
0x30
0
문자 0
0011 0001
061
49
0x31
1
캐릭터 1
0011 0010
062
50
0x32
2
캐릭터 2
0011 0011
063
51
0x33
3
캐릭터 3
0011 0100
064
52
0x34
4
캐릭터 4
0011 0101
065
53
0x35
5
캐릭터 5
0011 0110
066
54
0x36
6
캐릭터 6
0011 0111
067
55
0x37
7
캐릭터 7
0011 1000
070
56
0x38
8
캐릭터 8
0011 1001
071
57
0x39
9
문자 9
0011 1010
072
58
0x3A
:
Colon
0011 1011
073
59
0x3B
;
세미콜론
0011 1100
074
60
0x3C
미만
0011 1101
075
61
0x3D
=
등호
0011 1110
076
62
0x3E
>
0011 1111보다 큽니다.
077
63
0x3F
?
물음표
010 0 0000
0100
64
0x40
@
이메일 기호
0100
010 1
65
0x41
A
대문자 A
0100 0010
0102
66
0x42
B
캐피탈 B
0100 0011
0100 01 00
0104# 00 0101
0105
69
0x45
E
캐피탈 E
0100 0110
0106
70
0x46
F
캐피탈F
0100 0111
0107
71
0x47
G
캐피탈G
0100 10 00
0110
72
0x48
H
대문자 H
0100 1001
0111
73
0x 49
I
대문자 I
01001010
0112
74
0x4A
J
캐피털J
0100 1011
0113
75# 14
76
0x4C
L
0100 1101
0115
77
0x4D
M
0100 1110
0116
78
0x4E
N
0100 11 11
0117
79
0x4F
O
0101 0000
0120
80
0x 50
P
ㅋㅋㅋ
0101 01 11
0123
83
0x53
S
0101 0100
0124
84
0x 54
T
0101 0101
0125
85
0x55
U
0101 0110
0126
86
0x56
V
캐피털V
0101
01 27
87
0x57
W
대문자 W
0101 1000
0130
88
0x58
X
대문자
89
0x59
Y
대문자 Y
0101 10 10
90
0x5A
Z
캐피털Z
0101 1011
91
0x5B
[
열린 대괄호
0101 1100
0134
92
0x5C
백슬래시
0101 1101
0135
93
0x5D
]
닫는 대괄호
0101 1110
0136
94
0x5E
^
caret
0101 1111
0137
95
0x5F
_
밑줄
0110 0000
0140
96
0x60
`
작은따옴표 열기
01 10 0001
0141
97
0x61
a
소문자 a
0110
01 42
98
0x62
b
소문자 b
0110 0011
0143
99
0x63
c
소문자 c
0110 0100
0110 0 101
0145
101
0x65
e
소문자 e
0110 0110
0146
102
0x66
f
소문자 f
0110 0111
0147
103
0x67
g
소문자 g
0110 1000
0150
104
0x68
h
하단 h
0110 1 001
0151
105
0x69
i
소문자 i
0110 1010
0152
106
0 x6A
j
소문자 j
0110 1011
0153
107
0x6B
k
0110 1100
0154
108
0x6C
l
소문자 l
0110 1101
0 155
109
0x6D
m
소문자 m
0110 1110
0156
110
0x6E
n
소문자 n
0110 1111
0111 0 000
0160
112
0x70
p
소문자 p
0111 0001
0161
113
0x71
q
소문자 q
0111 0010
0162
114
0x72
r
소문자 r
0111 0011
0111 0 100
0164
116
0x74
t
소문자 t
0111 0101
0165
117
0 x75
u
소문자 u
0111
0166
118
0x76
v
소문자 v
0111 0111
0167
119
0x77
w
소문자 w
0111 1000
0 170
120
0x78
x
소문자
y
소문자 y
0111 1010
0172
122
0x7A
z
소문자 z
0111 1 011
0173
123
0x7B
{
여는 괄호
0111 1100
0174
124
0x 7C
|
세로선
0111 1101
0175
125
0x7D
}
닫는 중괄호
0111 1110
0176
126
0x7E
~
tilde
0111 1111
0177
127
0x7F
DEL (삭제)
Delete

크기 규칙

일반적인 ASCII 코드 크기 규칙: 숫자

  • 숫자는 문자보다 작습니다. 예를 들어 "7"

  • 숫자 0은 숫자 9보다 작으며 0부터 9까지 증가합니다. 예를 들어, "3"

  • 문자 A는 문자 Z보다 작고 A부터 Z까지 증가합니다. 예를 들어 "A"

  • 같은 글자의 대문자는 소문자보다 32자 더 작습니다. "A"

몇 가지 일반적인 문자의 ASCII 코드 크기: "A"는 65이고 "0"은 48입니다.

위 내용은 ASCII 코드는 몇 바이트를 차지합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

관련 라벨:
원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
최신 이슈
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿
회사 소개 부인 성명 Sitemap
PHP 중국어 웹사이트:공공복지 온라인 PHP 교육,PHP 학습자의 빠른 성장을 도와주세요!