Combien d’octets un code ascii occupe-t-il ? Combien d’octets un code ascii occupe-t-il ?-Problème commun-php.cn

Un code ASCII occupe un octet. Le code ASCII est une norme de codage utilisée pour représenter des caractères. Il utilise des nombres binaires de 7 bits pour représenter 128 caractères différents, notamment des lettres, des chiffres, des signes de ponctuation, des caractères spéciaux, etc. Un octet est l'unité de base de l'unité de stockage informatique. Il se compose de 8 bits binaires. Chaque bit binaire peut être 0 ou 1. Un octet peut représenter 256 valeurs différentes, il peut donc représenter tous les caractères du code ASCII.

Combien d'octets un code ascii occupe-t-il ?

Le système d'exploitation de ce tutoriel : système Windows 10, ordinateur DELL G3.

Le code ASCII (American Standard Code for Information Interchange) est une norme de codage utilisée pour représenter des caractères. Il utilise des nombres binaires de 7 bits pour représenter 128 caractères différents, notamment des lettres, des chiffres, des signes de ponctuation, des caractères spéciaux, etc. Sur les ordinateurs, les codes ASCII sont généralement représentés par des nombres binaires de 8 bits, c'est-à-dire qu'un code ASCII occupe un octet (8 bits) d'espace de stockage.

Les caractères du code ASCII sont représentés par un codage binaire 7 bits ou 8 bits dans l'ordinateur et sont stockés dans un octet, c'est-à-dire qu'un code ASCII occupe un octet.

Un octet (Byte) est l'unité de base de l'unité de stockage informatique. Il se compose de 8 bits binaires, chaque bit binaire peut être 0 ou 1. Un octet peut représenter 256 (2 ^ 8) valeurs différentes, il peut donc représenter tous les caractères du code ASCII.

Il est à noter qu'avec le développement de la technologie informatique et la demande d'internationalisation, les codes ASCII ont progressivement été remplacés par des standards de codage plus universels comme l'Unicode. Unicode utilise 16 ou 32 bits pour représenter les caractères et peut représenter davantage de jeux de caractères, notamment des caractères et des symboles dans différentes langues.

Lors de l'utilisation du codage Unicode, un caractère peut occuper plusieurs octets d'espace de stockage. Le nombre spécifique d'octets occupés dépend du schéma de codage Unicode utilisé, tel que UTF-8, UTF-16 ou UTF-32, etc. UTF-8 est un schéma de codage Unicode courant qui utilise un codage à longueur variable. La longueur de codage d'un caractère peut aller de 1 à 4 octets.

Pour résumer, un code ASCII occupe généralement un octet (8 bits) d'espace de stockage. Cependant, avec l'application généralisée du codage Unicode, un caractère peut occuper plusieurs octets d'espace de stockage. Le nombre spécifique d'octets occupés dépend du schéma de codage Unicode utilisé.

Combien doctets un code ascii occupe-t-il ?

Le code ASCII peut être divisé en code ASCII standard et code ASCII étendu.

Le code ASCII standard est également appelé code ASCII de base. Il utilise 7 chiffres binaires (le chiffre binaire restant est 0) pour représenter toutes les lettres majuscules et minuscules, les chiffres de 0 à 9, les signes de ponctuation et les caractères utilisés en anglais américain. Caractères de contrôle spéciaux. Parmi eux :

0~31 et 127 (33 au total) sont des caractères de contrôle ou des caractères spécifiques à la communication (les autres sont des caractères affichables)
tels que des caractères de contrôle : LF (saut de ligne), CR (retour chariot) , FF (page de retour), DEL (suppression), BS (retour arrière), BEL (sonnerie), etc.
Caractères spéciaux pour la communication : SOH (tête de texte), EOT (fin de texte), ACK (confirmation ), etc. ;
La valeur ASCII est 8, 9, 10 et 13 sont respectivement converties en caractères de retour arrière, de tabulation, de saut de ligne et de retour chariot. Ils n'ont pas d'affichage graphique spécifique, mais auront des effets différents sur l'affichage du texte selon l'application.
32~126 (95 au total) sont des caractères (32 est un espace), dont 48~57 sont dix chiffres arabes de 0 à 9.
65~90 sont 26 lettres anglaises majuscules, 97~122 sont 26 lettres anglaises minuscules, et le reste est constitué de signes de ponctuation, de symboles arithmétiques, etc.

A noter également qu'en ASCII standard, son bit le plus élevé (b7) est utilisé comme bit de parité. Le contrôle de parité fait référence à une méthode utilisée pour vérifier si des erreurs se produisent lors de la transmission du code. Il est généralement divisé en deux types : le contrôle impair et le contrôle pair. Règles de parité impaire : le nombre de 1 dans un octet du code correct doit être un nombre impair. Si ce n'est pas un nombre impair, ajoutez 1 au bit pair le plus élevé. Règles de parité : le nombre de 1 dans un octet du code correct. le code correct doit être un nombre pair, si ce n'est pas un nombre pair, ajoutez 1 au bit le plus élevé b7.

Les 128 derniers sont appelés codes ASCII étendus. De nombreux systèmes x86 prennent en charge l'utilisation de l'ASCII étendu (ou « élevé »). L'ASCII étendu permet d'utiliser le 8ème bit de chaque caractère pour déterminer 128 caractères de symboles spéciaux supplémentaires, des lettres étrangères et des symboles graphiques.

Le tableau standard du code ASCII est le suivant

Guillemets simples de fermeture ( parenthèse ouverte 0010 1001 051 41 0x29 ) Parenthèse de fermeture 001 0 1010 052 0131

Tableau ASCII
Bin (binaire)	Oct (octal)	Déc (décimal)	Hex (hex)	Abréviation/Caractère	Explication
0000 0000	00	0	0x00	NUL(null)	caractère nul
0000 0001	01	1	0x01	SOH(début du titre)	Début du titre
0000 0010	02	2	0x02	STX (début du texte)	Le texte commence
0000 0011	03	3	0x03	ETX (fin du texte)	Fin du texte
0000 0100	04	4	0x04	EOT (fin de transmission)	Fin de transmission
0000 0101	05	5	0x05	ENQ (demande)	Demande
0000 0110	06	6	0x06	ACK (accuser réception)	Recevoir une notification
0000 0111	07	7	0x07	BEL (cloche)	Cloche
0000 1000	010	8	0x08	BS (retour arrière)	Retour arrière
0000 1001	0 11	9	0x09	HT (onglet horizontal)	Onglet horizontal
0000 1010	012	10	0x0A	LF (saut de ligne NL, nouvelle ligne)	Touche de saut de ligne
0000 1011	013	11	0x0B	VT (onglet vertical)	V onglet vertical
0000 1100	014	12	0x0C	FF (flux de formulaire NP, nouvelle page)	Clé de page
0000 1101	015	13	0x0D	CR (retour chariot)	Touche Entrée
0000 1110	016	14	0x0E	SO (déplacement)	Pas besoin de changer
0000 1111 0001 000	020	16	0x10	DLE (évasion de liaison de données)	Évasion de liaison de données
0001 0001	021	17	0x11	DC1 (contrôle de l'appareil 1)	Contrôle de l'appareil 1
0001 0010	0 22	18	0x12	DC2 (contrôle de l'appareil 2)	Contrôle de l'appareil 2
0001 0011	023	19	0x 13	DC3 (contrôle de l'appareil 3)	Contrôle de l'appareil 3
0001 0100	024	20	0x14	DC4 (contrôle de l'appareil 4)	Contrôle de l'appareil 4
0001 0101	025	21	0x15	NAK (accusé de réception négatif)	Rejeté
0001 0110	026	22	0x16	SYN (synchrone inactif)	Sync inactif
0001 0111	027	23	0x17	ETB (fin du bloc trans.)	Fin du bloc trans
0001 1000	030	24	0x18	CAN (annuler)	Annuler
0001	031	25	0x19	EM ( fin de médium)	Fin de médium
0001 1010	032	26	0x1A	SUB (remplacement)	Au lieu de
0001 1011	033	27	0x1B	ESC (évasion)	Échap (débordement)
0001 1100	034	28	0x1C	FS (séparateur de fichiers)	Séparateur de fichiers
0001 1101	035	29	0x 1D	GS (séparateur de groupe)	Symbole de regroupement
0001 1110	036	30	0x1E	RS (séparateur d'enregistrement)	Séparateur d'enregistrement
0001 1111	037	31	0x1F	US (séparateur d'unité)	Séparateur d'unité
0010 0000	040	32	0x20	(espace)	espace
0010 0001	041	33	0x21	!	Point d'exclamation
0010 0010	042	34	0x22	"	guillemets doubles
0010 0011	043	35	0x23	#	Hashtag
0010 0100	044	36	0x24	$	Signe du dollar
0010 0101	045	37	0x25	%	Signe de pourcentage
0010 0110	0010 0111	047	39	0x27	'
	0010 1000	050	40	0x28

			42	0x2A	*	star
0010 1011	053	43	0x2B	+	Plus
0010 1100	054	44	0x2C	,	virgule
0010 1101	055	45	0x2D	-	Moins/tiret
0010 1110	056	46	0x2E	.	Période
0010 1111	057	47	0x2F	/ 0000	060
48	0x30	0	Personnage 0	0011 0001	061
49	0x31	1	Personnage 1	0011 0010	062
50	0x32	2	Personnage 2	0011 0011	063
51	0x33	3	Personnage 3	0011 0100	064
52	0x34	4	Caractère 4	0011 0101	065	53	0x35	5	Caractère 5
0011 0110	0 66	54	0x36	6	Personnage 6
0011 0111	067	55	0x37	7	Personnage 7
0011 1000	070	56	0x38	8	Caractère 8
0011 1001	071	57	0x39	9	Personnage 9
0011 1010	072	58	0x3A	:	Côlon
0011 1011	073	59	0x3B	;	point-virgule
0011 1100	074	60	0x3C		moins de
0011 1101	075	61	0x3D	=	Signe égal
0011 1110	076	62	0x3E	>	est supérieur à
0011 1111	077	63	0x3F	?	Point d'interrogation
010 0 0000	0100	64	0x40	@	Symbole d'e-mail
0001	010 1	65	0x41	A	Capital A
0100 0010	0102	66	0x42	B	Capital B
0100 0011 0100 01 00	0104	68	0x44	D	Capital D
010 0 0101	0105	69	0x 45	E	Capital E
0100 0110	0106	70	0x46	F	Capital F
0100 0111	0107	71	0x47	G	G majuscule
0100 10 00	0110	72	0x48	H	Capital H
0100 1001	0111	73	0x 49	I	Lettre majuscule I
01001010	0112	74	0x4A	J	Capital J
0100 1011	0113	75	0x4B	K	K majuscule
0100 1100	01 14	76	0x4C	L	Capital L
0100 1101	0115	77	0x4D	M	M majuscule
0100 1110	0116	78	0x4E	N	Capital N
0100 11 11	0117	79	0x4F	O	Capital O
0101 0000	0120	80	0x 50	P	Capital P
0101 0001	0121	81	0x51	Q	Q majuscule
0101 0010 0101 01 11	0123	83	0x53	S	Capitale 101 0100
0124	84	0x 54	T	Capital T	0101 0101
0125	85	0x55	U	Capitale U	0101 0110
0126	86	0x56	V	Capital V
0101 0111	01 27	87	0x57	W	Capital W
0101 1000	0130	88	0x58	X	Lettre majuscule
89	90	0x5A	Z	Capital Z	0101 1011
0133	91	0x 5B	[	Crochets ouverts
0101 1100	0134	92	0x5C		backslash
0101 1101	0135	93	0x5D	]	Crochets fermants
0101 1110	0136	94	0x5E	^	caret
0101 1111	0137	95	0x5F	_	underscore
0110 0000	0140	96	0x60	`	guillemet simple ouvert
01 10 0001	0141	97	0x61	a	minuscule a
0110	01 42	98	0x62	b	minuscule b
0110 0011	0143	99	0x63	c	minuscule c
0110 0100 0110 0 101	0145	101	0x65	e	minuscule e
0110 0110	0146	102	0x66	f	minuscule f
0110 0111	0147	103	0x67	g	minuscule g
0110 1000	0150	104	0x68	h	hminuscule
0110 001	0151	105	0x69	i	minuscule i
0110 1010	0152	106	0 x6A	j	minuscule j
0110 1011	0153	107	0x6B	k	minuscule k
0110 1100	0154	108	0x6C	l	minuscule l
0110 1101	0 155	109	0x6D	m	minuscule m
0110 1110	0156	110	0x6E	n	minuscule n
0110 1111 0111 0 000	0160	112	0x70	p	minuscule p
0111 0001	0161	113	0x71	q	minuscule q
0111 0010	0162	114	0x72	r	minuscule r
0111 0011 0111 0 100	0164	116	0x74	t	minuscule t
0111 0101	0165	117	0 x75	u	minuscule u
0111 0110	0166	118	0x76	v	v minuscule
0111 0111	0167	119	0x77	w	minuscule w
0111 1000	0 170	120	0x78	x	minuscule y
minuscule y	0111 1010	0172	122	0x7A	z
z minuscule	0111 1 011	0173	123	0x7B	{
parenthèses d'ouverture	0111 1100	0174	124	0x 7C	\|	Ligne verticale
0111 1101	0175	125	0x7D	}	Orthèse de fermeture
0111 1110	0176	126	0x7E	~	tilde
0111 1111	0177	127	0x7F	DEL (supprimer)	Supprimer

Règles de taille

Règles courantes de taille du code ASCII : chiffres

Les chiffres sont plus petits que les lettres. Par exemple, "7"
Le chiffre 0 est plus petit que le chiffre 9 et augmente dans l'ordre de 0 à 9. Par exemple, "3"
La lettre A est plus petite que la lettre Z et augmente dans l'ordre de A à Z. Par exemple, "A"
Les lettres majuscules de la même lettre sont 32 fois plus petites que les lettres minuscules. Tel que "A"

La taille du code ASCII de plusieurs lettres courantes : "A" est 65 ; "a" est 97 ; "0" est 48.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Php8, je viens aussi

Apprenez la mise en page d'un site Web en 30 minutes

Tutoriel vidéo Shangguan Oracle débutant à compétent

Votre première ligne de code UNI-APP

Flutter de zéro au lancement de l'application

Brother Lian Nouveau didacticiel vidéo Linux

Tutoriel vidéo AXURE 9 (convient à l'interface utilisateur interactive de conception de produits du chef de produit)

Tutoriel vidéo PS Zero Basic Proficiency

Tutoriel vidéo de 16 jours sur l'interface utilisateur pour vous aider à démarrer

Tutoriel vidéo sur les techniques PS et les techniques de découpage

Tutoriel vidéo sur la construction et le lancement de projets d'Alibaba Cloud Environment

Présentation des réseaux informatiques - Connaissances de base que les programmeurs doivent maîtriser

Tutoriel essentiel pour les programmeurs - Explication du protocole HTTP

Tutoriel vidéo Websocket

Combien d'octets un code ascii occupe-t-il ?