Maison > base de données > tutoriel mysql > le corps du texte

Points clés à connaître lors de la création de tables dans MySQL

DDD
Libérer: 2024-09-12 22:15:35
original
766 Les gens l'ont consulté

Key Points You Must Know When Creating Tables in MySQL

For backend developers, accessing a database is crucial.

Core user data is usually stored securely in databases like MySQL or Oracle.

Daily tasks often involve creating databases and tables to meet business needs, but tables are created much more frequently.

This article will focus on table creation since ignoring key details can lead to costly issues in maintenance after deployment.

By the way, Poor database design practices can also cause your API to respond slowly during high concurrency.The following image shows the performance test results of an API using the EchoAPI tool.

Key Points You Must Know When Creating Tables in MySQL

Today, let’s discuss 18 tips for creating tables in a database.

Many of the details mentioned in this article stem from my own experiences and challenges faced during work, and I hope they will be helpful to you.

1. Naming

When creating tables, fields, and indexes, giving them good names is incredibly important.

1.1 Meaningful Names

Names serve as the face of tables, fields, and indexes, leaving a first impression.

Good names are concise and self-descriptive, making communication and maintenance easier.

Poor names are ambiguous and confusing, leading to chaos and frustration.

Bad Examples:

Field names like abc, abc_name, name, user_name_123456789 will leave you baffled.

Good Example:

Field name as user_name.

A gentle reminder: names should also not be too long, ideally kept within 30 characters.

1.2 Case Sensitivity

It’s best to use lowercase letters for names, as they are easier to read visually.

Bad Examples:

Field names like PRODUCT_NAME, PRODUCT_name are not intuitive. A mix of upper and lower case is less pleasant to read.

Good Example:

Field name as product_name looks more comfortable.

1.3 Separators

Often, names may contain multiple words for better understanding.

What separator should be used between multiple words?

Bad Examples:

Field names like productname, productName, product name, or product@name are not recommended.

Good Example:

Field name as product_name.

Using an underscore _ between words is strongly advised.

1.4 Table Names

For table names, it’s recommended to use meaningful, concise names along with a business prefix.

For order-related tables, prepend the table name with order_, such as order_pay, order_pay_detail.

For product-related tables, prepend with product_, like product_spu, product_sku.

This practice helps in categorizing tables related to the same business together quickly.

Additionally, if a non-order business might need to create a table named pay, it can be easily distinguished as finance_pay, preventing name conflicts.

1.5 Field Names

Field names allow for maximum flexibility but can easily lead to confusion.

For example, using flag to denote status in one table while using status in another can create inconsistencies.

Standardizing to status for representing state is advisable.

When a table uses another table's primary key, append _id or _sys_no to the end of the field name, for example, product_spu_id or product_spu_sys_no.

Additionally, standardize creation time as create_time and modification time as update_time, with deletion status fixed as delete_status.

Other common fields should also maintain a uniform naming convention across different tables for better clarity.

1.6 Index Names

In a database, there are various types of indexes, including primary keys, regular indexes, unique indexes, and composite indexes.

A table generally has a single primary key, usually named id or sys_no.

Regular and composite indexes can use the ix_ prefix, for example, ix_product_status.

Unique indexes can use the ux_ prefix, such as ux_product_code.

2. Field Types

When designing tables, ample freedom exists in choosing field types.

Time-formatted fields can be date, datetime, or timestamp, etc.

Character data types include varchar, char, text, etc.

Numeric types comprise int, bigint, smallint, and tinyint.

Selecting an appropriate field type is crucial.

Surestimer les types (par exemple, utiliser bigint pour un champ qui ne stockera que des valeurs comprises entre 1 et 10) gaspille de l'espace ; tinyint suffirait.

À l'inverse, sous-estimer (par exemple, utiliser int pour un identifiant à 18 chiffres) entraînera des échecs de stockage des données.

Voici quelques principes pour choisir les types de champs :

  • Préférez une petite taille de stockage tout en répondant aux besoins normaux de l'entreprise, en choisissant de petit à grand.
  • Utilisez char pour des longueurs de chaîne fixes ou similaires, et varchar pour des longueurs variées.
  • Utilisez bit pour les champs booléens.
  • Utilisez tinyint pour les champs d'énumération.
  • Choisissez bigint pour les champs de clé primaire.
  • Utilisez le nombre décimal pour les champs monétaires.
  • Utilisez l'horodatage ou la date/heure pour les champs d'heure.

3. Longueur du champ

Après avoir défini les noms de champs et sélectionné les types de champs appropriés, l'accent doit être mis sur la longueur des champs, comme varchar(20) ou bigint(20).

Qu'est-ce que varchar indique en termes de longueur : octets ou caractères ?

La réponse : dans MySQL, varchar et char représentent la longueur des caractères, tandis que la plupart des autres types représentent la longueur en octets.

Par exemple, bigint(4) spécifie la longueur d'affichage, pas la longueur de stockage, qui reste 8 octets.

Si la propriété zerofill est définie, les nombres de moins de 4 octets seront complétés, mais même s'ils sont remplis, le stockage de données sous-jacent reste à 8 octets.

4. Nombre de champs

Lors de la conception d’un tableau, il est crucial de limiter le nombre de champs.

J'ai vu des tables contenant des dizaines, voire des centaines de champs, conduisant à de gros volumes de données et à une faible efficacité des requêtes.

Si cette situation se présente, envisagez de diviser les grandes tables en tables plus petites tout en conservant les clés primaires communes.

En règle générale, maintenez le nombre de champs par table en dessous de 20.

5. Clés primaires

Créez une clé primaire lors de la configuration d'une table.

Les clés primaires sont intrinsèquement accompagnées d'index de clés primaires, ce qui rend les requêtes plus efficaces, car elles ne nécessitent pas de recherches supplémentaires.

Dans une seule base de données, les clés primaires peuvent utiliser AUTO_INCREMENT pour une croissance automatique.

Pour les bases de données distribuées, en particulier dans les architectures fragmentées, il est préférable d'utiliser des algorithmes externes (comme Snowflake) pour garantir des identifiants uniques au monde.

De plus, gardez les clés primaires indépendantes des valeurs métier pour réduire le couplage et faciliter les expansions futures.

Cependant, pour les relations un-à-un, telles que les tables utilisateur et les tables d'extension utilisateur, il est acceptable d'utiliser directement la clé primaire de la table utilisateur.

6. Moteur de stockage

Avant MySQL 8, le moteur de stockage par défaut était MyISAM ; à partir de MySQL 8, c'est maintenant InnoDB.

Historiquement, il y a eu de nombreux débats sur le moteur de stockage à choisir.

MyISAM sépare le stockage des index et des données, améliorant ainsi les performances des requêtes, mais ne prend pas en charge les transactions et les clés étrangères.

InnoDB, bien que légèrement plus lent dans les requêtes, prend en charge les transactions et les clés étrangères, ce qui le rend plus robuste.

Il était auparavant conseillé d'utiliser MyISAM pour les scénarios gourmands en lecture et InnoDB pour les scénarios gourmands en écriture.

Cependant, les optimisations dans MySQL ont réduit les différences de performances, il est donc recommandé d'utiliser le moteur de stockage InnoDB par défaut dans MySQL 8 et versions ultérieures sans aucune modification supplémentaire.

7. PAS NULL

Lors de la création de champs, décidez s'ils peuvent être NULL.

Il est conseillé de définir les champs comme NOT NULL autant que possible.

Pourquoi ?

Dans InnoDB, le stockage des valeurs NULL nécessite de l'espace supplémentaire et peut également entraîner des échecs d'index.

Les valeurs NULL ne peuvent être interrogées qu'en utilisant IS NULL ou IS NOT NULL, car l'utilisation de = renvoie toujours false.

Ainsi, définissez les champs comme NOT NULL autant que possible.

Cependant, lorsqu'un champ est directement défini comme NOT NULL et qu'une valeur est oubliée lors de la saisie, cela empêchera l'insertion de données.

Cela peut être une situation acceptable lorsque de nouveaux champs sont ajoutés et que des scripts sont exécutés avant de déployer un nouveau code, ce qui entraîne des erreurs sans valeurs par défaut.

Pour les champs NOT NULL nouvellement ajoutés, la définition d'une valeur par défaut est cruciale :

ALTER TABLE product_sku ADD COLUMN brand_id INT(10) NOT NULL DEFAULT 0;
Copier après la connexion

8. Clés étrangères

Les clés étrangères dans MySQL servent à garantir la cohérence et l'intégrité des données.

Par exemple :

CREATE TABLE class (
  id INT(10) PRIMARY KEY AUTO_INCREMENT,
  cname VARCHAR(15)
);
Copier après la connexion

Cela crée une table de classe.

Ensuite, une table étudiante peut être construite qui y fait référence :

CREATE TABLE student(
  id INT(10) PRIMARY KEY AUTO_INCREMENT,
  name VARCHAR(15) NOT NULL,
  gender VARCHAR(10) NOT NULL,
  cid INT,
  FOREIGN KEY (cid) REFERENCES class(id)
);
Copier après la connexion

Ici, cid dans la table des étudiants fait référence à l'identifiant dans la table des classes.

Tenter de supprimer un enregistrement chez l'étudiant sans supprimer l'enregistrement cid correspondant dans la classe générera une erreur de contrainte de clé étrangère :

une contrainte de clé étrangère échoue.

Ainsi, la cohérence et l'intégrité sont préservées.

Notez que les clés étrangères ne sont utilisables qu'avec le moteur de stockage InnoDB.

If only two tables are linked, it might be manageable, but with several tables, deleting a parent record requires synchronously deleting many child records, which can impact performance.

Thus, for internet systems, it is generally advised to avoid using foreign keys to prioritize performance over absolute data consistency.

In addition to foreign keys, stored procedures and triggers are also discouraged due to their performance impact.

9. Indexes

When creating tables, beyond specifying primary keys, it’s essential to create additional indexes.

For example:

CREATE TABLE product_sku(
  id INT(10) PRIMARY KEY AUTO_INCREMENT,
  spu_id INT(10) NOT NULL,
  brand_id INT(10) NOT NULL,
  name VARCHAR(15) NOT NULL
);
Copier après la connexion

This table includes spu_id (from the product group) and brand_id (from the brand table).

In situations that save IDs from other tables, a regular index can be added:

CREATE TABLE product_sku (
  id INT(10) PRIMARY KEY AUTO_INCREMENT,
  spu_id INT(10) NOT NULL,
  brand_id INT(10) NOT NULL,
  name VARCHAR(15) NOT NULL,
  KEY `ix_spu_id` (`spu_id`) USING BTREE,
  KEY `ix_brand_id` (`brand_id`) USING BTREE
);
Copier après la connexion

Such indexes significantly enhance query efficiency.

However, do not create too many indexes as they can hinder data insertion efficiency due to additional storage requirements.

A single table should ideally have no more than five indexes.

If the number of indexes exceeds five during table creation, consider dropping some regular indexes in favor of composite indexes.

Also, when creating composite indexes, always apply the leftmost matching rule to ensure the indexes are effective.

For fields with high duplication rates (like status), avoid creating separate regular indexes. MySQL may skip the index and choose a full table scan instead if it’s more efficient.

I’ll address index inefficiency issues in a separate article later, so let’s hold off on that for now.

10. Time Fields

The range of types available for time fields in MySQL is fairly extensive: date, datetime, timestamp, and varchar.

Using varchar might be for API consistency where time data is represented as a string.

However, querying data by time ranges can be inefficient with varchar since it cannot utilize indexes.

Date is intended only for dates (e.g., 2020-08-20), while datetime and timestamp are suited for complete date and time.

There are subtle differences between them.

Timestamp: uses 4 bytes and spans from 1970-01-01 00:00:01 UTC to 2038-01-19 03:14:07. It’s also timezone-sensitive.

Datetime: occupies 8 bytes with a range from 1000-01-01 00:00:00 to 9999-12-31 23:59:59, independent of time zones.

Using datetime to save date and time is preferable for its wider range.

As a reminder, when setting default values for time fields, avoid using 0000-00-00 00:00:00, which can cause errors during queries.

11. Monetary Fields

MySQL provides several types for floating-point numbers: float, double, decimal, etc.

Given that float and double may lose precision, it’s recommended to use decimal for monetary values.

Typically, floating numbers are defined as decimal(m,n), where n represents the number of decimal places, and m is the total length of both integer and decimal portions.

For example, decimal(10,2) allows for 8 digits before the decimal point and 2 digits after it.

12. JSON Fields

During table structure design, you may encounter fields needing to store variable data values.

For example, in an asynchronous Excel export feature, a field in the async task table may need to save user-selected query conditions, which can vary per user.

Traditional database fields don’t handle this well.

Using MySQL’s json type enables structured data storage in JSON format for easy saving and querying.

MySQL also supports querying JSON data by field names or values.

13. Unique Indexes

Unique indexes are frequently used in practice.

You can apply unique indexes to individual fields, like an organization’s code, or create composite unique indexes for multiple fields, like category numbers, units, specifications, etc.

Unique indexes on individual fields are straightforward, but for composite unique indexes, if any field is NULL, the uniqueness constraint may fail.

Another common issue is having unique indexes while still producing duplicate data.

Due to its complexity, I’ll elaborate on unique index issues in a later article.

When creating unique indexes, ensure that none of the involved fields contain NULL values to maintain their uniqueness.

14. Character Set

MySQL supports various character sets, including latin1, utf-8, utf8mb4, etc.

Here’s a table summarizing MySQL character sets:

Character Set Description Encoding Size Notes
latin1 Encounters encoding issues; rarely used in real projects 1 byte Limited support for international characters
utf-8 Efficient in storage but cannot store emoji 3 bytes Suitable for most text but lacks emoji support
utf8mb4 Supports all Unicode characters, including emoji 4 bytes Recommended for modern applications

It’s advisable to set the character set to utf8mb4 during table creation to avoid potential issues.

15. Collation

When creating tables in MySQL, the COLLATE parameter can be configured.

For example:

CREATE TABLE `order` (
  `id` BIGINT NOT NULL AUTO_INCREMENT,
  `code` VARCHAR(20) COLLATE utf8mb4_bin NOT NULL,
  `name` VARCHAR(30) COLLATE utf8mb4_bin NOT NULL,
  PRIMARY KEY (`id`),
  UNIQUE KEY `un_code` (`code`),
  KEY `un_code_name` (`code`,`name`) USING BTREE,
  KEY `idx_name` (`name`)
) ENGINE=InnoDB AUTO_INCREMENT=5 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_bin;
Copier après la connexion

The collation determines how character sorting and comparison are conducted.

Character collation depends on the character set, which for utf8mb4 would also start with utf8mb4_. Common types include utf8mb4_general_ci and utf8mb4_bin.

The utf8mb4_general_ci collation is case-insensitive for alphabetical characters, while utf8mb4_bin is case-sensitive.

This distinction is important. For example, if the order table contains a record with the name YOYO and you query it using lowercase yoyo under utf8mb4_general_ci, it retrieves the record. Under utf8mb4_bin, it will not.

Choose collation based on the actual business needs to avoid confusion.

16. Large Fields

Special attention is warranted for fields that consume substantial storage space, such as comments.

A user comment field might require limits, like a maximum of 500 characters.

Defining large fields as text can waste storage, thus it’s often better to use varchar for better efficiency.

For much larger data types, like contracts that can take up several MB, it may be unreasonable to store directly in MySQL.

Instead, such data could be stored in MongoDB, with the MySQL business table retaining the MongoDB ID.

17. Redundant Fields

To enhance performance and query speed, some fields can be redundantly stored.

For example, an order table typically contains a userId to identify users.

However, many order query pages also need to display the user ID along with the user’s name.

If both tables are small, a join is feasible, but for large datasets, it can degrade performance.

In that case, creating a redundant userName field in the order table can resolve performance issues.

While this adjustment allows direct querying from the order table without joins, it requires additional storage and may lead to inconsistency if user names change.

Therefore, carefully evaluate if the redundant fields strategy fits your particular business scenario.

18. Comments

When designing tables, ensure to add clear comments for tables and associated fields.

For example:

CREATE TABLE `sys_dept` (
  `id` BIGINT NOT NULL AUTO_INCREMENT COMMENT 'ID',
  `name` VARCHAR(30) NOT NULL COMMENT 'Name',
  `pid` BIGINT NOT NULL COMMENT 'Parent Department',
  `valid_status` TINYINT(1) NOT NULL DEFAULT 1 COMMENT 'Valid Status: 1=Valid, 0=Invalid',
  `create_user_id` BIGINT NOT NULL COMMENT 'Creator ID',
  `create_user_name` VARCHAR(30) NOT NULL COMMENT 'Creator Name',
  `create_time` DATETIME(3) DEFAULT NULL COMMENT 'Creation Date',
  `update_user_id` BIGINT DEFAULT NULL COMMENT 'Updater ID',
  `update_user_name` VARCHAR(30)  DEFAULT NULL COMMENT 'Updater Name',
  `update_time` DATETIME(3) DEFAULT NULL COMMENT 'Update Time',
  `is_del` TINYINT(1) DEFAULT '0' COMMENT 'Is Deleted: 1=Deleted, 0=Not Deleted',
  PRIMARY KEY (`id`) USING BTREE,
  KEY `index_pid` (`pid`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8mb4 COMMENT='Department';
Copier après la connexion

Detailed comments clarify the purpose of tables and fields.

Particularly for fields representing statuses (like valid_status), it immediately conveys the intent behind the data, such as indicating valid versus invalid.

Avoid situations where numerous status fields exist without comments, leading to confusion about what values like 1, 2, or 3 signify.

Initially, one might remember, but after a year of operation, it’s easy to forget, potentially leading to significant pitfalls.

Thus, when designing tables, meticulous commenting and regular updates of these comments are essential.

That wraps up the technical section of this article,If you have a different opinion, let me know?.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:dev.to
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal
À propos de nous Clause de non-responsabilité Sitemap
Site Web PHP chinois:Formation PHP en ligne sur le bien-être public,Aidez les apprenants PHP à grandir rapidement!