La normalisation est une technique de conception de la base de données visant à réduire la redondance des données et à améliorer l'intégrité des données. Il existe plusieurs formes normales qui définissent différents niveaux de normalisation. Explorons-les en détail:
1. Première forme normale (1NF):
La première étape pour normaliser une base de données consiste à s'assurer qu'elle est en première forme normale. Un tableau est en 1NF s'il satisfait les conditions suivantes:
2. Deuxième formulaire normal (2NF):
Une table est en 2NF si elle est en 1NF et toutes les colonnes non clés dépendent entièrement fonctionnellement de la clé principale du tableau. Cela signifie que si la clé principale du tableau est composée de plusieurs colonnes, aucune colonne non clé ne devrait dépendre que d'une partie de la clé mais de toute la clé.
3. Troisième forme normale (3NF):
Une table est en 3NF si elle est en 2NF et il n'y a pas de dépendances transitives. Cela signifie que si une colonne non clé dépend d'une autre colonne non clé, elle doit être déplacée vers une table séparée. En d'autres termes, chaque colonne non clé doit fournir un fait sur la clé, la clé entière et rien que la clé.
4. Formulaire normal de Boyce-Codd (BCNF):
BCNF est une version plus stricte de 3NF. Une table est en BCNF si elle est en 3NF et pour chacune de ses dépendances fonctionnelles non triviales x -> y, x est un super-clé - c'est-à-dire que x est soit une clé candidate, soit un sur-ensemble de celui-ci. BCNF est conçu pour éliminer la possibilité d'anomalies qui peuvent encore survenir dans des tables 3NF en raison de certains types de dépendances fonctionnelles.
Les principales différences entre 1NF et 2NF résident dans la nature des dépendances dans le tableau.
Pour illustrer, considérez une table en 1NF avec une clé primaire composite. Si une colonne non clé ne dépend que d'une partie de la clé primaire, elle viole 2NF. Par exemple, si une commande de suivi de table a une clé primaire composite (OrderId, ProductId) et une colonne pour ProductPrice qui dépend uniquement de ProductId, en déplaçant le produit de produit vers une table séparée (avec ProductId comme clé primaire) apporterait le tableau d'origine en 2NF.
La troisième forme normale (3NF) joue un rôle crucial dans la réduction de la redondance des données en éliminant les dépendances transitives. Une dépendance transitive se produit lorsqu'une colonne non clé dépend d'une autre colonne non clé, qui à son tour dépend de la clé primaire.
Par exemple, considérez un tableau en 2NF qui comprend des colonnes pour les employés (clé primaire), le départementid et le nom de département. Si le nom de département dépend du départementid, ce qui dépend à son tour de l'employéid, le nom de département a une dépendance transitive à l'égard des employés par le départementid. Cette configuration peut entraîner une redondance des données car le même nom de département peut être répété plusieurs fois dans le tableau.
Pour y remédier, le 3NF nécessiterait le déménagement du nom de département à un tableau de département distinct (avec départementid comme clé principale), éliminant la dépendance transitive. Cette étape de normalisation garantit que le nom de département n'est stocké qu'une seule fois, réduisant la redondance et améliorant l'intégrité des données. Lorsqu'une mise à jour est nécessaire, elle ne doit être faite qu'en un seul endroit, minimisant le risque d'incohérences.
La forme normale de Boyce-Codd (BCNF) est préférée à la troisième forme normale (3NF) lorsqu'il y a des dépendances fonctionnelles où le déterminant (côté gauche de la dépendance) n'est pas une super touche. Le BCNF fournit un critère plus strict pour éliminer les anomalies qui peuvent persister dans les tables 3NF.
Considérez un exemple impliquant un système d'enregistrement des cours universitaires:
Tableau: cours
Dépendances fonctionnelles:
Dans ce scénario, le tableau est en 3NF car il n'y a pas de dépendances transitives. Cependant, cela viole le BCNF parce que Instructorid -> CourseID signifie qu'Instructorid, qui n'est pas un super-clé, détermine une autre colonne non clé, CourseID.
Pour satisfaire BCNF, nous aurions besoin de diviser la table en deux:
Tableau 1: cours
Tableau 2: Instructorcourse
Ce faisant, nous nous assurons que chaque déterminant des dépendances fonctionnelles est un superkey, répondant ainsi aux critères de la BCNF. Cette séparation élimine les anomalies potentielles telles que l'insertion, la suppression et la mise à jour des anomalies qui pourraient se produire si le tableau restait en 3NF.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!