Une clé candidate est une combinaison d'attributs pouvant être utilisés de manière unique pour identifier un enregistrement de base de données sans faire référence à aucune autre donnée. Chaque table peut avoir un ou plusieurs candidats. L'une de ces clés candidates est sélectionnée comme clé primaire de la table. Une table ne contient qu'une seule clé primaire, mais elle peut contenir plusieurs clés candidates. Si une clé candidate est composée de deux colonnes ou plus, elle est appelée clé composite.
Propriétés d'une clé candidate
Toutes les clés candidates ont des propriétés communes. L'une des propriétés est que, pour la durée de vie de la clé candidate, l'attribut utilisé pour l'identification doit rester le même. Une autre est que la valeur ne peut pas être nulle. Enfin, la clé candidate doit être unique.
Par exemple, pour identifier de manière unique chaque employé, une entreprise peut utiliser son numéro de sécurité sociale. Comme vous pouvez le constater, certaines personnes ont le même prénom, le même nom et la même position, mais deux personnes ne possèdent jamais le même numéro de sécurité sociale.
Numéro de sécurité sociale | Prénom | Nom de famille | Position |
---|---|---|---|
123-45-6780 | Craig | Jones | Directeur |
234-56-7890 | Craig | Beal | Associer |
345-67-8900 | Sandra | Beal | Directeur |
456-78-9010 | Trina | Jones | Associer |
567-89-0120 | Sandra | Forgeron | Associer |
Exemples de clés candidates
Certains types de données se prêtent facilement comme candidats:
- Numéro international normalisé du livre - Les numéros ISBN identifient de manière unique les livres et les supports associés. La délivrance des ISBN est étroitement réglementée par les entreprises de contrôle de l'industrie et les ISBN ne sont généralement jamais réutilisés par les éditeurs.
- Numéros de compte bancaire - La plupart des banques ne recyclent pas les numéros de compte.
- Numéros de série: bien que les numéros de série ne soient pas gérés d'une industrie à l'autre, dans le contexte d'un fournisseur unique, un numéro de série doit toujours être unique.
- Numéros de permis de conduire - En règle générale, ces numéros ne sont pas dupliqués. Cependant, une personne qui passe d'un état à l'autre peut avoir plus d'un numéro DL.
- National Provider ID (ID fournisseur national) - Les médecins et les autres prestataires médicaux agréés ont chacun au moins un NPI qui leur est propre, délivré par le département américain de la santé et des services sociaux.
Cependant, certains types d’informations qui peuvent sembler être de bons candidats s'avèrent problématiques:
- Numéros de téléphone - La plupart des opérateurs recyclent les numéros de téléphone et les abonnés individuels peuvent avoir plusieurs numéros de téléphone simultanément.
- Codes de prix universels - Les CUP sont uniques, mais le propriétaire d'un bloc UPC peut recycler les produits à sa guise.
- Numéros de dossiers médicaux - Les NRM sont généralement délivrés au niveau hospitalier, sans aucune sorte de directive nationale concernant
- Numéros de sécurité sociale: bien qu'ils soient théoriquement uniques, les SSN sont recyclés, et leur fraude est suffisamment répandue pour rendre cet identifiant problématique pour des ensembles de données volumineux. (Dans le contexte d'un employeur qui vérifie les numéros de sécurité sociale, ce défi ne pose pas de problème.)