Académique Documents
Professionnel Documents
Culture Documents
La prsence de doublons dans une base de donnes est nfaste pour les
performances et lintgrit des donnes. Cela augmente artificielle la taille
dune base de donnes tandis que les donnes sont potentiellement
compromise.
Type de doublons
Il y a trois type de doublons couramment sur les bases de donnes:
Doublon relatif : reprsente les tuples qui ont les mmes valeurs
sauf pour la cl. Le cas le plus typique ce sont les lignes identiques sauf
pour la colonne id .
FROMtable
GROUPBYchamp1,champ2,champ3
HAVINGCOUNT(*)>1
GROUPBYemail
HAVINGCOUNT(email)>1