Datagrundlag

Danskernes Navne en internetbaseret og interaktiv publikation. Datagrundlaget stammer fra Det Centrale Personregister (CPR-registret), og publikationskonceptet er godkendt af Datatilsynet. Da navnene ikke på forhånd var forsynet med oplysning om navnetype, er opdelingen af navnestoffet baseret på en række regler for udskilning af fornavne, mellemnavne og efternavne. Rent praktisk er det foregået ved at datasættet er blevet gennemløbet med hver regel efter tur. For hver regel er det registreret hvor mange personer som blev sorteret ud ved den pågældende regel. Som hjælp til gennemgangen blev den enkelte post delt op i 1. navn, 2. navn, 3. navn osv. Overordnet gælder det at hvis et navn er blevet kategoriseret som et mellemnavn, vil alle efterfølgende navne også blive kategoriseret som mellemnavne (med undtagelse af efternavnet).


Regel 0

Sidste navn kategoriseres som et efternavn, dog med en vigtig undtagelse. Ud fra en tidligere udkørsel af efternavne baseret på oplysninger fra Danmarks Statistik er der udarbejdet en liste over godkendte/brugte efternavne som består af mere end et navn, fx von Ludorff. Hvis det fulde navn slutter på et af navnene i denne liste, bliver hele navnekombinationen kategoriseret som et efternavn. I de følgende regler antages det at man kun bærer ét efternavn. Slutter dataposten med et navn der ikke i forvejen kendes fra listen, kategoriseres det som efternavn.


Regel 1

Første navn er et fornavn. Alle personer der kun bærer to navne, nemlig et fornavn og et efternavn sorteres ud og lægges i databasen. Alle førstenavne opfattes som fornavne. De føjes til en kønsopdelt liste over fornavne som benyttes ved de følgende regler.


Regel 2

Hvis et navn findes i fornavnelisten, kan det tolkes som et fornavn under følgende omstændigheder. – Det er repræsenteret mere end 5 gange. – Det benyttes som 1. navn i mere end 5 % af alle tilfælde af samtlige navneforkomster. – Navnet har samme køn som personen. For navne som kan have begge køn (fx Kim) accepteres navnet umiddelbart som fornavn. Hvis blot ét af de tre kriterier ikke er opfyldt, kategoriseres navnet som et mellemnavn.


Regel 3

Hvis et navn findes i listen over efternavne, kategoriseres det som et mellemnavn. Det er dog et krav at navnet er repræsenteret mere end 3 gange i efternavnelisten. Hvis et navn både findes i fornavnelisten og efternavnelisten, vil det blive regnet som fornavn da Regel 2 rangerer højere end Regel 3.


Regel 4

Hvis et navn kun består af et bogstav, kategoriseres dette som et fornavn. Efternavne der kun består af ét bogstav er i forvejen sorteret fra efter Regel 0. Når alle regler er benyttet, er der kun en lille restgruppe tilbage. De resterende personers navne kategoriseres manuelt, som for-, mellem- og efternavne.


Statistik

I Danskernes Navne gives alle oplysninger om navnenes brug i absolutte tal. Der er altså ikke taget højde for at der fx lever flere mennesker i Østjylland end på Bornholm. Tilsvarende er der ikke angivet forskelle i det totale antal navngivne personer i de enkelte årtier som veksler på grund af forskelle i størrelsen af årgangene. For de personer som er født i Danmark er det dog muligt at få det totale antal navnebærere af begge køn som er registreret fra det pågældende område og det pågældende årti. Man kan også sammenholde antallet af navnebærere med et konkret navn i forhold til den totale mængde af navnebærere i et bestemt årti udtrykt i promille. Ud fra den oplysning kan man fx vurdere om navnet Hanne var mere almindeligt på Bornholm end i Østjylland i 1970’erne.


Anonymisering af data

Der er lagt vægt på at man i undersøgelsen ikke kan identificere enkeltpersoner. Alle resultater som vedrører 1-3 personer, er derfor slået sammen i de enkelte skemaer og anonymiseret i sammentællingerne. Det er heller ikke muligt at se de fuldstændige navnestrenge som i eksemplet Peter Hansen der er nævnt ovenfor. Endelig kan fødestedet ikke indkredses nærmere end til lands- eller verdensdel, ligesom undersøgelsen ikke kan oplyse om navnene i bestemte fødeår.