FANDOM


Dansk Udspring Database 3 er en database med stævneresultater som er under udarbejdelse af Victor Valore.

Be polite Dansk Udspring Database 3 er under udarbejdelse og indtil videre er resultater her på Dansk Udspring Wiki fortsat baseret på Dansk Udspring Database.

Som en del af arbejdet med at skabe Dansk Udspring Database 3 er der skrevet et introduktionsdokument som er gengivet nedenfor.

Introduktion til Dansk Udspring Database 3Edit

Dette dokument introducerer Dansk Udspring Database 3, samt fortæller om hovedprocesserne for dens tilblivelse, vedligehold og anvendelse.

Dansk Udspring Database 3 er skabt af Victor Valore, som fortsat er alene om at vedligeholde den.

København, 6. september 2014.

IntroduktionEdit

I dette afsnit vil Dansk Udspring Database 3 blive sat i kontekst, som baggrund for beskrivelsen af de egentlige processer.

FormålEdit

Mange beslutninger i en sportsgren som udspring baseres på faktuelle analyser, f.eks. gennemgang af tidligere resultater fra et mesterskab, for at opstille kvalifikationskrav til det næste.

Faktuelle data, bruges også i den løbende formidling af vores sport, da man igennem sammenligning med tidligere resultater kan opstille overskrifter som ”bedste resultat siden …” eller ”aldrig gjort før i …”.

Brugen af historiske data til blandt andet ovenstående formål, er ofte baseret på spotanalyser, hvor den som har behovet sammensætter et minimal datasæt, som ligger til grund for det konkrete behov.

Kilderne til spot-analyser er ofte spredt over flere lokaliteter, så bare det at skaffe adgang til kilderne kan kræve en hvis indsats og i mangel på kilder benyttes jævnligt den viden som er akkumuleret af enkeltpersoner. Når disse personer ikke længere indgår i miljøet omkring sporten, så vil deres viden også ofte gå tabt.

Igennem brugen af minimale datasæt, fraskærer man sig typisk muligheden for at lave hvad-hvis sammenligninger, da enhver forskydning af analysen vil kræve en udvidelse af minimal datasættet.

Formålet med Dansk Udspring Database 3 er således at sammensætte et større samlet korpus af normaliserede data som skal muliggøre en mere standardiseret rapportgenerering, såvel som skabe grundlaget for hvad-hvis analyser mere generelt.

Sammenstilling af dette korpus giver de afledte effekter at kunne bidrage med faktuelle data til informationskanaler som Dansk Udspring Wiki, samt kan være med til at fastholde sportens historie.

BaggrundEdit

Arbejdet med Dansk Udspring Database har været undervejs i nogle år og Dansk Udspring Database 3, som er påbegyndt i 2014, er således tredje generation af databasen.

Den første database blev til i 2010-2012, hvor der i Lyngby Udsprings Klub af 2002 var behov for at sammenstille resultater løbende, for at kunne planlægge og udtage fra klubbens konkurrencehold. Der var alene tale om starter for klubbens medlemmer og data var begrænset til placering og pointsum.

Den anden database blev til i 2012-2014 og var den første til at bære navnet Dansk Udspring Database. I denne database blev samlet information om alle danske udspringere og databasens første store input var en manuel indtastning af alle danske deltagere ved Nordiske Mesterskaber i årene 2000-2011.

Strukturen i den anden database indeholdt en overordnet definition af stævner, konkurrencer, antal deltagere, mv. Det dybeste niveau af data var dog fortsat den enkelte start og det opnåede resultat på dette niveau.

Efterhånden skiftede fokus fra manuelle indtastninger til import af samlede stævner med alle konkurrencer og alle deltagere. Kilderne var samlinger af resultater fra danske Trip Trap stævner, indtastede resultatlister fra danske mesterskaber i 90’erne, internationale stævner fra de senere år, osv.

Databasen blev lagt til grund for faktuel information i Danske Udspring Wiki og således stammer alle de resultater som vises på udspringernes profiler fra denne database. Selvom der er lavet tilløb til at skabe egentlige rapporter fra databasen, så er det aldrig blev brugt i nogen konkret sammenhæng.

Samlet set nåede databasen at optage information fra 53 stævner, med 3859 starter i 1021 konkurrencer.

Desværre var databasens struktur ikke optimal, da den ikke kunne håndtere synkronkonkurrence og teamevents på en ordentlig måde. Databasen havde ingen understøttelse for at håndterer springserierne for de enkelte starter. Ligeledes blev der påvist enkelte kvalitetsproblemer med de indsamlede data, heldigvis få, men fejl trods alt.

Datamodel og målsætningEdit

I designet af datamodel for Dansk Udspring Database 3 er der lagt vægt på at kunne håndterer den samlede struktur af data fra et stævne, så den primære struktur består af:

  • Stævne
  • Konkurrence
  • Start
  • Spring
  • Karakter

I datamodellen er ”Personer” en entydig definition af personer, alene med deres fødselsår tilknyttet. Deres association med hold sker sammen med de enkelte starter, således at klubskifte, opstilling i startfællesskaber eller som landshold bliver reflekteret.

Personer kan således tilknyttes individuelle starter, såvel som starter sammen med en partner i synkronkonkurrence eller teamevent. Ligeledes kan personen tilknyttes til afgivne dommerkarakterer og således følge den udvikling som en del personer tager fra at være aktiv udøver til at være træner og dommer.

Målsætningen om indsamling af data til Dansk Udspring Database 3 tager forsat udgangspunkt i tanken om at skabe et korpus baseret på Nordiske Mesterskaber. Med dette korpus og med det danske landshold som perspektiv, som vil det være naturligt at supplerer med stævner som principielt kan beskrives som fire retninger jf. nedenstående:

  • Illustration mangler

De fire retninger, i ikke prioriteret orden indeholder:

  • Danske mesterskaber – og på længere sigt Trip Trap DM-format stævner, hvilket viser vejen indtil udspringeren deltager i Nordiske Mesterskaber
  • Europæiske mesterskaber – og på længere sigt verdens mesterskaber og Olympiske Lege, som for nogle få udspringere viser hvor meget længere de er nået efter Nordiske Mesterskaber
  • Landsholdstævner som Grand Prix, Dresden Junior Grand Prix, Ulla Klinger Cup og Diving Lund – og på længere sigt anerkendte kvalifikationsstævner som Amsterdam Diving Cup og British Gas, så kvalifikationskrav for disse ligeledes kan ske baseret på korpus og med mulighed for sammenligninger stævnerne imellem.
  • Nordiske stævner som Bergen Open, Fantomen Cup/AquaRapid/HEAD to Head og Vantaa Diving Cup som giver et sammenligning- og udviklingsperspektiv for de danske og nordiske udspringere.

Historien og datakvalitetEdit

At samle historiske data og normalisere dem er ikke en eksakt videnskab!

Hvor mange resultatlister er entydige og således kan tages for pålydende, så er der også talrige eksempler på resultatlister som da de oprindeligt blev udsendt var forsynede med kommentarer om én eller flere fejl. Resultatlister overlever ofte i fuld eller summeret form, men de tilhørende kommentarer er tabt. I vise sammenhænge har der været udsendt korrigerede resultatlister og man kan således finde varianter af resultatlister, hvor enkelte detaljer er forskellige.

Indenfor normaliseringen af data skal man tage højde for en løbende udvikling af sporten, herunder justering af formater over årene, ændring af sværhedsgrad for spring og nye konkurrenceformer.

Normalisering af persondata sker ved hjælp af en nøgle som entydigt definerer personen, men hvor det tilknyttede navn og nogle gange fødselsår er genstand for en kvalificeret redigering. Udover at personer i forbindelse med giftemål ændre deres navn, så er der desværre hyppige stavefejl i resultatlisterne, som kombineret med søskende med næsten enslydende navne kan rette berettiget tvivl om præcis hvilken deltager der har været ved et bestemt stævne.

Arbejdet med normalisering af persondata er således en disciplin for sig, som kan skabe fejl, der først opdages når databasen bruges til kommunikationsformål og nogle med detaljeret indsigt således kan påpege fejlen.


Community content is available under CC-BY-SA unless otherwise noted.