Manual til kortlægning af producenter, importører og forhandlere

4 Videre databehandling

Den videre databehandling i EXCEL har til formål at samle alle lister til én liste, og frasortere virksomheder, som optræder på flere af listerne. Den sorterede liste skal bruges til at flette med det brev, som skal sendes ud til virksomhederne.

Organisering af data

→  Fjern Post adresselinie 2-5 fra udtrækket fra KRAK Markedsdata, så kun "Post adresselinie1" står tilbage.

→  Flyt rundt på kolonnerne i listerne fra Kompass og andre datakilder så de følger samme format, som udtræk fra KRAK Markedsdata: CVR nr; Virksomhedsnavn; Post adresselinie1; Post postnr; Post postdistrikt; Telefon; E-mail; Primær Nace nr;   Primær Nace betegnelse.

→  Kopier alle lister ind i ét regneark, så alle virksomheder står under hinanden. Kontrollér at samme type af oplysninger (fx firmanavn) står i samme kolonne.

→  Lav en sortering efter Post adresselinie1.

→  Gå listen igennem se efter om der er virksomheder som optræder to gange med samme adresse og virksomhedsnavn. Fjern i givet fald den række med færrest oplysninger.

→  Gem Excel filen, som skal bruges til at trykke labels og til at flette sammen med det brev, som skal sendes ud.

Fra både Krak, Kompass og CVR er det muligt at udtrække virksomhedslister der umiddelbart kan importeres i et databaseprogram eller regneark (MS Excel).

Når man skal forene resultater fra flere datakilder, skal man sikre sig, at data fra de forskellige datakilder er opstillet ens, så eksempelvis bynavn er i samme kolonne, både i udtræk fra Krak og Kompass og i lister fra brancheforeninger. I Excel gøres det ved at flytte rundt på kolonnerne. Hvis der i nogle af listerne ikke optræder en bestemt information (eksempelvis CVR nummer) vælger man at have tomme felter for disse oplysninger.

Udtrækkene fra de enkelte datakilder kopieres herefter over i det samme regneark. Udtræk med mange tusinde virksomheder håndteres uden problemer på denne måde. Det anbefales at alle udtræk håndteres i samme fil (regnebog) med et regneark for hver datakilde, samt et regneark med den samlede liste. Herved er det muligt senere at gå tilbage og se de enkelte udtræk, hvis der er behov for det.

For at undgå at der sendes flere breve ud til den samme virksomhed er det nødvendigt at foretage en sortering, hvis oplysninger fra flere datakilder er forenet. Til sortering af dataene anvendes funktionen Data > Sort hvor dataene sorteres efter én eller flere af søjlerne. Til dette formål har det vist sig mest hensigtsmæssigt at sortere efter vejnavn og nummer, som generelt er angivet på samme måde i de fleste datakilder, hvorimod virksomhedsnavne kan angives på forskellig måde. CVR nummeret er entydigt og derfor den bedste parameter, men det indgår ofte ikke i de lister, som kan indhentes fra brancheforeninger og registreringsordninger.

En manuel frasortering vil som oftest dog tage relativt kort tid.

Virksomhedsnavnene kan godt være anført forskelligt, selvom der er tale om den samme virksomhed fx som A/S Triton, Triton A/S eller TRITON. To virksomheder på samme adresse skal have væsentligt forskellige navne eller forskelligt CVR for her at blive betragtet som to forskellige virksomheder.

Et Excel regneark kan uden videre bruges som datakilde til funktionen "flet breve" [Mail Merge] i Word, hvorved navne- og adresseoplysninger kan flettes ind i breve. Se hjælpefunktionen i Word for en nærmere beskrivelse af flettefunktionen.

Regler for samkøring af personoplysninger fra flere offentlige registre, er fastlagt i lov om behandling af personoplysninger LOV nr. 429 af 31/05/2000. Samkøring af oplysninger om virksomheders adresser og produkter, som der er tale om her, er ikke omfattet af loven, og der er således ingen begrænsning i at kombinere oplysninger fra flere datakilder.

 



Version 1.0 Juli 2008, © Miljøstyrelsen.