Introduktion til dataanalyse i Excel – del 1: Forberedelse

2020-08-10
introduktion_til_dataanalyse_i_excel_del_1_forberedelse

Dataanalyse er en kompleks proces, som involverer indsamling, gennemgang, rensning, transformering og modellering af data med det formål at finde brugbare informationer, som gør dig i stand til at drage brugbare konklusioner og træffe mere velfunderede beslutninger.  

Denne definition virker måske umiddelbart lidt skræmmende, men du kan være ganske rolig: Alle har været begyndere på et eller andet tidspunkt. Dataanalyser varierer desuden fra virksomhed til virksomhed. Man benytter forskellige værktøjer og teknikker og analyserer forskellige aspekter af virksomheden.  

Men selvom dataanalyser omfatter flere forskellige aspekter og teknikker, er der visse lighedspunkter og fællesnævnere, du kan bruge som rettesnor til en start. Først og fremmest skal du overveje følgende: 

  • Hvilke data vil og kan du indsamle? 
  • Har du adgang til de nødvendige værktøjer, i dette tilfælde Excel? 
  • Har du adgang til rene data, som du forstår? 
  • Hvis du ikke ved, hvad du leder efter, kan du starte med eksplorativ dataanalyse. Det indebærer, at vi finder ud af, hvad dataene kan fortælle os, ud over det som vi antog til at begynde med. 
  • Sørg for, at datakilderne er afstemt. Ellers vil data hentet fra forskellige kilder ikke give dig et retvisende billede.  

Ved at udvikle og forbedre dine evner til at analysere data kan du træffe bedre beslutninger og identificere de aspekter af din virksomhed, der skal forbedres. Med dataanalyser opnår du en bedre forståelse af din virksomhed i kraft af: 

  • Et samlet overblik over din virksomhed 
  • Lagerstyring 
  • Målrettet indhold til de rigtige kunder på det rigtige tidspunkt 
  • Krydssalg af produkter 
  • Optimering af produktprocesser og produktlogistik 

 

Dataanalyser i Excel 

Microsoft Excel er et af de bedste og mest velkendte værktøjer til dataanalyser, og de indbyggede pivottabeller er formentlig et af de mest populære analyseværktøjer. Et godt kendskab til Excel og pivottabeller vil være en hjælp i dit daglige arbejde, ikke mindst når du skal træffe svære beslutninger. 

Det du lærer i denne artikel, kan sagtens anvendes i alternativer til Excel, fx Google Sheets, Zoho Sheet m.fl. Hvis du ikke har adgang til Excel, er der altså andre værktøjer, der gør dig i stand til at udføre dataanalyser for din virksomhed. 

Denne artikelserie forklarer, hvordan du opretter pivottabeller med dine data i Excel: 

  • Skab fleksible datasamlinger ved hjælp af pivottabeller 
  • Opstil data visuelt i pivotdiagrammer 
  • Filtrer data med udsnit i flere pivottabeller 

Vi gennemgår disse koncepter ved at anvende dem i virkelige situationer. Forestil dig for eksempel, at vi ejer et grossistfirma. Vi vil gerne skabe et dashboard, som giver os et tydeligt overblik over omsætningen og vores kunder.  

Det kan give os et nyttigt overblik over salgshistorikken og bedre forudsætninger for at forudse omsætningen i den nærmeste fremtid. Et andet vigtigt mål er at kunne dele disse informationer med dine medarbejdere. De får en bedre forståelse af virksomheden, de vigtigste KPI'er, og hvordan deres personlige resultater påvirker virksomhedens overordnede resultater.  

Efter at have brainstormet om vores behov med vores medarbejdere og researchet emnet online beslutter vi, at vi vil se på følgende datasæt: 

  • Årlig udvikling i omsætning fordelt på land 
  • Årlig udvikling i omsætning fordelt på produktkategori 
  • Årlig omsætning fordelt på aldersgrupper 

Vi trækker data ud fra vores CRM-system, hvilket giver os et enkelt regneark med et antal kolonner og rækker med ordrer. Der er ingen opsummering. 

dataanalyser_i_excel_1

 

Datarensning  

Inden vi går i gang med at lave opsummeringer og dashboards, skal vi forberede vores rådata til bearbejdning. Det gør vi ved at kontrollere følgende: 

1. Har vi de data, vi har brug for?  

  • Kan vi arbejde med de tilgængelige kolonner? Vi anvender Ordredato, Artikeltype, Salgskanal, Region og Land, Antal solgte enheder og Samlet indtjening for at få et overblik over omsætningen over tid. 
  • Derefter anvender vi Fødselsdato og Samlet indtjening for at se, hvilke aldersgrupper der er vores bedste kunder. 

2. Skal dataene renses?  

  • Vi skal identificere ufuldstændige, ukorrekte, unøjagtige og irrelevante dele af dataene og erstatte, modificere eller slette beskidte eller grove data. Det kan for eksempel være en blanding af tal og bogstaver, et forkert placeret punktum eller usammenhængende data i samme kolonne. I vores tilfælde er dataene korrekte og klar til brug. 

3. Kan vi udtrække de nødvendige data, hvis vi ikke har dem? 

  • Vi vil kigge på vores kunder fordelt på aldersgruppe. Vi har ikke disse data i vores tabel, men vi kan skabe dem ved hjælp af Fødselsdato. 

 

Klargøring af datasæt og udtræk af data, der ikke er tilgængelige 

1. Først transformerer vi vores datasæt til en tabel. Det gør vi i menuen Indsæt ved at vælge Tabel i gruppen Tabeller. Hvis vi foretrækker tastaturgenveje, vælger vi vores data med Ctrl+A og trykker på Ctrl+T. 

klargøring_af_datasæt_1

De fleste tabeller har eller bør have overskrifter. I så fald skal du vælge Tabellen indeholder overskrifter. 

klargøring_af_datasæt_2

Omdøb tabellen til SalesRecords, så du nemt kan finde den senere. Det gør du ved at gå til Tabeldesign, skrive SalesRecords under Tabelnavn og trykke på Enter. Når du vil indsætte en ny pivottabel ved at bruge denne tabel, skal du herefter bare indtaste tabelnavnet – så ved Excel, hvilke data du henviser til. 

Det er nemmere at bruge tabeller i Excel, fordi: 

  • Man har altid mulighed for at indsætte overskrifter 
  • Filtre – Når du opretter en tabel, vil du med det samme bemærke, at der automatisk tilføjes filtreringsværktøjer til overskrifterne.  
  • Sortering – Med filtreringspilene kan du hurtigt sortere data i en hvilken som helst kolonne. Hvis du vil sortere flere felter ad gangen, skal du bruge funktionen Sorter under Data. 
  • Enkel indtastning af data i diagrammer og pivottabeller – Hvis du har et diagram med et dataområde, og du tilføjer en post i rækken i slutningen af dataområdet, registreres den tilføjede post ikke i diagrammet, men hvis du har dine data i en tabel, vil tilføjelsen af en ny post udvide tabellen med den nye post, og diagrammet opdateres automatisk. 
  • Automatisk udfyldning – Når du føjer en ny post til en tabel, er det ikke kun formateringen af tabellen, der udvides. Alle formler i tabellen vil også blive udfyldt automatisk. Det vil spare dig for en masse tid. 
  • Beregnede kolonner – Når du indsætter en formel i en tom kolonne, anvender Excel beregnede kolonner til automatisk at udfylde resten af rækkerne i kolonnen. Det går meget hurtigere end at tilføje formlen til én celle og derefter kopiere den til hele kolonnen. 

Eftersom vi vil oprette en rapport om Årlig omsætning fordelt på aldersgrupper, skal vi derefter udtrække alder og beregne aldersgruppe ved at skabe to nye kolonner med overskrifterne Alder og Aldersgruppe. 

klargøring_af_datasæt_3

Til at beregne Alder benytter vi følgende formler: 

  • Funktionen I DAG – Denne funktion viser dags dato, som opdateres løbende, hver gang et regneark ændres eller åbnes. Den værdi, som funktionen I DAG viser, kan ikke modificeres. Funktionen kan formateres til at vise datoen i et hvilket som helst standarddatoformat. 
  • Funktionen ÅR – Denne funktion viser året i en dato som et firecifret tal. Du kan bruge funktionen ÅR til at udtrække året fra en dato i en celle eller til at udtrække årsværdien og indsætte den i en anden formel. 
  • Subtraktion  
  • Vi ændrer celleformatet for denne kolonne til Tal og 0 decimaler. 

Til beregningen af Aldersgruppe anvender vi HVISER-funktionen (i tidligere udgaver af Microsoft Office Excel er man nødt til at anvende indlejrede HVIS-funktioner).  

klargøring_af_datasæt_4

HVISER-funktionen kører flere tests og viser den værdi, der svarer til det første SANDE resultat. Anvend HVISER-funktionen til at vurdere adskillige forhold uden flere indlejrede HVIS-sætninger. HVISER giver kortere formler, som er nemmere at læse. 

 

Vi fortsætter med at se nærmere på, hvordan Microsoft Excel kan anvendes til dataanalyser med pivottabeller, pivotdiagrammer, udsnit, tidslinjer og oprettelse af dashboards i vores anden artikel, Introduktion til dataanalyse i Excel – del 2: Analyse). 

Dataanalyser er vigtige for at skabe mere faktabaserede beslutningsgrundlag og hjælpe virksomheder med at opnå en mere effektiv drift. På sigt vil det være meget nyttigt for dig at udvikle og styrke dine kompetencer inden for dataanalyse.