3. Forberede data til bruk
Aggregere data
For å forstå mønstre i dataene kan det være nødvendig å gruppere dem. Det er det vi kaller å aggregere data. Det gjør det enklere å ta beslutninger samtidig som tilfeldige variasjoner i enkeltmålinger får mindre betydning. Da kan du analysere egenskaper ved grupper i stedet for enkeltobservasjoner.
Du kan for eksempel:
Aggregere data fra individnivå til grupper. For eksempel fra enkeltpasienter til antall pasienter per diagnose per måned.
Fra enkeltresultater på prøver til gjennomsnitt per skole eller trinn.
Fra enkeltreiser til totalt antall reiser per dag eller per rute.
Behold data på et detaljert nivå og lag aggregerte visninger ved behov. Hvilket nivå du bør bruke avhenger av hva KI-systemet skal brukes til. For grovt nivå kan skjule viktige forskjeller, mens for detaljert nivå kan gi for lite datagrunnlag.
Velg derfor et nivå som gir godt grunnlag for analyse og beslutninger.
Slik aggregerer du data
Finn ut hvilket gruppenivå du trenger å analysere data på.
Velg hva du vil gruppere data etter, for eksempel per trinn, per skole, per kommune.
Bestem hvordan du vil oppsummere dataene, for eksempel gjennomsnitt, sum eller antall.
Grupper de originale dataene etter karakteristikkene du har valgt. Beregn måltall, for eksempel gjennomsnitt, sum, antall, for hver gruppe og bruk dette som datasett for KI-systemet.
Dokumenter hvordan du har laget aggregeringene slik at det er sporbart og lett å forstå for andre.
Eksempel
Vanningssystemet mottar målinger av jordfuktighet hvert 10. minutt fra flere sensorer i et område. I stedet for å bruke hver enkelt måling direkte kan dataene aggregeres:
Per time: beregne gjennomsnittlig jordfuktighet per time.
Per område (sone): slå sammen data fra flere sensorer til ett gjennomsnitt for hele området.
Per dag: beregne totalt vanningsbehov basert på gjennomsnitt og værdata.
For eksempel:
Sensor A: 20 %, 22 %, 21 %
Sensor B: 18 %, 19 %, 20 %
Gjennomsnitt for området: ca. 20 %
Dette gir et mer stabilt og oversiktlig grunnlag for å avgjøre om området trenger vanning.
Neste steg
Velge ut data