Det store eksempel
Dette eksempel viser hvordan data fra Aarhus kommunes Citylab-sensorer kan gøres lidt nemmere at forstå og arbejde med.
Datakilden
Urlen til den faktiske datakilde er http://portal.opendata.dk/api/3/action/datastore_search?resource_id=c65b055d-a020-4871-ab51-bdbc3fd73fd8 og dataformatet er JSON.
Log ind i Datatidy, gå til “Data library” og tryk på “Add data source”.
Udfyld formularen med noget a la følgende
Felt | Værdi | Kommentar |
---|---|---|
Name | Sensordata fra Aarhus kommune | Brug et kort, præcist og sigende navn. |
Description | Sensordata fra Aarhus kommune | Giv en god beskrivelse så andre – og du selv – kan forstå hvilke data datakilden leverer. |
Ttl | 3600 | Time To Live. Antal minutter der skal gå melle at data hentes fra kilden. Hvis fx kilden kun opdateres én gang i døgnet, så er der ingen grund til at hente data hvert minut. |
Data source | JSON | Data leveres som JSON. |
Når “JSON” vælges som ud for “Data source” dukker en række ny felter op under “Data source options”. Udfyld disse:
Felt | Værdi | Kommentar |
---|---|---|
URL | http://portal.opendata.dk/api/3/action/datastore_search?resource_id=c65b055d-a020-4871-ab51-bdbc3fd73fd8 | Den faktisk url til data. |
root | result.records | Data ligger i result.records i JSON-dokumentet som datakilden leverer. |
Når alt er som det skal være et det tid til at trykke på “Save”.
Datatransformationerne
Nu skal selve dataflowet som transformerer datasættet fra datakilden (og på sigt sender resultatet til et datamål) bygges.
Gå til “Flows”, tryk på “New data flow” og udfyld formularen:
Felt | Værdi | Kommentar |
---|---|---|
Name | Sensordata fra Aarhus kommune | Brug et kort, præcist og sigende navn. |
Data source | Sensordata fra Aarhus kommune | Vælg datakilden som blev defineret ovenfor. |
Tryk på “Create data flow”.
Nu ses en oversigt over dataflowet med datakilde, datatransformationer (opskrift) og datamål.
Tryk på “Edit recipe”.
Vi er (for eksemplets skyld) kun interesserede i “type”, “time” og “value”, så den første transformation skal udvælge kun disse kolonner.
Vælg “Select columns” under “Add new step” og tryk på “Add transform”.
Udfyld formularen:
Felt | Værdi | Kommentar |
---|---|---|
Name | Vælg kolonner | Brug et kort, præcist og sigende navn. |
Transformer | Select columns | Er allerede valgt. |
Columns | type, time, value | Vælg kolonner. |
Include | ✓ | Vi ønsker at beholde de valgte kolonner. |
Tryk på “Save step”.
Nu skulle datasættet kun indeholde de tre ønskede kolonner.