Tutorial: OpenRefine

Tutorial: OpenRefine

OpenRefine is een veelzijdig open-sourceprogramma dat speciaal ontwikkeld is om datasets te ordenen, schoon te maken en te bewerken. Het biedt een overzichtelijke omgeving waarin gebruikers efficiënt met grote hoeveelheden data kunnen werken.

Met dit programma kun je:

Data opschonen: Opsporen en herstellen van onregelmatigheden, zoals verschillen in schrijfwijze, dubbele records of lege velden.
Gegevens omzetten: Waardes omzetten naar een uniform formaat, bijvoorbeeld door datumstijlen gelijk te trekken of tekstconsistentie aan te brengen.
Complexere bewerkingen uitvoeren: Gebruikmaken van functies zoals facetten, clusteringtechnieken en de expressietaal GREL voor grondigere analyses.
Datasets verkennen: Inzicht krijgen in de structuur van de gegevens en mogelijke trends, afwijkingen of fouten ontdekken

Een van de sterke punten van OpenRefine is dat het geschikt is voor grote bestanden en dat elke stap die je zet terug te draaien is totdat je besluit de wijzigingen definitief te maken. Hierdoor blijft het bewerken van data veilig en beheersbaar.

In het bijgevoegde document vind je onze handleiding. Deze introductie helpt je om de basis van OpenRefine snel onder de knie te krijgen, ook als je het programma nog niet eerder hebt gebruikt.

Voor deze tutorial maken we gebruik van deze data set:

En dit is de handleiding:

Veel succes en plezier!

Over de auteur