Klinken deze uitdagingen bekend?
- Gegevens opschonen duurt langer dan analyseren
- Saaie opschoningsstappen herhalen in meerdere bestanden
- Grote datasets zijn overweldigend en moeilijk te navigeren
- Een veilige, offline manier nodig om gevoelige gegevens op te schonen
- Wijzigingen in ruwe data uit het oog verliezen
- Gegevens worden rommelig als er veel medewerkers aan meewerken of als ze in de loop van de tijd worden opgebouwd
Zo ja, dan is deze workshop echt iets voor jou!
We laten je kennismaken met OpenRefine, een gratis en open-source tool die het opschonen van gegevens in tabelvorm sneller, veiliger en transparanter maakt, zodat je betrouwbare, begrijpelijke en herbruikbare gegevens kunt creëren.
In deze sessie leer je hoe je:
- Grote datasets importeert en verkent
- Duplicaten kunt identificeren en verwijderen
- Rommelige formaten standaardiseert
- Variaties clustert (zoals verschillende schrijfwijzen van dezelfde naam)
- Schone gegevens exporteert terwijl de originele bestanden intact blijven
- Herhaalde taken versnelt door acties uit het verleden opnieuw af te spelen
- Gemaakte wijzigingen ongedaan maakt
Dit is een workshop voor beginners en ervaring is niet vereist. Breng gewoon je laptop mee waarop OpenRefine is voorgeïnstalleerd (installatie-instructies worden verstrekt). Lunch is inbegrepen!
Voor vragen kun je contact opnemen met Dr. Sreenithya Avadakkam, Interoperability Community Manager en Trainer, Universiteitsbibliotheek(s.avadakkam@vu.nl) of Agustin Medina, Research Data Steward (a.medina@vu.nl).