OpenRefine

OpenRefine

E’ un tool stand-alone che consente di correggere, pulire e trasformare delle tabelle di dati; inizialmente acquisito da Google col nome di Google Refine, poi nel 2012 è stato rilasciato e affidato alla comunità open-source (su Github: OpenRefine/OpenRefine) che lo ha richiamato appunto OpenRefine. Realizzato come applicazione web, va in esecuzione nel browser, mai i dati trattati rimangono comunque nel vostro sistema locale.

Chi lavora con i dati, compresi quelli geografici, sa bene che la possibilità di avere dei dati “sporchi” per diversi motivi: nel formato, nei valori, nella suddivisione in colonne, nella sintassi, … etc, è una eventualità molto frequente. Grazie a OpenRefine sono possibili diverse operazioni che consentono di ripulire i dati, oppure di confezionarli nel formato che ci fa comodo.

E possibile leggere ed importare dati nei formati più diffusi: CSV, Excel, XML, JSON, … etc; ma è anche possibile caricare un semplice testo e poi, adoperando le funzioni previste, formattarlo in colonne nella maniera più appropriata. I dati elaborati e ripuliti possono poi essere esportati nei formati: TSV, CSV, Excel e HTML.

OpenRefine GUI

L’applicativo ha l’aspetto di un “foglio di calcolo”, ma le possibilità che offre per sistemare i dati caricati, sono molto più versatili di quelle che troviamo in prodotti come Excel o equivalenti open-source (Calc di OpenOffice e LibreOffice).

Per esempio OpenRefine consente di filtrare righe e/o colonne secondo determinati criteri (faceting) e poi applicare le regole di correzione soltanto sui dati presenti in queste celle. Oppure, a differenza di un normale foglio di calcolo, le formule non sono registrate nelle singole celle, ma vengono definite globalmente e utilizzate per effettuare delle correzioni o dei calcoli quando è dove si vuole.

La possibilità di salvare un progetto consente di definire un insieme di passaggi per sistemare dei dati  e poterli applicare ripetutamente a file dati differenti con problemi simili.

Come abbiamo detto, OpenRefine è eseguito sul browser, ma non è un servizio cloud (SAAS), infatti si installa come una normale applicazione desktop  scaricando i sorgenti che sono disponibili per i diversi sistemi (Windows, Linux, Mac OS).

La documentazione su come usare OpenRefine è molto ricca; oltre alla sua pagina Wiki, su Internet si possono trovare tanti tutorial ed è stato pubblicato anche un libro: Using OpenRefine.

URL: openrefine.org

 

 

condividi: