Sei in home progetti GIOCOnDa Modelli di produzione dati

Modelli di produzione dati

Questo WP si occupa di come strutturare i dati allo scopo di renderli aperti e interoperabili secondo formati e tecnologie standard. Si occupa anche di sviluppare strumenti organizzativi e tecnologici per la loro rappresentazione ed accesso. Da un punto di vista tecnico il processo a cui sono tipicamente sottoposti i dati può essere riassunto nella seguente figura. I dati prodotti (data production), trasformati ed esposti in un formato aperto, sono elaborati e/o aggregati (data processing) per poter essere successivamente “consumati” (data use). Nel settore turistico, per esempio, i dati possono provenire dalla pubblica amministrazione, dagli enti turistici, dai gestori di servizi, dai turisti stessi o dai cittadini; possono essere elaborati e collegati per sviluppare poi applicazioni per usi diversi da parte di questi stessi utenti finali. Il WP 4 copre gli aspetti di esposizione dei dati in formato aperto ed è strettamente collegato a tutti gli altri WP. In particolare, con il WP3 e WP6 per l’analisi dei bisogni sulla situazione esistente volta a comprendere quali dati sono disponibili e per quali necessità; con il WP5 riguardo a quali e come sono usati negli scenari di sperimentazione; con il WP7 sugli impatti per il feedback su come i dati sono usati mediante metriche. Per il processo di produzione ed elaborazione verrà definito un ciclo procedurale che una volta messo in atto da parte dei data provider permetta di gestire e garantire in modo uniforme la creazione e la fornitura dei dati utili ai fini del progetto. Per beneficiare a pieno dell’Open Data è cruciale mettere i dati in un formato che consenta di creare nuova conoscenza e fornire nuovi servizi e applicazioni. Gli open data, seguendo il modello a 5 stelle (5stardata.info/en/) descritto da Tim Berners-Lee, possono essere rappresentati in 5 diversi livelli: formati non strutturati, formati strutturati proprietari, formati strutturati non proprietari, formato RDF, formato RDFcon link ad altre risorse. Quest’ultimo formato è quello su cui si basa il Linked Open Data e che offre i maggiori benefici tra cui il principale è l'interoperabilità. In questo progetto si cercherà di esporre dati in formati di livello 3 o superiori, sulla base di tecnologie standard come RDF(S), OWL e SPARQL. Con dati di questo livello è possibile una fase di analisi di relazioni semantiche basata su strumenti automatici e non: di link discovery, per dedurre nuove informazioni collegando risorse da due dataset e di ontology matching, per dedurre corrispondenze (mapping) tra due vocabolari diversi. Questi metodi portano un alto valore aggiunto ai dati contribuendo ad un numero maggiore di relazioni semantiche tra di essi. Per garantire la credibilità (qualità) dei dati che verranno aperti e la loro ri-usabilità, è necessario raccogliere e gestire informazioni sulla loro provenienza, dalle origini a eventuali trasformazioni prima dell’esposizione finale. Vocabolari e standard esistenti (e.g. PROV ontology di W3C) sono considerati in questo passo. Ogni dataset di dati aperti ha una parte di metadati che riguarda la loro licenza d’uso. È necessario dare supporto alla gestione delle licenze con policy definite, in particolare se si integrano dati da fonti diverse e da paesi diversi. Licenze tipicamente utilizzate sono Creative Commons, Open Data Commons, e loro derivati compatibili (e.g. Open Government License in UK). In particolare il WP 4 comprende le seguenti attività: • 4.1 selezione/identificazione e analisi dei dati • 4.2 esposizione/pubblicazione dei dati • 4.3 creazione un’infrastruttura tecnologica • 4.4 definizione di linee guida comuni In fase di rimodulazione apportata riduzione del budget su spese di personale e consulenza di Regione Lombardia senza incidere sull'attività e riduzione budget Prov BS e FBK attività 4.2;