Verso un’archeologia 2.0

Read time: 14 mins

La riflessione sul tema degli open data archeologici è molto avanzata soprattutto nei Paesi anglosassoni – basti citare gli archivi Archaeological Data Service dell’Università di York e gli statunitensi tDAR o OpenContext (Kansa 2012; Kansa et al. 2011) – e in alcuni europei, come ben evidenziato dalla lista dei repositories raccomandati dal Journal of Open Archaeological Data, all’interno della quale è inserito anche il repository italiano MOD (Mappa Open Data), sebbene nel nostro Paese la riflessione sia ancora allo stadio preliminare.

Aprire i dati archeologici italiani: una questione culturale

In Italia, negli ultimi tempi, parlare di open data è diventato usuale ma i dati archeologici non circolano liberamente e un’Archeologia 2.0 italiana appare ancora una realtà piuttosto lontana. Quando parliamo di dati ci riferiamo sia ai raw data, ovvero a tutti i dati archeografici che sono alla base delle interpretazioni storico-archeologiche e che vengono prodotti nel corso di un’indagine, vale a dire a quella documentazione che, in molti casi, è tutto ciò che resta di un patrimonio che la stessa pratica archeologica concorre parzialmente a distruggere (Gattiglia 2009), sia ai dati frutto di elaborazioni prodotte nel corso di una ricerca. In linea generale, l’attività archeologica si distingue quasi sempre per essere un’attività di ricerca, in quanto produce dati unici e spesso (come nel caso dello scavo) non replicabili se non attraverso la continua possibilità di attingere ai dati grezzi, tramite i quali la comunità scientifica può ripercorre le tappe del processo interpretativo e formulare nuove ipotesi e ricostruzioni storiche. Se, infatti, le inferenze interpretative sono variabili spesso connesse al know how del singolo ricercatore, i dati sono invece punti certi, spesso inediti e/o scarsamente riutilizzati in altre ricerche.
Credere che i dati abbiano valore solo nel momento in cui vengono interpretati dall’autore dell’indagine è riduttivo, poiché non tiene conto della possibilità di attuare un ciclo ecologico che permetta di riutilizzarli per nuove ricerche (analisi distributive, spaziali ecc.) oppure per creare applicazioni diverse (percorsi turistici tematici, didattica per le scuole ecc.), senza togliere valore al lavoro originario, anzi accrescendone il potenziale informativo: si pensi a lavori di sintesi geografica o storica, a ricerche sulla diffusione di determinate classi di manufatti, tecniche e materiali edilizi oppure di elementi iconografici e architettonici; si pensi alla possibilità di formulare ipotesi di carattere locale lavorando però su basi statistiche attendibili perché prodotte utilizzando basi di dati molto ampie.
Se avere a disposizione una grande quantità di dati viene considerato utile, la decisione di condividerli in maniera aperta è essenzialmente una questione culturale prima che tecnologica.
La mancanza di una corretta conoscenza dell’argomento sembra uno degli elementi che concorrono a creare diffidenza, generando l’errata idea che il dato aperto sia un dato indifeso, alla mercé di qualunque tipo di manipolazione, tanto che circa un quarto degli archeologi1 pensa che gli open data non siano tutelati da licenze d’uso. È quindi elevato il timore di essere privati del risultato del proprio lavoro, che si traduce nel non rendere noti i dati, se non in forma molto generica e sommaria, fino al momento della pubblicazione integrale dei risultati della ricerca.

Di conseguenza per fare open data in Archeologia deve andare avanti, di pari passo, il riconoscimento della paternità intellettuale e dei connessi diritti d’autore di chi ha prodotto i dati, una paternità che non vuol dire proprietà ma corretta attribuzione come avviene per le pubblicazioni a stampa.

Gli archeologi, dunque, chiedono un diritto di prelazione sulla pubblicazione integrale dei dati (compreso tra 3 e 5 anni), senza però precludere la possibilità di pubblicazione e riuso dei dati grezzi in forma parziale prima dello scadere di tale diritto ma hanno una scarsa abitudine a condividere e a utilizzare dati in formato aperto, per una sostanziale mancanza di fiducia sull’affidabilità dei dati disponibili in rete. 


Cosa sono gli open data archeologici?

Da un punto di vista generale il dato aperto deve essere:
– completo ovvero esportabile e utilizzabile online e offline con le specifiche adottate;

– primario ovvero grezzo, in modo da essere integrabile e aggregabile con altre risorse digitali;

– tempestivo e accessibile: vi si deve accedere in maniera rapida e immediata, senza pagamenti o registrazioni, direttamente via Web;

– machine-readable ovvero processabile in automatico da computer;

– ricercabile e interamente riutilizzabile e integrabile per creare nuove risorse, applicazioni, programmi e servizi, anche per scopi commerciali. Inoltre deve essere rilasciato con licenze che rispecchino le caratteristiche descritte e che al massimo chiedano il riconoscimento della paternità del dato a titolo non oneroso. Infine tutte queste caratteristiche devono essere permanenti (Anichini, Gattiglia 2012: 51).


Dal punto di vista archeologico i dati grezzi sono tutti quelli non rielaborati in fase di post-processamento, compresa la documentazione fotografica.
I dati archeologici non sono quindi un set minimo di informazioni ma, come ritiene l’80% degli archeologi, l’intera documentazione archeografica: elenchi Unità Stratigrafiche (US), schede US, elenchi reperti, schede di quantificazione reperti, tabelle di periodizzazione, diagrammi stratigrafici, elenchi Attività, elenchi Unità Stratigrafiche Murarie (USM), schede USM, schede di archiviazione veloce (SAV), planimetrie, sezioni, rappresentazioni grafiche e fotografie, immagini, registrazioni audio e/o video, dati e/o informazioni organizzati in banca di dati, dati geografici, schede di ricognizione ecc., associati alla letteratura grigia (relazioni preliminari, report, diari di scavo, lettere e comunicazioni e altri testi contrari).

Falsi problemi, veri problemi

Il mondo archeologico ravvisa una serie di rischi insiti nell’apertura dei dati: alcuni veri, alcuni presunti. Oltre alla già citata possibilità di scorrettezze tra ricercatori e/o professionisti, si teme che i dati aperti comportino dei rischi per la tutela del patrimonio e diffondano informazioni inattendibili (figura 1).


Fig.1 Diverse tipologie dei rischi che si corrono ad aprire i dati secondo il 39% del campione che ha risposto che esistono dei rischi (Anichini 2013)

Per quanto gli archeologi si dicano preoccupati per la salvaguardia dei propri dati e ben il 75% ritenga necessario riconoscere la paternità intellettuale a chi li ha prodotti equiparandoli a una pubblicazione scientificamente riconosciuta, essi hanno scarsa conoscenza su come proteggere il proprio lavoro a parte tenerlo a lungo in un cassetto. La maggior parte non conosce l’esistenza e le differenze tra le varie licenze Creative Commons, non ha un’idea chiara di cosa sia un codice DOI (Digital Object Identifier) e di come identifichi in modo univoco e perenne l’autore (o gli autori) del lavoro pubblicato. È quindi necessario informare gli archeologi su come la rete non sia un luogo privo di tutele, sui diritti che le licenze, una volta applicate, garantiscono agli autori che pubblicano dati aperti sul Web, su come una comunità consapevole diventi essa stessa garante dell’uso dei dati accreditando chi da quell’uso riesce a trarre risultati innovativi che arricchiscono la disciplina e screditando chi vuole approfittarne scorrettamente: esattamente come avviene per le pubblicazioni a stampa.
Alle obiezioni sui rischi per la tutela dei beni archeologici, derivanti dal renderne pubblica la localizzazione, si può rispondere richiamando proprio una delle componenti intrinseche alla filosofia open: l’esteso controllo sociale che si viene a creare ogni volta che si porta a conoscenza della collettività un dato importante per tutti e che tutti possono concorrere a tutelare, rimarcando inoltre il fatto che un secolo di segretezza nella tutela dei beni archeologici non ha certo evitato gli scavi clandestini e il commercio criminale dei reperti archeologici.

Sul rischio di inattendibilità dei dati prodotti, sembra che la comunità archeologica diffidi della propria capacità di valutare l’affidabilità di una fonte con la quale non ha ancora dimestichezza. In realtà qualunque dato può essere più o meno affidabile, indipendentemente dalle modalità e dalla rapidità di pubblicazione. Solitamente un dato archeologico pubblicato a stampa assume un certo grado di affidabilità a seconda della credibilità del suo autore e dell’eventuale processo di peer review a cui è stato sottoposto; con gli open data, invece, la credibilità è determinata dalla possibilità di verificarne l’origine, ripercorrendo a ritroso il processo interpretativo.

La validazione passa, dunque, alla responsabilità di ogni singolo ricercatore rafforzando la ricerca e la revisione tra pari in un’ottica aperta e condivisa (open peer review).

Questo origina una certa preoccupazione tra gli archeologi, ancora poco avvezzi a una discussione aperta sui propri dati (e quindi sul proprio lavoro in termini di metodologia e risultati), e genera una certa ansia da prestazione per pubblicare dataset inappuntabili senza tener conto che, come è stato detto, “un dataset perfetto è un dataset sospetto”. Sulla difficoltà di apertura dei dati, assieme agli aspetti culturali, esistono inoltre delle questioni più profonde e tecniche (comunque superabili) che possono essere suddivise negli aspetti legali, in quelli di formato e nella preservazione del dato digitale.


Da un punto di vista legale, le consuetudini applicate risultano discordanti dalle norme sul diritto d’autore e sulla privacy, dal codice della proprietà industriale e dal codice dei beni culturali e visioni contrastanti, che probabilmente scaturiscono dall’assenza di standard, inseriscono nei dati grezzi elementi diversi da quella che può essere genericamente considerata la documentazione in campo archeologico. Pertanto, alla luce delle norme sul diritto d’autore (Ciurcuna 2013), per aventi diritto alla paternità intellettuale si devono intendere gli estensori della documentazione, indipendentemente da chi ha avuto la direzione scientifica dell’intervento e da chi lo ha finanziato, i quali, in quanto autori, dispongono del diritto d’autore sugli elaborati fatto salvo il caso in cui abbiano ceduto tale diritto.
La responsabilità scientifica dell’archeologo che redige la relazione di fine scavo, infatti, è sottolineata nelle “Valutazioni di Interesse Archeologico preventivo” ed esplicitata in generale nel DPR 207/2010 che sancisce il processo creativo proprio dell’interpretazione archeologica (Anichini et al. 2013, 145). Si pongono, comunque, questioni diverse per tipologie di prodotti diversi: per la compilazione delle schede di US, per esempio, rimane dubbio se sussista in ogni caso un diritto d’autore come pure per gli schizzi e le piante di US che si configurano più come schemi e spesso sono successivamente rielaborate da altri soggetti come planimetrie composite o vettorializzate. Un capitolo a parte è rappresentato dalla pubblicazione delle fotografie e riproduzione di beni culturali.

Per quanto l’archeologo possa essere l’autore materiale della riproduzione, ai sensi degli artt. 106 e sgg. del D.Lgs. 22 gennaio 2004 n. 42, egli è tenuto a chiedere al MiBACT – più precisamente alla Soprintendenza competente – l’autorizzazione alla pubblicazione della foto, poiché essa ritrae un bene culturale (Ciurcuna 2013). Per addentrarci nelle questioni tecnologiche partiamo dall’importanza dei formati. Un dato, per essere veramente open, dovrebbe essere disseminato attraverso un formato aperto che consenta all’utente di non utilizzare software proprietari.
Questo è sicuramente un passo difficile. Non essendosi mai posti il problema di condividere i dati, gli archeologi non si sono mai posti il problema di come crearli. Quindi, a parte pochi standard di catalogazione, non esistono neanche standard di formati. In pratica, emerge come l’assenza di chiare indicazioni ministeriali in merito a standard condivisi di redazione della documentazione di un intervento produca elaborati difformi per tipologia e per formati digitali. Per questo motivo oggi troviamo dati prodotti in formati diversi e moltissimi dati prodotti in formati testuali, quindi non machine readeble se non tramite trasformazioni o data mining.
È questa una lunga strada che solo partendo dal basso, cioè dall’apertura dei dati, può giungere a soluzioni condivise passando anche per soluzioni pragmatiche come l’utilizzo di formati di larga diffusione anche se proprietari. Per garantire un corretto utilizzo, una maggiore funzionalità e una migliore preservazione, i dati devono essere legati a metadati.
Diventa quindi essenziale che a ogni intervento/indagine archeologica siano associate tutte le informazioni inerenti l’intervento stesso, la produzione archeografica, la struttura e il formato dei dati digitali secondo uno schema che descriva la storia dell’indagine – argomento quanto mai importante perché permette di decrittare il background metodologico e di conoscenze all’interno del quale si è svolta l’indagine – le fonti utilizzate per la creazione dei dati, il metodo e la struttura dei dati e le relazioni con i dati fisici (Anichini et al. 2013: 143). attualmente molto economico, mentre creare contenuti di alta qualità e attivare strategie di preservazione atte a mantenerli sempre fruibili (ipoteticamente per un tempo infinito) è un lavoro costoso in termini di progettazione e adeguamento tecnologico delle infrastrutture e dei formati che si sposi con le evoluzioni di sistemi e supporti (Berman 2008).

Pubblicare dati si può!

Oggi il MOD (MAPPA Archaeological Open Data Archive) si pone come la prima (e unica) esperienza concreta di repository open data per l’Archeologia italiana (Anichini et al. 2013), basata su struttura informatica palesemente ispirata a quella dell’Archaeological Data Service. Il primo obiettivo del MOD è stato l’avvio di una riflessione – non più procrastinabile – che sensibilizzasse la comunità archeologica ai temi dell’open data (e dell’open access) per farne comprendere le opportunità scientifiche e professionali.
Per raggiungere tale obiettivo, è stato scelto deliberatamente di non percorrere la strada del dato aperto perfetto bensì di pubblicare i dati così come erano stati prodotti, indipendentemente dal loro tipo o formato, lasciando ai singoli autori la libertà di scegliere cosa pubblicare e in che modo, difendendo la paternità intellettuale con l’apposizione di un DOI e la possibilità di scegliere tra due differenti tipologie di licenze Creative Commons (CC-BY e CC-BY SA). In pratica a ogni archeologo è lasciata pertanto la facoltà di decidere come partecipare al processo di trasformazione verso l’Archeologia 2.0. 
La preferenza è per i dati archeografici, ma ciò non esclude che all’interno degli archivi possano essere presenti anche lavori di sintesi o apparati archeografici che non sono stati pubblicati in un’edizione a stampa (si veda per esempio lo scavo di Castel di Pietra, già edito ma integrato con la piattaforma GIS e il database delle schede US).
L’evoluzione del MOD avverrà con l’implementazione di un sistema di accounting, in cui gli utenti potranno accedere alla piattaforma attraverso parametri riservati ed eseguire direttamente l’upload degli archivi. Questo sviluppo conferirà all’applicazione un approccio maggiormente partecipativo e, in previsione, condurrà a un’importante accelerazione nella quantità degli archivi archeologici presenti e nell’interesse generale verso il MOD (Anichini et al. 2013).

Ma questi dati open a cosa servono?

Gli archeologi non sembrano avere ancora una reale consapevolezza delle potenzialità dei dati aperti. Chi già riutilizza i dati sembra farlo per lo più in modo tradizionale, più nell’accezione open access che open data, con la stessa modalità con la quale si utilizza una qualsiasi altra fonte bibliografica e non sfruttando la riprocessabilità dei dati, che infatti sono utilizzati principalmente per confronti e per analisi storiche o territoriali. Vengono usate in prevalenza relazioni, posizionamenti topografici, quantificazioni di reperti mobili, schedature e documentazione fotografica di reperti mobili.
Al netto di una certa mancanza di comprensione del fenomeno, il 57% degli archeologi sembrerebbe avere un atteggiamento positivo verso gli open data e considera la creazione di un archivio di dati archeologici aperti vantaggiosa per l’intera comunità archeologica (91%) (figura 2) per facilitare e ampliare la tutela (74%), per agevolare il lavoro dei ricercatori (83%), degli archeologi professionisti (78%), dei funzionari MiBACT (64%), per incentivare una produzione di dati qualitativamente più elevata (61%).




Gli open data, quindi, servono, ma sono ancora un mondo tutto da scoprire. Perché ciò avvenga, è necessario che gli archeologi vedano nella condivisione aperta delle informazioni il vero volano della conoscenza e dello sviluppo della ricerca, della tutela, di un nuovo e più ampio concetto di cultura del patrimonio archeologico e di un ritorno possibile in termini economici. La condivisione aperta può portare all’innalzamento degli standard qualitativi della produzione archeologica e, grazie alla verifica diretta, la comunità archeologica contribuirà a definire progressivamente i livelli minimi di standard determinando allo stesso tempo la credibilità o meno dei dati. Avere dati a disposizione migliorerà il lavoro degli archeologi professionisti consentendo loro di reperire con facilità i dati necessari all’archeologia preventiva (VIArch).
I dati aperti diventeranno uno strumento di tutela – attraverso nuove strategie che facciano sentire il cittadino partecipe della protezione del suo patrimonio storico/archeologico – e non il suo contrario perché l’ampia condivisione, in una comunità proiettata verso l’idea di patrimonio storico archeologico come bene comune, diventa progressivamente garanzia di controllo, di qualità, di conservazione.
Gli open data archeologici possono gettare basi concrete per aprire, anche in Archeologia, la strada del crowdsourcing, sia come modello di business, laddove può essere adottato come modalità di gestione di servizi, sia (e soprattutto) come nuova mentalità di lavoro nell’attività della pubblica amministrazione, con particolare riguardo agli ambiti legati alla ricerca.
La condivisione dei dati è una delle poche strade oggi percorribili per far progredire le conoscenze, senza dover sostenere costi proibitivi, ottimizzando – in un’ottica di Archeologia sostenibile – l’utilizzo di quella mole di dati che quotidianamente vengono prodotti e rimangono sottoimpiegati, anche grazie lo sviluppo in direzione dei Linked Open Data verso cui le ultime posizioni assunte dal MiBACT fanno sperare si stia andando. Questo circuito virtuoso permetterà di disporre di una grande massa di dati, proiettando l’Archeologia nel campo dei Big Data che si configurano come evoluzione della pratica di analisi archeologica, aprendo prospettive inimmaginabili quali l’analisi immediata delle distribuzioni dei reperti e dei flussi commerciali del passato.
Infine gli open data archeologici sono un investimento ad alta redditività: come ha dimostrato una ricerca inglese (Beagrie, Houghton 2013), negli ultimi 30 anni ogni sterlina investita in open data ne ha restituite 8,3! 
È quindi essenziale affrettarsi su questa strada evitando di auto-rallentarci nell’attesa di trovare, formalmente, la soluzione perfetta quando sappiamo che la tecnologia e il Web hanno tempi di reazione, aggiornamento, inserimento di nuove modalità estremamente veloci.

FRANCESCA ANICHINI, GABRIELE GATTIGLIA

 

Bibliografia
-Anichini F., “Mappa survey: gli open data nell’Archeologia italiana”, in Anichini F., Dubbini N., Fabiani F., Gattiglia G., Gualandi M.L., MAPPA. Metodologie applicate alla predittività del potenziale archeologico, vol. II: 121-132, doi: 10.4458/0917-08, 2013.
-Anichini F., Ciurcina M., Noti V., “Il MOD: l’archivio Open Data dell’Archeologia italiana”, in Anichini F., Dubbini N., Fabiani F., Gattiglia G., Gualandi M.L., MAPPA. Metodologie Applicate alla Predittività del Potenziale Archeologico, vol. II: 133-160, doi: 10.4458/0917-09, 2013.
-Anichini F., Gattiglia G., “#MappaOpenData. From Web to society. Archaeological open data testing”, in Gualandi M.L., MapPapers 2, 2012: 53, doi: 10.4456/ MAPPA.2012.05, 2012.
-Beagrie N., Houghton J., “The Value And Impact Of The Archaeology Data Service. A Study And Methods For Enhancing Sustainability”. Final Report, September 2013, http://repository.jisc.ac.uk/5509/1/ADSReport_final.pdf. Berman F., “Got data?: a guide to data preservation in the information age”, in Communications of the ACM, 51 (12): 50-56, 2008.
-Ciurcina M., “Parere legale sul portale Mappa Open Data”, in MapPapers, 4, 2013: 87-106, doi: 10.4456/MAPPA.2013.76, 2013.
-Gattiglia G., “Open digital archives in Archeologia. Good practice”, in Archeologia e Calcolatori, 20, suppl. 2: 49-63, 2009.
-Kansa E., “Openness and archaeology’s information ecosystem”, in World Archaeology, 44 (4): 498-520, 2012.
-Kansa E., Kansa S.W., Kattrall E., Archaeology 2.0: New Approaches to Communication and Collaboration, Cotsen Digital Archaology Series, UCLA, 2011.
Sitografia
-Archaeological Data Service http://archaeologydataservice.ac.uk/
-Journal of Archaeological Open Data http://openarchaeologydata.metajnl.com/
-Mappa Open Data http://www.mappaproject.org/mod
-Open Context http://opencontext.org/
-tDAR http://www.tdar.org/

Tratto da Scienza & società - Open Science Open Data

altri articoli

Europe health saved by welfare

Peace Love Doctor, Bansky. Credit: Thomas Hawk / Flickr. Licenza: CC BY-NC 2.0.

Mortality trends in Europe have been decreasing in recent years, differently from what happened in the United States with the rise in the so-called “deaths of despair” among low educated middle-aged white Americans. Most of all, such trends in Europe show no interruptions due to the economic crisis. This is the conclusion of a study published on PNAS by LIFEPATH, a project funded by the European Commission, which investigates the biological pathways underlying social differences in healthy ageing.