Banche dati testuali e Biblioteche digitali

Negli ultimi due decenni sono stati avviati trasferimenti sistematici di testi in formato digitale. In una prima fase sono state allestite soprattutto banche dati testuali che riproducono in formati diversi (nei casi migliori con codifiche che rispondano ai requisiti degli standard internazionali di codifica) i testi ricavati da edizioni recenti o meno recenti. In una seconda fase, ora in piena espansione, biblioteche o altri enti hanno proceduto alla riproduzione fotografica in formato digitale di edizioni a stampa (in particolare quelle antiche e non coperte da diritti) e di manoscritti. Le banche dati testuali consentono di compiere sui testi complesse operazioni di ricerca, mentre le biblioteche digitali dànno un accesso a testi normalmente raggiungibili e consultabili con una certa difficoltà. Le banche dati testuali possono essere disponibili in rete o su cd-rom, mentre le biblioteche digitali sono normalmente consultabili attraverso il web. Quando si utilizzano banche dati testuali si deve sempre verificare con attenzione da quali edizioni sono ricavati i testi trasformati in formato digitale. La facile disponibilità non coincide sempre con l’affidabilità.


Banche dati testuali disponibili online
(raccolte principali)

Corpus OVI [Opera del Vocabolario Italiano] dell’Italiano antico, Corpus TLIO – Tesoro della Lingua Italiana delle Origini, e altri corpora, a partire <http://gattoweb.ovi.cnr.it/>.
«L’OVI elabora e pubblica in rete il Tesoro della Lingua Italiana delle Origini (TLIO), che è la parte antica del Vocabolario Storico Italiano, e la Banca Dati dell'Italiano Antico». «Il corpus testuale del Tesoro della Lingua Italiana delle Origini è la maggiore base di dati oggi disponibile riguardante la lingua italiana anteriore al 1375. Articolato in tre databases, contiene attualmente 2316 testi per 23.097.862 parole (occorrenze) nel Corpus OVI dell'Italiano antico; 2000 testi per 21.856.907 occorrenze costituiscono il Corpus TLIO, che è la parte lemmatizzata che serve di base al vocabolario, mentre il Corpus TLIO aggiuntivo, non lemmatizzato, raccoglie 316 testi per 1.240.955 occorrenze».

BibIt. Biblioteca Italiana, promossa dal “Centro interuniversitario Biblioteca italiana telematica” (CIBIT) e dall’Università degli Studi di Roma “La Sapienza”: <http://www.bibliotecaitaliana.it/>. Consente interrogazioni anche su grandi insiemi di testi, anche se alcune funzioni non sono soddisfacenti (se si chiede ad esempio di cercare i luoghi dove compare la stringa anima, il motore non trova le occorrenza di l’anima). Contiene circa 1700 testi, e costituisce la più grande biblioteca digitale di testi della tradizione italiana. Può essere usata anche per una prima lettura di testi di difficile reperibilità. Se ne veda la Presentazione.

Liber Liber, <http://www.liberliber.it/biblioteca/index.htm>. Grande magazzino di testi scaricabili in vari formati (rtf, txt, html, pdf), di grande utilità. Non offre possibilità di consultazione on line, ma mette a disposizioni testi in formati immediatamente utilizzabili e trasformabili.

Duecento: la poesia italiana dalle origini a Dante, <http://www.silab.it/frox/200/>.

Biblioteca del Classici italiani, di Giuseppi Bonghi da Lucera, <http://www.classicitaliani.it/>. Sito amatoriale con testi e materiali utili e in alcuni casi rari. I materiali didattici sono da utilizzare con cautela e senso critico.


Banche dati testuali su cd-rom
(solo con OS Windows)
Il cd-rom è un supporto obsoleto e poco sicuro, ma che è stato impiegato a lungo e che ancora viene utilizzato per strumenti scientificamente rilevanti. Non viene quasi più utilizzato per banche date testuali, ma alcune delle maggiori e delle più funzionali sono tuttora disponibili solo in cd-rom attualmente non più in commercio.

LIZ. Letteratura italiana Zanichelli, a cura di Pasquale Stoppelli ed Eugenio Picchi, 1993, e edizioni successive, Bologna, Zanichelli (LIZ 4, 2001, con 1000 opere interrogabili).

Archivio Italiano, Roma, Lexis, in cd-rom

1) ATL. Archivio della tradizione lirica da Petrarca a Marino, a cura di Amedeo Quondam, 1997.
2) Francesco Petrarca, Tutte le opere, a cura di Pasquale Stoppelli, 1997.
3) Torquato Tasso, Tutte le opere, a cura di Amedeo Quondam, 1997.
4) Giacomo Leopardi, Tutte le opere, a cura di Lucio Felici, 1998.
5) I commenti danteschi dei secoli XIV, XV e XVI, a cura di Paolo Procaccioli, 1999.

Per consultare le banche dati della Lexis rivolgersi a Simone Albonico.

Seguici:        
Condividere: