Codifica elettronica dei testi letterari ed e-book:
la marcatura XML TEI ed il trattamento informatico del romanzo Baltico di Matteo Collura

I.2. CODIFICA INFORMATICA DEI TESTI

Dobbiamo a Fabio Ciotti una delle più complete ed esaustive definizioni di codifica informatica dei testi. Secondo lo studioso con codifica informatica dei testi intendiamo la rappresentazione formale di un testo ad un qualche livello descrittivo, su di un supporto digitale, in un formato utilizzabile da un elaboratore (Machine Readable Form) mediante un opportuno linguaggio informatico[4].

Come giustamente nota Ciotti ogni testo può esser considerato da vari punti di vista, da una parte vi è la componente materiale: il supporto, le tracce d'inchiostro; dall'altra vi è una componente astratta, la sequenza verbale, la quale a sua volta genera una serie di livelli semantici e strutturali.

Con la codifica elettronica si fanno passare i testi dal mondo degli atomi a quello dei bit, con tutto ciò che questo comporta , soprattutto in termini di fruizione ed elaborazione; tuttavia si ha anche il passaggio da un codice ad un altro: "Si tratta dunque di un processo rappresentazionale che implica una serie di operazioni di selezione e classificazione degli elementi rilevanti in funzione di un determinato punto di vista"[5] . A proposito di questo, ben si è espresso uno dei pionieri dell'informatica umanistica in Italia, Giuseppe Gigliozzi: "Codificare un testo significa[...] esplorare il codice di partenza. Studiarne regolarità e funzioni. Confrontarle con le costrizioni proprie del codice prescelto e riproporre le relazioni (che sono già in un codice) del testo originale nel nuovo codice che, nel nostro caso, dovrà essere utilizzabile per un'elaborazione elettronica,[...] Lavoreremo, quindi con due codici: il codice del documento da cui muoviamo e il codice che renderà questo documento disponibile per un'elaborazione elettronica"[6].

Sempre secondo Gigliozzi col processo di codifica si realizza anche un modello dell'oggetto testo, modello che può essere qualcosa di "più piccolo del testo" e, vorrei aggiunger io, qualcosa di "più grande", ossia contenere, o meglio esplicitare, informazioni in più rispetto al testo originario; in ogni caso, come afferma Gigliozzi, è bene tener presente la necessità che il modello rispetti "le leggi dell'isomorfismo. Dove per isomorfismo potremmo intendere una trasformazione che conservi l'informazione"[7].

Alla luce di tutto ciò più chiara dovrebbe apparire la definizione di codifica come rappresentazione formale di un testo ad un qualche livello descrittivo ed in virtù di quanto detto si può ben comprendere come la codifica possa esser vista anche come un'attività interpretativa , che comporta scelte e valutazioni da parte del codificatore, che non è un mero trascrittore del testo, ma può, per certi versi, esser visto come un traduttore che traspone il testo in una forma che ne consenta l'analisi con mezzi informatici, e possa eventualmente permettere nuove forme di fruizione.


[4] Cfr. Fabio Ciotti, Cosa è la codifica informatica dei testi, in AA.VV., Atti del Convegno Umanesimo & Informatica (Trento 24-25 maggio 1996), a cura di Daniela Gruber e Patrick Pauletto.
<http://circe.lett.unitn.it/circe/[...]/ciotti.pdf>
(24 settembre 2003)
[5] Vedi nota precedente.
[6] Cfr. Giuseppe Gigliozzi , Il testo e il computer. Manuale di informatica per studi letterari, Milano, Bruno Mondadori, 1997, p. 56.
[7] Cfr. Gigliozzi Il testo e il computer. Manuale di informatica per studi letterari, (vedi n.3) p.59.
<DigiSic />
[ AccessKey: Top=T Precedente=Z Successiva=C Indice=X?]