Tito Orlandi, Università di Roma La Sapienza

Edizione digitale di Niccolò Machiavelli, De principatibus

Ms. D. Sistema lessicale

 

Il sistema lessicale è quello secondo cui sono organizzati gli elementi lessicali che costituiscono la parte del “dizionario” nella competenza linguistica dell'autore di D, altre parti essendo p.es. la “grammatica” o lo “stile”. Consideriamo elementi lessicali quelli che si desume l'autore sentisse come tali, a giudicare prima di tutto dall'uso del grafo “spazio”. Poiché d'altra parte questo uso non è del tutto coerente, occorre l'intervento del giudizio soggettivo dell'editore, che è anche richiesto per identificare i singoli elementi lessicali di là dalle diverse ortografie.

Sono partito da un elenco/tabella dati brutale delle unità (sequenze grafematiche) comprese fra “spazi”, e ho apportato le necessarie modifiche, ancora una volta assumendo quelle decisioni soggettive che costituiscono dei passaggi obbligati nel processo di edizione. Si noterà comunque che tutte le decisioni sono dichiarate, e inoltre possono essere soggette a revisione senza che la procedura ne soffra in quanto tale.

Le decisioni concernono (confronta i numeri posti nel secondo campo della tabella):

  • 01 - divisione di lessemi
  • 02 - interpretazione di grafemi allusivi
  • 03 - correzioni
  • 04 - casi particolari

Oltre a questi casi critici, diventano evidenti, a questo punto della procedura, casi che richiedono maggiore riflessione. E in particolare:

  • Quella che si può presumere l'autore stesso considerasse come un'unica unità lessicale, appare rappresentata da diverse sequenze grafiche.

  • Un'identica sequenza grafica può rappresentare quelle che si può presumere l'autore stesso considerasse diverse unità lessicali.

Questo significa che occorre identificare le unità lessicali indipendentemente dalle sequenze grafiche. In concreto, si tratta di costruire una banca dati in cui ad un identificativo “fisso” siano associate tutte le differenti sequenze grafiche utilizzate per esprimere quella forma lessicale, assegnando naturalmente identificativi diversi a unità lessicali pur omografe. Tale identificativo potrebbe essere semplicmente un numero, secondo uno schema di questo tipo:

01361 | abassar | abassare | abbassar | ...
10398 | accepta | ...
10399 | accepta | ...
10400 | accepta | ...
10401 | accepta | ...

ovvero:

01361 | abassar
01361 | abassare
01361 | abbassar
10398 | accepta
10399 | accepta
10400 | accepta
10401 | accepta ...

In seguito ad alcuni esperimenti, mi sono convinto che valeva la pena di espandere questo passaggio in modo da comprendere in esso anche l'inizio dei procedimenti di lemmatizzazione, di disambiguazione, e di assegnazione delle funzioni sintattiche (parti del discorso). Infatti questo passaggio consiglia comunque l'uso di un dizionario di macchina, che viene concepito per tutti quei compiti, e dunque tanto vale farlo funzionare in tutte le sue capacità.

Inoltre era conveniente assegnare, oltre che un numero, una forma “standard moderna”, desunta dal dizionario all'origine del dizionario di macchina (in questo caso il Sabatini-Coletti), purché sia chiaro che questo non ha alcun altro scopo che una maggiore facilità di riferimento.

Il risultato è una tabella che rappresenta il sistema lessicale dell'autore di D, in parte ridondante, in quanto non è detto che i casi omografici moderni corrispondano in tutto a quelli dell'autore.