Retrodatatore Automatico del Lessico Italiano Postunitario
ideato e realizzato da GIANLUCA BIASCI
 
HomeChe cos'è il RALIPIstruzioniFontiChi ha fatto il RALIPContatti


Istruzioni

Cliccando sul pulsante "Ricerca retrodatazioni" disponibile in ogni pagina, si accede allo spazio dedicato all'inserimento del testo e alle impostazioni del sistema.

PAGINA DEL TESTO E DELLE IMPOSTAZIONI

La pagina si compone essenzialmente di un'area di testo nella quale inserire il documento da sottoporre al RALIP e di una serie di menu a tendina e caselle di spunta per raffinare i termini della ricerca e specificare le modalità desiderate per la visualizzazione dei risultati.

INSERIMENTO DEL TESTO. Il testo nel quale si intendono cercare le retrodatazioni va inserito nell'apposita area costituita da un rettangolo inizialmente vuoto. Le modalità attraverso cui il sistema può acquisire un testo sono essenzialmente due: il semplice inserimento manuale per mezzo della dattiloscrittura e il copia-incolla di testi già posseduti in formato elettronico dall'utente. Questi ultimi, a loro volta, possono provenire da molteplici fonti, per esempio dalla scansione di un documento cartaceo come anche dai numerosi siti che su Internet mettono a disposizione testi di cui sia noto l'anno di composizione, tanto gratuitamente quanto a pagamento (basti pensare agli archivi storici della stampa periodica o agli innumerevoli testi letterari disponibili on-line). Il sistema non fa differenza tra i vari programmi di videoscrittura né fra i vari editor, accettandoli tutti (purché sia possibile effettuare il copia-incolla) ma obliterando le formattazioni presenti di solito nei sistemi evoluti.
Il comando "cancella", visibile in basso a sinistra rispetto all'area di inserimento, consente di eliminare il testo immesso in precedenza.

Dimensioni minime e massime consentite per l'inserimento di un testo. L'area di testo del RALIP accetta documenti costituiti da un numero di caratteri compreso fra 100 e 500.000, il che equivale alla possibilità di sottoporre alla ricerca con un solo inserimento un intero romanzo di medie dimensioni, come Cuore di De Amicis o Il fu Mattia Pascal di Pirandello.
Qualora il testo immesso superi la dimensione massima consentita, agendo sul pulsante di avviamento della ricerca un messaggio avvertirà dell'impossibilità di procedere, suggerendo all'utente un taglio automatico del testo (il taglio avviene al carattere non alfanumerico immediatamente precedente al limite permesso) per farlo rientrare nelle dimensioni consentite. Accettando il taglio, l'utente potrà avviare la ricerca; rifiutandolo, dovrà egli stesso ridimensionare manualmente il testo e procedere a un ulteriore tentativo di inserimento.

OSSERVAZIONE. A causa di peculiari modalità di calcolo, che riguardano soprattutto gli "accapo", il programma sovrastima mediamente del 3-4% il conteggio dei caratteri di un testo rispetto al computo effettuato dai più diffusi dai programmi di videoscrittura.

IMPOSTAZIONE DEI TERMINI DELLA RICERCA E DELLA VISUALIZZAZIONE DEI RISULTATI. Alla destra della casella di testo compaiono tre box, il primo dei quali contiene comandi che consentono di impostare i termini della ricerca, mentre gli altri due riguardano le modalità di visualizzazione dei risultati.
Nel box superiore sono elencati i sottodizionari in cui è diviso il lemmario del RALIP, ognuno dei quali può essere selezionato per la ricerca in corso; solo il dizionario base è sempre attivo e non è deselezionabile, data la sua importanza nella funzione di ricerca delle retrodatazioni (vedi qui la descrizione dei singoli sottodizionari).

SUGGERIMENTO. Per limitare l'affollamento di "falsi positivi" nei risultati, si consiglia di selezionare i sottodizionari altri omografi e frequenti solo se strettamente necessario: in tal caso è utile impostare sottodizionario come prima opzione nel menu a tendina dell'ordinamento dei risultati (vedi anche il successivo "suggerimento").

Nel box centrale due menu a tendina richiedono all'utente di specificare quanti caratteri del contesto dovranno essere eventualmente mostrati a sinistra e a destra della forma che il programma ha indicato come virtualmente retrodatabile.
Il box inferiore consente di precisare le modalità di ordinamento dei risultati attraverso l'uso combinato di due menu a tendina (vedi qui la descrizione delle singole voci dei menu). In caso di mancata selezione, il sistema presenta l'elenco delle forme retrodatabili nell'ordine in cui esse compaiono all'interno del testo immesso.

SUGGERIMENTO. Un buon ordinamento dei risultati, che consenta di raggruppare efficacemente per blocchi i "falsi positivi" che inevitabilmente compariranno, si ottiene selezionando prima sottodizionario e poi lemma. In tal modo sarà più agevole, scorrendo l'elenco dei risultati, ignorare le righe non pertinenti.

Inferiormente alla casella di testo, in posizione centrale, un ultimo menu a tendina richiederà all'utente di specificare la datazione del testo immesso. Si tratta dell'unica impostazione davvero obbligatoria del RALIP - a sottolineare l'ovvia importanza del dato cronologico in un programma di retrodatazioni -, in mancanza della quale la procedura di ricerca non si avvia. A destra della tendina di datazione, due pulsanti di scelta consentono di escludere (scelta predefinita) o includere nei risultati i lemmi attestati per la prima volta nell'anno indicato. Per fare un esempio, immettendo un testo del 1907 e lasciando la scelta "escluso", il sistema restituirà i lemmi documentati a partire dal 1908; selezionando "incluso", nei risultati appariranno anche gli eventuali lemmi datati 1907.
Per l'anno più recente l'unica scelta possibile è "incluso".

A questo punto, terminata la fase di impostazione, si può cliccare sul pulsante "avvia la ricerca".

ELABORAZIONE DEI DATI. Il tempo di elaborazione della richiesta dell'utente varia in funzione dei termini di ricerca impostati. I due parametri che più condizionano i tempi di attesa sono la lunghezza del testo immesso e la datazione impostata; quasi nullo è il peso degli altri fattori non informatici. Gli aspetti informatici invece - caratteristiche del computer, velocità e capacità della connessione, ecc. - possono influenzare sensibilmente la rapidità di caricamento della pagina dei risultati. Disponendo di tecnologie recenti, nella maggior parte dei casi il sistema riesce a restituire i risultati nel giro di qualche secondo. Nel caso più oneroso, quello di un testo prossimo al limite dei 500.000 caratteri consentiti e con una datazione "alta" (1861 o anni immediatamente successivi), può essere necessario attendere fino a un paio di minuti; dopo tale periodo, se si nota una sostanziale immobilità della barra di avanzamento (caricamento della pagina), è opportuno ripetere le operazioni di inserimento del testo e di impostazione dei termini di ricerca.

PAGINA DEI RISULTATI

VISUALIZZAZIONE DEI RISULTATI. La struttura della pagina dei risultati è volutamente semplice; per ogni retrodatazione virtuale trovata dal sistema viene fornita la relativa forma seguita da altre indicazioni, secondo questo schema:

  1. forma a testo e contesto: la mono o polirematica (comprese forme flesse e varianti) che il sistema ha ritenuto retrodatabile sulla scorta dei dizionari selezionati, e l'eventuale contesto allargato al numero di caratteri impostato dall'utente;

  2. lemma: la parola-base a cui può essere riportata la forma a testo, così come viene lemmatizzata nelle fonti di riferimento del RALIP;

  3. sottodizionario: il sottocorpus predefinito (base) o selezionato dall'utente (omografi privilegiati, altri omografi, ecc.) al quale si riferisce il lemma in oggetto o un suo significato;

  4. anno: la data della più antica prima attestazione fra quelle indicate nei testi assunti a fonti di riferimento;

  5. fonte (in sigla): il repertorio o lo studio da cui sono tratti i dati forniti nei punti b e d.

SUGGERIMENTO. Nonostante la cura posta nella realizzazione del RALIP, è imprescindibile verificare sempre l'esattezza delle datazioni direttamente sulle fonti lessicografiche, in particolare per quanto riguarda opere vaste come il DELI e il GRADIT.

RIPRODUZIONE DEL TESTO INSERITO. In calce all'elenco dei risultati della ricerca, all'interno di un box viene riprodotto per intero il testo immesso. Su di esso, senza dover aprire un altro documento, è possibile fruire delle funzioni consentite dal proprio browser, per esempio la funzione "trova", utile per visualizzare una forma a testo inserita in un contesto più ampio di quello massimo consentito dal sistema, o per individuare in quale suddivisione del testo (paragrafo, capitolo, ecc.) sia collocata una determinata forma.
Nel caso di un testo superiore ai 500.000 caratteri che il sistema ha tagliato automaticamente, la riproduzione permette di individuare il punto in cui è stato operato il taglio a partire dal quale l'utente potrà immettere la successiva porzione di testo.

OSSERVAZIONE. L'intero sito è ottimizzato per Internet Explorer, Microsoft Edge, Mozilla Firefox, Google Chrome. Visualizzando il RALIP con altro browser, si potrebbero verificare problemi di disallineamento del testo o altre incompatibilità.