torna a Colfis
torna a Criteri di Lemmatizzazione
NOMI PROPRI
Nell'ambito di questa categoria ci siamo discostati abbastanza radicalmente dalle scelte del LIP. Il lemmatizzatore distingueva:
E = nome proprio di persona, prenome (Es. Daniela, Alessandro)
F = cognome
L = Nome proprio geografico (città, nazioni...)
D = Nome proprio di ditta
Nel LIP inoltre esiste una categoria N = Nome proprio non meglio specificato, che comprende nomi propri vari, esclusi antroponimi e toponimi. Anche solo osservando per campioni ciò che è classificato N nel LIP, appare evidente che le parole classificabili come nomi propri vanno al di là di quelle tradizionalmente assegnabili ai due settori dell'antroponomastica e della toponomastica.
Si è pertanto deciso di creare una categoria NOME PROPRIO (che accogliesse tutti i tipi di nomi propri incontrati nei testi, senza ulteriormente distinguere tra Nomi, Cognomi, Toponimi, Ditte e altro). Quindi, con programmi opportunamente scritti, abbiamo trasformato nel primo output del lemmatizzatore tutti i diversi tipi di nome proprio riconosciuti dal lemmatizzatore come Nomi personali, Cognomi, Toponimi o Ditte in Nomi, ovvero nome proprio. Questo ha permesso di aggirare spinosi problemi, come quello di classificare nomi di persona appartenenti ad altre tradizioni onomastiche; ad esempio, Marco Tullio Cicerone, Giulio Cesare, Mao Tse-tung (dove Mao è il cognome!), ecc.
Anche i soprannomi sono stati inseriti nell'unica categoria Nome proprio.
Nelle INIZIALI DI NOMI PROPRI puntate, per es. G.C., si è ritenuto che il punto facesse parte dell'abbreviazione e quindi non andasse lemmatizzato come punteggiatura (come fa il lemmatizzatore).
Si elencano di seguito altri casi classificati come Nomi propri (E).
1. Nomi geografici
Rientrano in questa categoria luoghi in senso lato:
- edifici e monumenti (es. il Pantheon, la Scala)
- strade (es. Nomentana, Tiburtina)
- quartieri (es. Tiburtino)
- città e paesi
- nazioni
- continenti
- pianeti
- stelle
- mari, oceani
- laghi
- fiumi
- montagne
Sono stati trattati come Nomi propri anche nomi del tipo abitare nel bergamasco, trevigiano, vicentino, modenese ecc.; Non sono stati considerati nomi propri meridione e mezzogiorno nel senso de il sud; il caso Unione Europea (e la sua sigla UE) è stato considerato nome proprio sintagmatico, mentre sono stati sono considerati Sostantivi i casi unione monetaria e unione monetaria europea; è stato considerato nome proprio anche Belpaese per Italia.
2. Nomi commerciali:
- nomi di ditte: es. Palmolive
- nomi di prodotti: es. Ajax
- nomi di negozi: es: Upim, Il cavallo, La boutique del formaggio
Casi come La boutique del formaggio sono stati considerati nomi sintagmatici.
3. Altri casi di nomi propri abbastanza diffusi:
-nomi di serie di automobili: es. Uno, Tipo, Fiesta
- nomi di squadre di calcio
- nomi di partiti politici
- nomi di enti e associazioni
- nomi di testate e titoli di opere dell'ingegno e di trasmissioni radiotelevisive: il Messaggero, i Promessi Sposi, la Traviata, Volare, Il sabato del villaggio, Forum, Samarcanda, TG3...
- nomi di autostrade: es. A24
- nomi di ospedali, ecc. Nel caso di Clinica S. Lucia, clinica è stato lemmatizzato come sostantivo e S. Lucia come nome proprio sintagmatico.
- nomi di organismi economici e finanziari: es. cipe, consob, bankitalia, istat
Non sono stati considerati nomi propri i nomi di feste, i nomi di secoli ed epoche; il seicento, l’ottocento ecc. sono dunque considerati Numerali.
4. Nomi di ditte
Nel LIP esisteva anche una categoria D, che indicava Nomi di ditte. Poiché la categoria Ditta non è una categoria grammaticale, questa categoria è stata eliminata dal novero della categorie considerate per CoLFIS. Ciò che il lemmatizzatore classificava come Ditta è stato ricategorizzato come Nome Proprio.
Si è tenuto presente che alcune ditte si chiamano con il cognome del proprietario o fondatore: es. Ferrari, Olivetti. Inoltre, anche il prodotto tipico della ditta può essere chiamato con tale nome: una Ferrari, una Olivetti (macchina da scrivere). In questi casi sono state separate le ricorrenze come sostantivo da quelle come nome proprio (di ditta o di persona, che confluiscono entrambi nella categoria generale di nome proprio). Quindi:
la Ferrari ha sede a Maranello, il mitico Enzo Ferrari,la Ferrari ha vinto a Imola: Ferrari è stato considerato nome proprio;
la Ferrari di Mansell è ferma ai box: Ferrari è stato considerato un sostantivo;
una vecchia fiat rossa: Fiat è stato considerato un sostantivo;
una vecchia panda rossa: Panda è stato considerato un nome proprio;
una Fiat Panda / Lancia Thema / Mercedes 500: Fiat è stato considerato sostantivo e Panda nome proprio, e analogamente nei restanti casi.
5 Altri casi:
Nei cognomi col genitivo sassone, `s è parte del nome, per cui Christie's è stato considerato nome proprio.
Nei nomi comuni la forma con genitivo sassone è stata invece considerata una forma flessa del lemma corrispondente: house's è stato dunque ricondotto a HOUSE.
Cognomi tipo O'Hara e McDonald sono stati lemmatizzati come nomi propri uguali a se stessi. Nel caso in cui si è trovato scritto Mac Donald con due parole separate, il cognome è stato trattato come un nome sintagmatico i cui singoli membri sono stati categorizzati entrambi come E.
Casi tipo Tangentopoli, Vaticano, Pentagono, Translantico, Quercia, Edera, Lega, Polo, Rifondazione, Garofano, Scudo crociato, Bianco fiore, Fiamma, e Verdi come partito sono stati trattati tutti come nomi propri.
In la Statale di Milano, Statale è stata considerata nome proprio.
In laureata alla Cattolica, Cattolica è stata considerata nome proprio.
In dipendente delle Nord (nel senso di ferrovie Nord), Nord è stato considerato nome proprio.
G7 è stato lemmatizzato come nome proprio.
In unkalashnikov AK47, AK47 è stato considerato nome proprio in quanto si tratta del nome di un tipo di arma.
6. Nomi propri sintagmatici
Uno dei principali tipi di intervento di correzione manuale ha riguardato i nomi propri sintagmatici. Per questi nomi, era interessante la frequenza dell'unità politematica e dei singoli membri. Il lemmatizzatore automatico non riconosceva i nomi sintagmatici e quindi si è dovuto ricorrere all’intervento manuale.
I principali tipi di nomi propri sintagmatici sono toponimi composti e cognomi composti (es. Castel di Sangro, De Mauro, Di Pietro).
.....6.1 Cognomi
I cognomi italiani composti vanno classificati come Nomi propri sintagmatici, per es. Di Pietro, Del Turco, Dalla Chiesa. Non abbiamo sciolto nei singoli componenti le preposizioni articolate incontrate (come negli ultimi due cognomi qui citati), ma le abbiamo trattate come un tutt'uno. Per es. in Del Turco si ha:
DEL TURCO : nome proprio sintagmatico i cui componenti sono Del nome proprio e Turco nome proprio.
Si ricordi che il lemmatizzatore scorpora sempre Del in DI preposizione e IL articolo . Nel caso in cui Del si fosse presentato come componente di un cognome, i due componenti sono stati riaccorpati.
Anche i cognomi doppi, come per es. Sforza Pallavicini sono stati trattati come nomi propri poliramatici.
Allo stesso modo sono stati trattati anche i cognomi doppi di donne, in cui uno dei cognomi è quello del marito .
I cognomi stranieri sono stati trattati alla stessa stregua di quelli italiani.
.....6.2 Nomi di battesimo sintagmatici
Sono stati lemmatizzati come sintagmatici solo i nomi propri composti molto diffusi: per es.: Anna Maria, Maria Teresa, Pier Paolo, Giovanni Paolo II, Pio XII ecc. ma non Alessandro Carmine, Silvia Piera ecc.
.....6.3 Nomi nobiliari
I nomi nobiliari non sono stati considerati sintagmatici, quindi i singoli componenti sono stati lemmatizzati uno per uno: in duca di Wellington,duca è stato lemmatizzato come sostantivo, di come preposizione e Wellington come nome proprio.
.....6.4 Soprannomi
I sostantivi e gli aggettivi usati per designare in modo specifico un personaggio sono stati classificati come nomi propri sintagmatici, per es. Il Temporeggiatore, Il Venerabile G, il Molleggiato G, l'Innominato G, la Pantera di Goro, Sua Emittenza.
Eventuali nomi storpiati sono stati ricondotti alla forma corretta, es. Berlusca in BERLUSCONI .
.....6.5 Nomi storici
In casi come Erasmo da Rotterdam, Leonardo da Vinci, Alberto da Giussano, Lorenzo il Magnifico si è classificato il tutto come nome proprio sintagmatico, ma con da come preposizione e il come articolo.
.....6.6 Nomi di divinità
Sono stati lemmatizzati come nomi propri anche i casi di nomi/appellativi di divinità, come Madonna, Cristo, Dio, Signore, Vergine, Allah, Messia. Non sono stati trattati invece come nomi propri i seguenti casi: papa, santo padre, sua santità, padreterno, chiesa, islam, imam.
.....6.7 Toponimi
I toponimi sono stati classificati come nomi propri e lemmatizzati uguali a sé stessi.
Es. Palma di Montechiaro, l' uscita della lemmatizzazione automatica era palma sostantivo, di preposizione e Montechiaro sostantivo.
Noi abbiamo ricomposto l'unità e l’abbiamo lemmatizzata uguale a se stessa categorizzandola come nome proprio sintagmatico e categorizzando ogni singolo componente.
Sono stati considerati come nomi propri sintagmatici anche i casi di Sud America, America del Sud, Centro America, Nord Europa, Irlanda del Nord , Africa del Nord, Germania est , ecc.
.....6.8 Nomi di strade (allo stesso modo i nomi di Piazze, larghi ecc.)
Sono stati considerati nomi propri sintagmatici e i singoli componenti sono stati lemmatizzati: es. Via Oreste de Gaspari: è stato classificato come nome proprio sintagmatico con via classificato come Sostantivo, Oreste come nome proprio, De come nome proprio e Gaspari come nome proprio.
.....6.9 Nomi di opere
Se sintagmatici, sono stati classificati come tali. Esempio: Il sabato del villaggio, dove si ha il articolo, sabato sostantivo, del preposizione (con DE e -L articolo) e villaggio sostantivo.
Sono stati trattati come nomi propri i nomi dei seguenti testi: Bibbia, Corano, Vangelo, Gazzetta Ufficiale.
Non sono stati considerati nomi propri : Costituzione, Nuovo Concordato, Codice civile.
.....6.10 Nomi di associazioni, movimenti, ecc.
Anche se derivano da un uso metonimico sono stati classificati come nomi propri: per es. Casa Bianca, Nazioni Unite, Mani pulite, Botteghe oscure ecc.
7. Nomi di mostre, manifestazioni e simili
Di fronte al proliferare di titoli molto lunghi (magari anche con sottotitoli), si è deciso di considerare come sintagmatici solo i titoli di mostre, manifestazioni e sim. periodiche (tipo Pitti uomo, Biennale di Venezia e sim.). Quindi, i titoli di manifestazioni non cicliche, non permanenti e occasionali non sono stati considerati sintagmatici. Un ulteriore criterio di scelta è dovuto alla presenza di una struttura frasale piuttosto che sintagmatica (per es. in La moda a Milano).
.....7. 1. Nomi di feste, periodi storici, ecc.
Natale, Pasqua, Fascismo, Rinasciment, fascio, ventennio, capodanno, immacolata concezione, tutti i santi, non sono stati considerati nomi propri.
.....7.2. Nomi di santi
Tutte le forme di santo (Santo, San, S.) che compaiono seguite da un nome proprio sono state trattate come polirematiche in cui il componente san, santa, è categorizzato come sostantivo e il nome che segue come nome proprio. Ad esempio, San Francesco è un nome proprio sintagmatico in cui san è un sostantivo e Francesco un nome proprio.
Quando la parola Santo ecc. è abbreviata S., il punto è stato lemmatizzato come parte dell'abbreviazione e non come uno dei segni di interpunzione.
Non sono stati classificati come nomi propri le seguenti classi di nomi:
il sessantotto, quarantotto e sim., trattati come come Numerali;
nomi di istituzioni e organismi militari, es. finanza, carabinieri, fiamme gialle, milite ignoto (quest'ultimo è nome proprio se indica il monumento);
nomi di monete es. dollaro, rublo, ecu, di titoli es. future, bot, btp, di tasse es. iva, irpef, irpeg;
nomi propri di persone usati come antonomasie: si credeva un ercole, era un giuda.