Laboratorio di Linguistica
'Giovanni Nencioni'

 

 

 

 

 

 

 

 

HOME

 

DATI

 

CONSULTAZIONE
GRAFI

 

BIBLIOGRAFIA

 

CONTATTI

 

 

 

 

 

 

Consultazione dei grafi

 

Per rendere agevole la consultazione dei dati, gli spazi distribuzionali sono stati rappresentati sotto forma di grafi mediante Gephi, un software open-source per la creazione e l’esplorazione di reti. Nei grafi ottenuti, i nodi rappresentano le parole, mentre gli archi che connettono i nodi rappresentano le relazioni di similarità semantica misurate attraverso i coseni.

A titolo di esempio, si prenda la parola “proiettile” nello spazio con finestra contestuale ±2. Aprendo il grafo all’indirizzo http://colinglab.humnet.unipi.it/Demo/COLFIS/colfis_10_2_full/ e cercando “proiettile-S” nel box di ricerca, apparirà una rappresentazione come in Figura 1: sul lato sinistro dell’interfaccia vengono elencate le dieci parole più vicine a “proiettile” (10 nearest neighbours), con il rispettivo valore di coseno tra parentesti quadre, e tutte le parole che presentano “proiettile” tra le dieci parole ad esse più vicine (In the 10 nearest neighbours of).

 

Figura 1: rappresentazione della parola “proiettile” nel grafo ottenuto dallo spazio con finestra contestuale ± 2

 

I nodi del grafo risultano raggruppati in cluster (o comunità), corrispondenti in linea di massima a differenti aree semantiche. Nel grafo creato dallo spazio con finestra ± 2, è possibile ad esempio osservare un cluster che riunisce parole inerenti alla sfera politica (Figura 2), un cluster relativo alle emozioni (Figura 3) e via dicendo. Ognuno dei cluster è contraddistinto da un numero e da uno specifico colore dei nodi. Nella Figura 1, sul lato sinistro dell’interfaccia viene riportato sotto Cluster ID il numero del cluster a cui appartiene la parola “proiettile”.

 

Figura 2: cluster di parole appartenenti alla sfera politica nel grafo dello spazio con finestra ± 2

 

Figura 3: cluster di parole appartenenti alla sfera delle emozioni nel grafo dello spazio con finestra ± 2