Consultazione dei grafi
Per rendere agevole la consultazione dei dati, gli spazi distribuzionali sono stati rappresentati sotto forma di grafi mediante Gephi, un software open-source per la creazione e l’esplorazione di reti. Nei grafi ottenuti, i nodi rappresentano le parole, mentre gli archi che connettono i nodi rappresentano le relazioni di similarità semantica misurate attraverso i coseni.
A titolo di esempio, si prenda la parola “proiettile” nello spazio con finestra contestuale ±2. Aprendo il grafo all’indirizzo http://colinglab.humnet.unipi.it/Demo/COLFIS/colfis_10_2_full/ e cercando “proiettile-S” nel box di ricerca, apparirà una rappresentazione come in Figura 1: sul lato sinistro dell’interfaccia vengono elencate le dieci parole più vicine a “proiettile” (10 nearest neighbours), con il rispettivo valore di coseno tra parentesti quadre, e tutte le parole che presentano “proiettile” tra le dieci parole ad esse più vicine (In the 10 nearest neighbours of).
Figura 1: rappresentazione della parola “proiettile” nel grafo ottenuto dallo spazio con finestra contestuale ± 2
I nodi del grafo risultano raggruppati in cluster (o comunità), corrispondenti in linea di massima a differenti aree semantiche. Nel grafo creato dallo spazio con finestra ± 2, è possibile ad esempio osservare un cluster che riunisce parole inerenti alla sfera politica (Figura 2), un cluster relativo alle emozioni (Figura 3) e via dicendo. Ognuno dei cluster è contraddistinto da un numero e da uno specifico colore dei nodi. Nella Figura 1, sul lato sinistro dell’interfaccia viene riportato sotto Cluster ID il numero del cluster a cui appartiene la parola “proiettile”.