Pajek Download: Corso Pajek Sidney 2105 DATA.

31
Pajek Download: http ://vlado.fmf.uni-lj.si/pub/networks/pajek / Corso Pajek Sidney 2105 http :// vlado.fmf.uni-lj.si/pub/networks/doc/seminar/NICTA.htm DATA SETS: http ://vlado.fmf.uni-lj.si/pub/networks/data

Transcript of Pajek Download: Corso Pajek Sidney 2105 DATA.

Page 2: Pajek Download:  Corso Pajek Sidney 2105  DATA.

Pajek significa «ragno» in Sloveno.

Pajek è un software per la visualizzazione e l’analisi delle reti complesse.

E’ continuamente esteso e aggiornato.

Gli autori sono: Vladimir Batagelij e Andrei Mrvar dell’università di LjublJana (Slovenia)

Page 3: Pajek Download:  Corso Pajek Sidney 2105  DATA.

libro

Page 4: Pajek Download:  Corso Pajek Sidney 2105  DATA.

libro

Page 5: Pajek Download:  Corso Pajek Sidney 2105  DATA.

Manuale

Page 6: Pajek Download:  Corso Pajek Sidney 2105  DATA.

la social network analysis (SNA) permette di rispondere a domande molto semplici ma importanti quali:

• chi conosce chi • chi ha il numero più elevato di contatti in una comunità o

organizzazione• quali sono i sotto-gruppi di cui è composta una comunità numerosa • come funziona l'organizzazione reticolare di un movimento politico o

di un gruppo terrorista• come sono collegati tra loro i dirigenti di aziende quotate in borsa• ecc.

Introduzione all SNA

http://www.ccsr.ac.uk/methods/publications/snacourse/snacourseweb.html

Page 7: Pajek Download:  Corso Pajek Sidney 2105  DATA.

introdurre retirappresentare graficamente le reti

Statistica di base

come si misura la coesione

Page 8: Pajek Download:  Corso Pajek Sidney 2105  DATA.

Main window

Page 9: Pajek Download:  Corso Pajek Sidney 2105  DATA.

Aprire una rete esistente

Disegnarla

Dining-table_partners.net: 26 vertices, 52 valued arcs (1 = first choice, 2 = second choice), no edges, no loops.

Page 10: Pajek Download:  Corso Pajek Sidney 2105  DATA.

1. Creare un file (*.net, *.vec, *.clu) manualmente con Pajek

Net/RandomNetwork/Total n° of Arcs(es: 15 , How many arcs=10)File/Network/Edit (cambia un vertice per volta)

Partition/Create Constant PartitionFile/Partition/EditVector/Create Constant VectorFile/Vector/EditFile/Network/SaveFile/Partition/SaveFile/Vector/Save

2. Modificare un file manualmente con un word processor

Net/Random Networks/Total n° of arcs (es: 15 , How many arcs=10)File/Network/Save Open file with Blocco Note and modify itSave Re-open File before using it (Never use TAB)

Analogamente per partizioni e vettori

Page 11: Pajek Download:  Corso Pajek Sidney 2105  DATA.

Come inserire una rete: Esempio 1

Pippo

Mario

Franco Luca

Giovanni*Verteces 51 «Pippo»2 «Franco»3 «Luca»4 «Giovanni»5 «Mario»*Edges1 52 52 43 44 5* Arcs

*Verteces 51 «Pippo»2 «Franco»3 «Luca»4 «Giovanni»5 «Mario»*Arcslist1 52 5 43 44 5

*Verteces 51 «Pippo»…*matrix0 0 0 0 10 0 0 1 10 0 0 1 00 1 1 0 11 1 0 1 0

1. Lista di vertici seguita da una lista di arcs/edges2. Lista di vertici seguita da una matrice.

Limitazioni: non è possibile indicare linee multipleLinee di valore 0 = non linee

Page 12: Pajek Download:  Corso Pajek Sidney 2105  DATA.

Possono essere ni reali

Page 13: Pajek Download:  Corso Pajek Sidney 2105  DATA.

Esempi di grafi diretti(digraph)

Page 14: Pajek Download:  Corso Pajek Sidney 2105  DATA.

Drawing

DrawDraw/PartitionDraw/VectorDraw/Partition/Vector

Draw/Layout/circularDraw/Layout/Energy/Kamada-Kaway/Free

Per default Pajek non disegna reti con più di 5000 vertici anche se può fare i calcoli con reti di 9.999.997 vertici

L’algoritmo di Kamada –Kawai trova la posizione dei nodi che minimizza il numero di incroci delle linee e la distanza tra i nodi.

Page 15: Pajek Download:  Corso Pajek Sidney 2105  DATA.

Drawing

La posizione dei vertici può essere cambiata usando il mouse.

Si possono usare le Option dalla finestra grafica per visualizzare diversamente i nodi e gli archi.

Le figure si possono esportare con export o copiando la foto (print screen) in Paint

Page 16: Pajek Download:  Corso Pajek Sidney 2105  DATA.

Statistica di base su reti unimodali

Info/Network/General fornisce informazioni generali sulla rete:m=n°spigoli, n=n° nodi; <k>=2m/n grado medioDensità1= d1=m/(n*n)=link esistenti/link possibili (con loops)Densità2=d2=m/(n*(n-1))=link esistenti/link possibili (senza loops)

Page 17: Pajek Download:  Corso Pajek Sidney 2105  DATA.

Esercizio

Inserire la seguente rete che rappresenta «chi è amico con chi» all’interno di un gruppo sportivo

1 nessuna frequentazione2 frequentazione saltuaria (1 v al mese)3 frequentazione assidua (1 v alla settimana) 1.Laura (15)

2.Michela (16)

3.Emanuela (14)

4.Silvia (12)

5.Roberta (17)

6.Giovanna (15)

7. Giorgio(12)

8. Carlo(14)

9. Marco(15)

10. Leonardo (17)

11. Davide(15)

12. Luca 16)

0 1 2 1 1 1 1 3 1 1 1 1

0 0 2 2 2 1 1 1 1 1 1 1

0 0 0 1 1 1 1 1 1 1 1 1

0 0 0 0 1 1 1 2 3 1 2 3

0 0 0 0 0 2 1 1 1 3 1 3

0 0 0 0 0 0 1 1 2 3 1 2

0 0 0 0 0 0 0 1 1 3 2 2

0 0 0 0 0 0 0 0 1 2 3 3

0 0 0 0 0 0 0 0 0 1 2 1

0 0 0 0 0 0 0 0 0 0 1 1

0 0 0 0 0 0 0 0 0 0 0 2

0 0 0 0 0 0 0 0 0 0 0 0

• Creare il file es1 .net• Rendere la rete non

diretta• Inserire la rete come

matrice e come lista• Creare la partizione

maschi/femmine• Creare il vettore età

Page 18: Pajek Download:  Corso Pajek Sidney 2105  DATA.
Page 19: Pajek Download:  Corso Pajek Sidney 2105  DATA.

Statistica di base

Info/network/general (0)

Page 20: Pajek Download:  Corso Pajek Sidney 2105  DATA.

Info/partition (0)

Info/vector (0)

Page 21: Pajek Download:  Corso Pajek Sidney 2105  DATA.

Come misurare la Coesione

Page 22: Pajek Download:  Corso Pajek Sidney 2105  DATA.

A cosa può servire misurare la coesione?

Prevedere la diffusione di idee/innovazioni e l’uniformità di tale diffusioneE’ più probabile avere diverse opinioni in diversi gruppi coesi.

Page 23: Pajek Download:  Corso Pajek Sidney 2105  DATA.

K-cores

E’ il massimo sotto-grafo connesso in cui ogni nodo è connesso con almeno altri k-nodi nel gruppo.

A volte questo è un concetto troppo stringente per individuare comunità in una rete.Può essere interessante osservare la sovrapposizione fra diversi k-cores

Net/Partitions/core

Page 24: Pajek Download:  Corso Pajek Sidney 2105  DATA.

Problema: si può avere p alto se molti vertici appartengono ad un grande cluster

P-cliques= percentuale delle connessioni

E’ il massimo sotto grafo connesso in cui i nodi hanno almeno una data percentuale p di vicini all’interno del sotto grafo

Page 25: Pajek Download:  Corso Pajek Sidney 2105  DATA.

Altri metodi:

Componenti connesse (strong e weak)

Densità dei link nella rete

Page 26: Pajek Download:  Corso Pajek Sidney 2105  DATA.

Esempio con Pajek.

Attiro.netNel 1948 i sociologi americani studiarono le relazioni sociali in una regione della Costa Rica nel Sud America. Essi erano interessati all’impatto delle relazioni sociali sull’evoluzione di una società. Studiarono le relazioni di «fare visita a» tra famiglie che vivevano nelle «haciendas» (fattorie). La rete di visite è contenuta nel file Attiro.net. Si ha un semplice grafo diretto dove ogni arco rappresenta la frequenza delle visite da una famiglia ad un’altra. Non si conosce l’esatto numero di visite. Le linee sono classificate come «ordinarie» (1), visite saltuarie tra famigliari (2), visite ricorrenti tra famigliari (3). I loops non ci sono perché in questo caso non hanno senso

La visualizzazione aiuta a mettere in evidenza le diverse famiglie e la forza dei loro legami. Le famiglie verdi e azzurre sono concentrate al centro. Eccezione f43

Page 27: Pajek Download:  Corso Pajek Sidney 2105  DATA.

Che gruppi coesi possiamo trovare in attiro.net? Coincideranno con le famiglie?

Per misurare la connessione si può misurare la densità dei link

Net/Info/General (0)La rendo non diretta perché così il grado è il numero di viciniNet/Transform/Arcs-Edges

Page 28: Pajek Download:  Corso Pajek Sidney 2105  DATA.

Net/Partition/DegreeInfo/Partition

Page 29: Pajek Download:  Corso Pajek Sidney 2105  DATA.

Rete non diretta

Net/partitions/Core/(all)Draw/Draw partitionI colori dei vertici indicano il più grande k-core a cui i vertici appartengono

3 k-coreSembra che i k-core non identifichino i raggruppamenti delle famiglie

Page 30: Pajek Download:  Corso Pajek Sidney 2105  DATA.

p-Cliques

P=0.5

Nemmeno le p-cliques identificanoI raggruppamenti tra famiglie

Partizione della rete in sotto-grafi i cui vertici hanno una percentuale almeno di p di vicini

Page 31: Pajek Download:  Corso Pajek Sidney 2105  DATA.

Strongly connected component with Pajek

Attiro.net (CAP 3) sono importanti le strong component (=gruppi che si visitano a vicenda) sono quindi importanti le direzioni delle frecce

Net/Component/Strong

Draw/Draw PartitionsLayout/circular/using PartitionSe vi si sovrappone la partizione in famiglie si ottiene:Quindi le strong component individuano le famiglie