• Non ci sono risultati.

Structural analysis of behavioral networks from the Internet

N/A
N/A
Protected

Academic year: 2021

Condividi "Structural analysis of behavioral networks from the Internet"

Copied!
23
0
0

Testo completo

(1)

networks from the Internet

De Santis Roberto

(2)

2

La rete delle reti

● Successo di Internet

● Rete vista in termini di

Fisicità

Sistema complesso

● Applicazioni e reti virtuali

(3)

3

Com'è fatta la rete Internet?

● Problemi inerenti allo studio di Internet

Mancanza di una componente di controllo centralizzato o che

permetta di avere una visione globale

Collezione di vari elementi di visione locale

Traceroute

● Risultati

Topologia controversa, ma nota a grandi linee

Proprietà interessanti

(4)

4

Utilizzi della rete e comportamenti

● Struttura topologica della rete fisica e della rete virtuale sono indipendenti l'una dall'altra

● Perchè studiare le “reti comportamentali”?

Miglioramento nella progettazione delle reti future

Modellare meglio il traffico di Internet

(5)

5

Rilevare i comportamenti

● Server log

Non basato su user-to-user interaction

● Flussi di rete

IP, porte

Cisco NetFlow

Problema della privacy

Campionamento dei pacchetti con frequenza 1:100

(6)

6

Scenario: la rete Abilene

● Progetto di Internet2 fine anni '90

● Prestazioni elevate: 10Gbps sulle dorsali

● Università e centri di ricerca: centinaia di migliaia di utenti

● Mai congestionata

(7)

7

I dati raccolti: forma e preparazione

● Dati sottoforma di record (circa 30GB al giorno)

Dettagli su sorgente e destinatario

Tipo e quantità di dati scambiati

● Identificazione dei ruoli: client e server

C = {i1, i2, …, iNc }

S = {j1, j2, …, jNs }

(8)

8

Behavioral, functional, application graphs

(9)

9

Flussi osservati

● Osservazione di 24 ore il 14 Aprile 2005

● 625 milioni di flussi

258 milioni (41,3%) relativi al Web

82 milioni (13,1%) relativi ad applicazioni P2P

285 milioni (45,6%) relativi ad altro traffico (incluso network monitoring)

Web 41,3%

Altro 45,6%

P2P 13,1%

(10)

10

Host osservati

● 15 milioni di host (considerando tutti i flussi):

5,82 milioni di client

11,1 milioni di server

● Considerando solo il flusso web:

3,97 milioni di client

0,68 milioni di server

● Considerando solo il flusso P2P:

0,71 milioni di client

0,14 milioni di server

(11)

11

Distribuzione degli edge rispetto ai traffici

● Behavioral graph

Traffico web: 50.1 milioni di edge (38,0%)

Traffico P2P: 7.89 milioni di edge (6,0%)

Traffico di altro tipo: 54.9 milioni di edge (41,6%)

Web 44%

P2P 7%

Altro 49%

(12)

12

Degree overlap tra client e server

● Alcuni nodi fungono sia da client, sia da server

Nel behavioral graph tali nodi compaiono due volte

● Grado di overlap tra gli insiemi C ed S:

● Valori rilevati nel behavioral graph

Generico: O = 0,14

Traffico web: O = 0,013

Traffico P2P: O = 0,097

O= (∣ C∣∩∣S∣)

(∣ C∣∪∣S∣)

(13)

13

Statistiche sul traffico

● 1.85 TB di informazioni scambiate (in media 124 kB per host)

Tenere in considerazione il campionamento 1:100

Web 25%

P2P

6% Altro

69%

(14)

14

Confronto tra flusso e traffico

Web 41,3%

Altro 45,6%

P2P 13,1%

Distribuzione del flusso

Web 25%

P2P

6% Altro

69%

Distribuzione del traffico

(15)

15

Studio della struttura del behavioral graph

● Degree di un nodo N

dN=i+j

dove i e j sono rispettivamente il numero di archi uscenti ed entranti

● Strength di un nodo N

dove è il peso dell'arco da N a Nk

● Il degree di un nodo rispecchia la quantità di altri nodi con cui ha scambiato dati, mentre la strength si riferisce alla quantità di dati scambiati

s

N

= ∑

k =1 i

w

N , N

k

+ ∑

k=1 j

w

N

k, N

wN , N

k

(16)

16

Distribuzioni di degree e strength

● Decisioni individuali in una popolazione molto larga

Distribuzione normale?

Degree Strength

● Distribuzioni di tipo “long-tailed” (10 ordini di grandezza per strength)

Distribuzione approssimabile con power-law per entrambe P(n)∼n−γ

(17)

18

Distribuzione power-law P(n)∼n

● A seconda del valore di γ si ha una certa rapidità di convergenza a 0

● Valore atteso <n>=∫ n P(n) dn

● Varianza <n

2

>=∫ n

2

P(n) dn

Se 2<γ<3 la varianza diverge, la media è ben definita

Il valore atteso <n> non è più un parametro in grado di predire il numero di collegamenti nel sistema su ogni nodo (degree)

Alta probabilità di avere client connessi con un numero arbitrario di server (degree) o che abbia scaricato un'arbitraria quantità di dati (strength)

Se γ<2 la media diverge: né il valore medio di collegamenti (degree), né la quantità media di dati trasmessi sono caratteristiche predicibili nel sistema

Forte eterogeneità

● Scale-free network

(18)

19

Traffico web: degree e strength

Degree

Strength

(19)

20

Traffico P2P: degree e strength

Degree

Strength

(20)

21

Relazione tra degree e strength

● Relazione tra numero di host contattati e quantità di informazioni scambiata

● Comportamento atteso: strength che aumenta in funzione del degree

(21)

22

Relazione tra degree e strength

● Power-law (crescente)

● <s(k)> k

β

● Server web: β≤1

● Client web: β=1.2±0,1

(22)

23

Conclusioni

● Il comportamento degli utenti raramente segue una distribuzione normale

● Comportamenti differenti a seconda dell'applicazione

In alcuni casi il comportamento può diventare un parametro identificativo dell'applicazione

● Attuale politiche di sicurezza con soglie basate sul data rate per il rilevamento di anomalie nel traffico

● Informazioni importanti per network design e capacity planning dei

collegamenti

(23)

24

Grazie per l'attenzione!

Riferimenti

Documenti correlati

These are summarized for the different test phases in Figure 7 (failure stage), Figure 8 (initial heating stage, from room temperature to approximately 45°C), and Figure 9

Il progetto Sicur@Mente in rete pone l’accento sull’u- so sicuro, sano, corretto e consapevole delle nuove tecnologie digitali, di Internet e dei Social Network e vede

■ Il client effettua la richiesta di una connessione ad un server per un servizio collegato ad una determinata porta. ■ Se la richiesta è accettata la connessione tra i due

ü  A differenza della luce e dell'elettricità, le onde radio non hanno bisogno di essere trasmesse all'interno di cavi, poiché possono viaggiare per lunghe distanze attraverso

Caching: per inviare copie degli stessi dati (esempio, pagine HTML, immagini o video) a più destinatari si può sfruttare la capacità della rete di immagazzinarli in una

Le centrali elettriche sono degli stabilimenti nei quali si effettua la CONVERSIONE di energia da una forma non elettrica ad g elettrica.. Esse si differenziano in base al tipo

trigger”, o a livello (in quest’ultimo caso la variabile di commutazione deve essere pari ad 1 per un periodo di tempo sufficiente per far commutare i flip-flop, ma inferiore

IRCCS Azienda Ospedaliera Universitaria San Martino – IST Istituto Nazionale per la Ricerca sul