• Non ci sono risultati.

LIVELLI OPERATIVI PROTOTIPO

2.2.5.3 Criteri e parametri di dimensionamento 1 Riferimenti Metodologic

Apparati di elaborazione e di connessione (processori, router, ampiezza di banda, ecc.):

Per il dimensionamento degli apparati hardware si è presa come base la metodologia Transaction Cost Analysis (TCA) che si basa sui seguenti passaggi:

Definizione dei protocolli utilizzati (HTTP, FTP, LDAP e SQL) e delle loro operazioni (DELETE, GET, OPEN e PUT)

− Definizione (o rilevazione) del profilo di utilizzo dei servizi tipici dell’applicazione oggetto della valutazione (per ogni transazione dell’applicativo vengono enumerati i vari tipi di operazione) − Definizione della frequenza e della durata di ogni

operazione

− Calcolo della media ponderata di frequenze,

durate e utilizzo Mhz3.

− Calcolo della necessità di risorse totali per

semplice tabulazione

La procedura di valutazione sopra indicata definisce le necessità di elaborazione, in termini di Mhz, da mettere a disposizione nel periodo di punta.

Dai valori calcolati è facile derivare il numero di processori necessari selezionando tra i tipi disponibili sul mercato.

Per quanto riguarda gli apparati di connessione si è fatto principalmente riferimento alle prestazioni di apparati offerti dalle maggiori case costruttrici, verificando le caratteristiche di connettività e di capacità di sostenere il numero di utenti concorrenti nei periodi di punta.

Apparati di storage presso il gestore della conoscenza Abbiamo semplicemente valutato l’occupazione media di dischi per ogni oggetto della conoscenza che abbiamo moltiplicato per il numero di oggetti definiti per ogni Fase. A questo risultato abbiamo aggiunto l’occupazione di disco derivanti da altri processi non direttamente connessi alla base della conoscenza cioè:

− Occupazione dovuta ai sistemi operativi

3

I Mhz necessari per ogni operazione media sono stati derivati dalla letteratura, tenuto conto che tale valore è indipendente dai volumi delle utenze e del numero di operazioni per sessione (stimate separatamente).

52

− Occupazione dovuta agli applicativi

− Ridondanza degli oggetti della conoscenza

− Occupazione dovuta alle aree utente

Apparati di connessione nell’area gestione della conoscenza

I processi interessati sono:

− Aggiornamento batch verso il Web Server del

Provider (aggiornamenti della base della conoscenza, aggiornamento degli applicativi, e alcune “risposte” ai servizi di tipo interattivo.

− Gestione dell’aggiornamento della base della

conoscenza (che coinvolge una utenza speciale costituita dai “generatori della conoscenza”) Servizi di manutenzione

Per tutti questi servizi si verificano limitate concorrenze di accesso ed elaborazioni di “tipo batch”; per queste ragioni non abbiamo effettuato calcoli raffinati, avendo verificato che le configurazioni dei processori e i dimensionamenti degli apparati precedentemente effettuati hanno margini di prudenzialità tali da garantire le esigenze di questa area.

2.2.5.3.2 Dimensionamenti

Le dimensioni operative

Riportiamo, nella figura 5, i dati di riferimento fondamentali.

Stadio operativo iniziale Stadio operativo intermedio Stadio operativo maturo G Utenti concorrenti ( F * C ) 50 400 800 1.600 Utenti Potenziali 10.000 80.000 160.000 320.000 M Numero oggetti 10.000 40.000 200.000 400.000 Voci Dimensioni Operative LIVELLI OPERATIVI PROTOTIPO Valori Figura 2

Dimensionamento delle prestazione del Publisher (componenti colorate in verde nella figura 4)

La metodologia TCA è riferita al dimensionamento ottimale di sistemi esistenti e coerentemente il calcolo di frequenza e di

53 durata delle transazioni viene rilevata da sistemi di monitoraggio propri dei sistemi operativi.

Ad esempio nel Monitor di Sistema di Microsoft Windows 2000 sono inclusi “probe”, definiti anche contatori, che consentono di analizzare l'utilizzo delle risorse e altri parametri di sistema, nonché i parametri di latenza e quelli relativi al flusso delle transazioni, allo stato e alla coda, per ogni servizio.

Nella nostra situazione, non esistendo sistemi operanti, abbiamo effettuato i seguenti passaggi “a tavolino”:

Identificazione delle transazioni di riferimento: Quale standard di riferimento abbiamo previsto che ogni transazione comprenda operazioni di tipo HTTP, FTP, LDAP, SQL .

Derivazione, in base alle specifiche del Portale, delle operazioni tipiche di ogni transazione (in termini di tipologia e di ripetitività).

Per ogni sessione utente abbiamo stimato i seguenti valori di riferimento:

Durata della sessione 1.200 sec.

Tempo utente per lettura, interruzioni, attese 840 sec.

Tempo di interazione con il sistema 360 sec

Numero di operazioni 320

CPU utilizzata per operazione 19 Mhz

− Calcolo dell’impegno di capacità di elaborazione

derivando gli standard per tipologia di operazione dalla letteratura

− Mhz per operazione x Numero di operazioni

contemporanee in un secondo

− Definizione del tempo di durata di una

transazione tipo (connessione utente) - stima in base a interviste un gruppo di potenziali utenti: come già detto è stata scelta una sessione standard della durata di 1200 secondi

− Scelta del parametro di conversione “numero di

utenti potenziali verso il numero di utenti concorrenti” sulla base degli esempi riportati in letteratura: gli esempi riportati in letteratura riportavano valori con un intervallo da 0,1% al 1%; abbiamo salomonicamente scelto il valore mediano pari a 0,5%.

La sintesi dei parametri utilizzati è riportata nella seguente figura 6.

54 Per quanto riguarda le capacità di storage da richiedere al Service Provider abbiamo utilizzato gli stessi dimensionamenti calcolati per l’area della gestione dei contenuti.

Voci Unità

Misura Valore

A Mhz impegnati per operazioni Mhz 19,0

B Utenti concorrenti nel periodi di picco / Utenti potenziali % 0,5

C Durata della sessione (sec) sec 1.200,0

D Numero operazioni per sessione N 320,0

E Mbyte per oggetto Mb 1,5

Parametri generali di dimensionamento

Figura 3

Dimensionamento degli apparati hardware dell’area di gestione della conoscenza

Dimensionamento delle capacità di elaborazione

Malgrado sia intuitivo che le capacità di elaborazione di questa area sono sempre sufficienti in base alle configurazioni di tipo qualitativo, abbiamo effettuato la seguente controverifica: abbiamo ritenuto validi i parametri di cui alla figura 5, salvo modificare il numero degli utenti potenziali che, a titolo prudenziale, abbiamo ritenuto pari a 1/10 degli utenti finali.

I profili degli utilizzatori di questa area sono:

− le transazioni tramite i sistemi del Publisher − i detentori della conoscenza

− i gestori e gli amministratori della conoscenza In base a questa assunzione, il numero di utilizzatori potenziali dell’area gestione risulterebbero essere:

− nella fase di prototipo: 1.000 − nella fase operativa iniziale: 8.000 − nella fase operativa intermedia: 16.000 − nella fase operativa matura: 32.000

Da questi valori si può dedurre il numero degli utenti concorrenti (pari allo 0,5% di quelli potenziali dell’area di gestione della conoscenza):

− nella fase di prototipo: 50 (non previsto il

55 − nella fase operativa iniziale: 40

− nella fase operativa intermedia: 80

− nella fase operativa matura: 160

La formula per ottenere il numero di operazioni al secondo è Utenti Concorrenti x Operazioni per sessione / durata sessione:

− nella fase di prototipo: 50 x 320 / 1.200 = 13,33

− nella fase operativa iniziale: 40 x 320 / 1.200 =

10,67

− nella fase operativa intermedia: 80 x 320 / 1.200

= 21,33

− nella fase operativa matura: 160 x 320 / 1.200 =

42,67

La potenza di elaborazione necessaria si ottiene moltiplicando il numero di operazioni al secondo per lo standard di utilizzo di CPU pari a 19 Mhz:

− nella fase di prototipo: 252,7 Mhz (che include

anche funzioni di Web Server)

− nel livello operativo iniziale: 202,73 Mhz

− nel livello operativo intermedio: 405,27 Mhz

− nel livello operativo maturo: 810,73 Mhz

che vengono ampiamente soddisfatti dagli assetti configurati anche tenendo conto che alcuni profili di utilizzatore (in particolare i gestori) effettuano transazioni decisamente più impegnative rispetto a quello dell’utenza ”normale”.

Dimensionamento delle capacità di storage

La capacità di storage è stata dimensionata attraverso la definizione delle componenti che la costituiscono.

In particolare:

Gli oggetti che costituiscono il core della Base della Conoscenza sono rappresentati da:

− tutti i files archiviati e classificati dai gestori della conoscenza. Le tipologie presenti sono riconducibili a tutti i principali formati presenti sul mercato. In particolare:

Formati documentali (.txt, .doc, .pdf, .htm, tex …)

56 Formati multimediali (avi .mpeg, .wav, .mp3, …)

Data la varietà di componenti e la diversità di dimensione tra i vari formati, si è effettuato un campionamento sugli oggetti inseriti nella base dati sperimentale4 ottenendo un valore medio di circa 0,8 MBytes, prudenzialmente ritarato a 1,5 MBytes.

− Dalle strutture dati che definiscono le regole di

organizzazione e classificazione degli oggetti archiviati (valutati in circa 5 Kb e considerati come parte della ritaratura del punto precedente)

− Inoltre, occorre considerare uno spazio fisico

supplementare necessario ad archiviare ridondanze che, con il passare del tempo, possono nascere negli oggetti che compongono la base della conoscenza (duplicazioni non evidenziabili dal sistema per anomalie di inserimento).

− L’archiviazione dei documenti originali rilasciati dai detentori del sapere nei formati nativi, che verrà ospitata in sistema di archiviazione ottica (juke-box).

Questi oggetti insisteranno su due differenti categorie di hardware, dischi fissi e jukebox di archiviazione ottica. I sistemi Operativi e le loro componenti

Oltre allo spazio necessario ad ospitare il sistema operativo, è necessario considerare anche le aree temporanee indispensabili per il buon funzionamento del sistema (valutabili in circa 3 GBytes).

Gli applicativi

Lo spazio applicativo è costituito dal tutto il software utilizzato per:

− Supportare le azioni dei gestori della conoscenza

(classificatori, indicizzatori, strumenti di ricerca) − Sviluppare applicativi (compilatori, generatori di

interfacce, reportistica).

Le aree destinate alla archiviazione delle configurazioni utente

Alcuni servizi del Portale prevedono la possibilità, per alcuni utenti di archiviare informazioni personali ottenute durante la navigazione (es. i percorsi di ricerca della conoscenza, gli scambi di informazioni con esperti nella

4

Si tratta di un set di oggetti della conoscenza raccolti al fine di testare la bontà delle metodologie proposte.

57 sezione Analisi e Prove o nell’area di Programmazione della Ricerca). Relativamente alla fase/livello è possibile stimare la dimensione dell’area secondo quanto descritto nella figura 7 Um Livello Iniziale Livello Intermedio Livello Maturo Utenti Potenziali N 10.000 80.000 160.000 320.000

Utenti con necessità di spazio % 1% 5% 5% 10%

Totale Utenti a cui si riserva spazio N 100 4.000 8.000 32.000

Mbytes per Utente Mbytes 5 10 10 10

Spazio Totale Necessario Mbytes 500 40.000 80.000 320.000 Area Riservata Utente

Voci

Valori

PROTOTIPO

Documenti correlati