• Non ci sono risultati.

POLITECNICO DI TORINO ESAMI DI STATO PER L'ABILITAZIONE ALLA PROFESSIONE DI INGEGNERE I SESSIONE - ANNO 2004 Ramo: INFORMATICA Tema n. 2

N/A
N/A
Protected

Academic year: 2022

Condividi "POLITECNICO DI TORINO ESAMI DI STATO PER L'ABILITAZIONE ALLA PROFESSIONE DI INGEGNERE I SESSIONE - ANNO 2004 Ramo: INFORMATICA Tema n. 2"

Copied!
2
0
0

Testo completo

(1)

POLITECNICO DI TORINO

ESAMI DI STATO PER L'ABILITAZIONE ALLA PROFESSIONE DI INGEGNERE

I SESSIONE - ANNO 2004

Ramo: INFORMATICA Tema n. 2

Premessa.

Molti fenomeni fisici vengono rappresentati mediante un insieme di misure di alcune caratteristiche distintive (features), organizzate in un vettore. Si pensi, ad esempio, ai fenomeni atmosferici, de- scritti dall'insieme di temperature, pressione, umidità, ecc., o ad un segnale elettrico stazionario, de- scritto dai punti dello spettro, e così via. Questi vettori possono essere considerati dei punti in uno spazio euclideo multidimensionale.

In molte applicazioni, piuttosto che trattare i vettori veri, si preferisce sostituirli con dei "rappresen- tanti" opportunamente scelti. Il procedimento, detto quantizzazione vettoriale, è descritto qui di se- guito.

I. All'inizio tutti i vettori sono attribuiti ad un unico cluster. Si calcola l'unico rappresentante come valor medio di tutti i vettori;

II Per ciascun rappresentante finora trovato:

A. si crea una perturbazione (casuale o meglio ancora lungo la direzione di massima di- spersione) in modo da determinare due nuovi rappresentanti;

B. si assegna ciascun vettore del rappresentante padre ad uno dei due figli, secondo il criterio della minima distanza;

C. si ricalcolano i nuovi rappresentanti come il vettore medio dei vettori assegnati a cia- scun figlio: saranno quelli i nuovi centri di cluster (si abbandonano i vettori

"perturbati").

III. Se non è soddisfatto il "criterio di fine", si va a II.

Alla fine i vettori rappresentanti, detti codeword, sono etichettati con un intero da 0 a 2N, dove N è il numero di bit utilizzato per codificare i vettori.

Il "criterio di fine" può essere legato:

1 ) al raggiungimento del numero di bit N stabilito a priori per la codifica;

2) al superamento di una soglia minima di "distorsione" accettata, se si è definito un opportuno in- dice di distorsione riferita all'applicazione che si sta trattando. Nel caso più semplice, si può im- porre che la distanza media dei vettori rappresentati dal vettore rappresentante sia sotto una data soglia.

NB: sostituire i vettori veri con i rispettivi rappresentanti può essere considerato come una distor- sione dello spazio vero; ovvero, se si stanno trattando sequenze di vettori, ciascuno dei quali è un punto nello spazio, al pattern (traiettoria) vero si sostituisce un pattern distorto, quello che è co- stretto a passare per i punti (vettori) rappresentanti piuttosto che per i punti veri. In quest'ultimo ca- so il numero di bit N utilizzato per la codifica non è stabilito a priori, ma è quello trovato.

(segue)

. 1

(2)

Campi di utilizzo:

1 ) dove serve una riduzione di dimensionalità (compressione di banda per qualsiasi applicazione) 2) dove serve passare da variabili continue a variabili simboliche (associando etichette ai codici)

Tema.

In un file di tipo testo sono memorizzati un insieme di vettori da utilizzare per la quantizzazione vettoriale. Nella prima riga un numero intero indica la dimensionalità dei vettori. Nelle righe suc- cessive ci sono gli elementi dei vettori espressi come numeri reali, separati da almeno uno spazio (blank) o da un RETURN (<CR>). Il numero di vettori può superare le migliaia.

Realizzare un programma in linguaggio C che attui l'algoritmo di quantizzazione vettoriale sopra descritto.

Il nome del file dei dati deve essere introdotto da tastiera o passato come parametro.

Costituiscono altri parametri del programma:

• la dimensionalità dei vettori effettiva da trattare (minore o uguale a quella descritta nel file);

• la modalità di terminazione, se basata sul numero di bit delle codeword oppure sulla distanza media dei vettori dalla rispettiva codeword. Nel primo caso occorre fornire il numero di bit, nel secondo la soglia.

Descrivere nel dettaglio ma in modo sintetico le strutture dati e gli algoritmi utilizzati nella mani- polazione dei dati per realizzare il progetto. Quanto non stabilito espressamente deve essere scelto dall'esaminando e sarà oggetto di valutazione.

Riferimenti

Documenti correlati

Il candidato discuta le proprietà dei suddetti materiali e le analisi cui dovranno essere sottoposti prima del loro impiego.. Illustri il processo per la produzione di film

deve essere sottoposto a riscaldamento mediante contatto con una corrente gassosa ad una temperatura di 220 °C per un tempo minimo di 8 ore. Il prodotto grezzo è conservato,

Dopo il trattamento la concentrazione di ammoniaca deve essere inferiore a 0.2% in volume, la temperatura non deve superare 30 °C ed il valore massimo ammesso per l'umidità relativa

In questo ambito gli apparati elettronici alimentati da rete (off line) sono sottoposti, (fra le altre) a due classi di normative: quelle di emissioni elettromagnetiche, e quelle

Featuring the 3Com 3100 Entry Phone, 3101 Basic Phone, 3101 Basic Phone with Speaker, 3102 Business Phone, 3103 Manager Phone, 3105 Attendant Console, and 3106C and 3107C Cordless

3) il tempo di permanenza nelle celle degli utenti per effetto della loro mobilità possa essere ipotiz- zato esponenzialmente distribuito con una media che dipende linearmente

Sulla base delle proprie conoscenze il Candidato valuti tutte le possibili alternative per soddisfare la domanda di trasporto e fornisca una soluzione progettuale secondo quanto

Illustrare in generale e nel dettaglio mediante un diagramma di flusso (o meglio pseudo- codice) almeno tre algoritmi di ordinamento, evidenziando le caratteristiche salienti