• Non ci sono risultati.

Algoritmi greedy

3.8 L’algoritmo Matching Pursuit

Proprio in questo contesto si inserisce la ricerca di Mallat e Zhang. L’algoritmo da loro coniato intende decomporre qualsiasi segnale mediante un’espansione lineare di forme d’onda tratte da un dizionario ridondante. Gli autori hanno previsto anche una funzione di scelta cui spetta il compito di selezionare gli atomi che meglio approssimano le caratteristiche del segnale [21].

Nonostante si tratti di un algoritmo fondamentalmente non lineare, l’energia del segnale si conserva. Senza dubbio, questo aspetto rappresenta il principale punto di forza dell’intera procedura, dal momento che ne garantisce la convergenza asintotica.

Per amore della precisione, bisogna sottolineare che non si tratta di una scoperta nel vero senso della parola. Come ammesso dagli stessi autori, la strategia operativa ricorda molto da vicino l’algoritmo projection pursuit, elaborato da Friedman e Stuezle per la stima dei parametri statistici [23]. A Mallat e Zhang va comunque ascritto il merito di aver formulato il primo efficiente algoritmo greedy per la rappresentazione dei segnali acquisiti.

Scendendo maggiormente nel dettaglio, la loro analisi si concentra su una forma di decomposizione definita adattativa. Una simile denominazione è dovuta alla particolare struttura degli atomi del dizionario. Questi, infatti, sono costituiti da traslazioni, dilatazioni e modulazioni di una stessa funzione finestra [21]. Attenendosi a tale configurazione, la scelta degli atomi rivela informazioni preziose sulle caratteristiche strutturali interne del segnale.

Talvolta, però, il dizionario può risultare insufficiente. In tal senso nessun atomo presenta sufficiente correlazione con l’andamento locale del segnale. Fortunatamente, esiste una via di uscita. L’approssimazione dell’elemento in questione non viene affidata ad un solo atomo, ma ad una combinazione lineare di più atomi. In questo modo, la flessibilità del dizionario segna un netto incremento e il potere risolutivo dell’algoritmo cresce a dismisura.

3.8.1 La definizione del dizionario

Per non ricadere nei casi particolari già ampiamente discussi in letteratura, conviene approntare un dizionario piuttosto generico. In quest’ottica, il nucleo della trattazione è rappresentato dalla cosiddetta funzione finestra 𝑎𝑎(𝑡𝑡). Ogni atomo è il risultato di una sua traslazione, dilatazione o modulazione.

Conviene esplicitare, sin da subito, alcune assunzioni su 𝑎𝑎(𝑡𝑡). Si tratta di una funzione reale, di variabile reale. La sua derivata prima è definita in modo continuo su tutto il dominio, mentre il suo integrale non si annulla mai.

In altri termini, nell’origine la funzione assume un valore non nullo, ossia 𝑎𝑎(0) ≠ 0. Volendo fornire un’indicazione di massima, l’andamento può essere approssimato come 𝑂𝑂(1 𝑡𝑡⁄ 2+ 1). Un altro aspetto, utile ai fini dei calcoli successivi, riguarda la norma – 𝑙𝑙2 che assume valore unitario, ossia ‖𝑎𝑎‖2= 1.

Tre sono i parametri che consentono di identificare univocamente un atomo. Di questi, ciascuno quantifica l’entità di una specifica modifica apportata alla funzione finestra 𝑎𝑎(𝑡𝑡), sia essa una traslazione, una dilatazione o una modulazione:

- Il passo di traslazione 𝑢𝑢. - Il fattore di scala 𝑠𝑠. - La frequenza portante 𝜉𝜉.

In genere, per questioni di chiarezza formale, si adotta un indice riassuntivo dei tre contributi, rappresentato dal vettore 𝛾𝛾 = [𝑢𝑢, 𝑠𝑠, 𝜉𝜉]. L’insieme dei possibili valori assunti dai tre parametri costituisce il dominio Γ del vettore.

Direttamente da queste osservazioni discende la formula generale degli atomi appartenenti al dizionario: 𝑎𝑎𝛾𝛾(𝑡𝑡) = 1

√𝑠𝑠 𝑎𝑎 � 𝑡𝑡 − 𝑢𝑢

𝑠𝑠 � 𝑐𝑐𝑠𝑠𝜉𝜉𝑡𝑡

L’analisi di questa espressione fornisce molteplici informazioni sulle proprietà degli atomi, prima fra tutte la distribuzione dell’energia. A tal proposito, nel dominio del tempo questa si concentra in un intorno di 𝑢𝑢, la

cui ampiezza è proporzionale a 𝑠𝑠. Parallelamente, nel dominio della frequenza si concentra in un intorno di 𝜉𝜉, la cui ampiezza è proporzionale a 1 𝑠𝑠⁄ .

Un dizionario realizzato secondo queste istruzioni risulta estremamente ridondante. In altre parole, contiene un numero sorprendente di atomi, in grado di evidenziare anche le sfumature più impercettibili. Nel prosieguo della trattazione, il simbolo adottato per indicarlo è il seguente: 𝒟𝒟 = �𝑎𝑎𝛾𝛾(𝑡𝑡)�𝛾𝛾∈Γ.

3.8.2 La procedura di espansione lineare

Solitamente, la rappresentazione di un segnale 𝑓𝑓(𝑡𝑡) non necessita del dizionario nella sua interezza. Attuare una simile scelta significherebbe incrementare inutilmente il carico computazionale. Conviene, piuttosto, selezionare solo un opportuno sottoinsieme degli atomi.

Per semplicità, si assume che tale sottoinsieme sia numerabile, ossia esprimibile come: �𝑎𝑎𝛾𝛾𝑠𝑠(𝑡𝑡)�𝑠𝑠∈ℕ dove 𝛾𝛾𝑠𝑠 = [𝑢𝑢𝑠𝑠, 𝑠𝑠𝑠𝑠, 𝜉𝜉𝑠𝑠]

Limitandosi a questa scrematura del dizionario, il segnale originario può essere decomposto mediante una combinazione lineare del tipo [21]:

𝑓𝑓(𝑡𝑡) = � 𝑚𝑚𝑠𝑠 𝑎𝑎𝛾𝛾𝑠𝑠(𝑡𝑡)

+∞ 𝑠𝑠=0

Evidentemente, i coefficienti 𝑚𝑚𝑠𝑠 esibiscono una spiccata dipendenza dalla selezione degli atomi. Peraltro, ad esserne influenzato non è solo il valore, ma anche il significato assunto dagli stessi coefficienti.

3.8.3 Due esempi concreti

Per esempio, nel caso si adotti la funzione finestra della trasformata di Fourier, tutti gli atomi presentano lo stesso fattore di scala, ossia 𝑠𝑠𝑠𝑠 = 𝑠𝑠0, ∀𝑠𝑠 ∈ ℕ. Di conseguenza, si trovano praticamente tutti localizzati nello stesso intervallo, di ampiezza proporzionale alla costante 𝑠𝑠0.

Inevitabilmente, le prestazioni di una simile configurazione sono mutevoli e dipendono da come sono distribuiti gli elementi strutturali caratteristici del segnale. Se questi sono rintracciabili in un intervallo di ampiezza paragonabile a 𝑠𝑠0, i coefficienti 𝑚𝑚𝑠𝑠 forniscono effettivamente informazioni sulla loro localizzazione nel dominio del tempo e sul loro contenuto spettrale nel dominio della frequenza. Gli stessi atomi, al contrario, si rivelano inefficaci per descrivere strutture che occupino un intervallo di ampiezza molto superiore o molto inferiore a 𝑠𝑠0.

A maggior ragione, se il segnale presenta componenti di diverse dimensioni, conviene rivolgersi direttamente ad un altro dizionario. Nel caso particolare, il candidato ideale deve ammettere una gamma più ampia di fattori di scala.

A questa esigenza può rispondere, almeno in parte, la famiglia delle trasformate Wavelet. Gli atomi che se ne ricavano esibiscono un’interessante proprietà. I valori assunti dai parametri non sono del tutto indipendenti. In particolare, la frequenza portante 𝜉𝜉𝑠𝑠 è legata al fattore di scala 𝑠𝑠𝑠𝑠 dalla relazione

𝜉𝜉𝑠𝑠 = 𝜉𝜉0/𝑠𝑠𝑠𝑠, dove 𝜉𝜉0 è una costante. Procedendo all’espansione lineare secondo tale configurazione, i coefficienti 𝑚𝑚𝑠𝑠 forniscono informazioni sulle dimensioni delle diverse componenti.

Una classica applicazione di questo approccio è l’analisi dei cosiddetti oggetti frattali. Nello specifico, si tratta di particolari enti geometrici, caratterizzati da un numero frazionario di dimensioni, solitamente definiti per mezzo di procedure ricorsive. Determinate proprietà di scala fanno, peraltro, sì che rappresentazioni, in scale diverse, dello stesso oggetto frattale presentino similitudini strutturali. In altri termini, se si ingrandisce con un opportuno fattore di scala una porzione comunque piccola dell’oggetto, si riscontrano caratteristiche strutturali che riproducono fedelmente quelle dell’oggetto non ingrandito. Di contro, neanche la famiglia delle trasformata Wavelet è esente da inefficienze e controindicazioni. Per esempio, gli atomi che se ne ricavano incontrano notevoli difficoltà nell’approssimare il contenuto spettrale dei segnali, la cui trasformata di Fourier è ben localizzata nel dominio della frequenza. In particolare, le complicazioni aumentano mano a mano che ci si spinge alle alte frequenze. Questo fenomeno è stato scoperto grazie alla pratica sperimentale, ma gode anche di una coerente spiegazione formale. La causa scatenante è proprio la frequenza portante 𝜉𝜉𝑠𝑠, vincolata ad essere inversamente proporzionale al fattore di scala 𝑠𝑠𝑠𝑠.

3.8.4 Una decomposizione adattativa

In sede di presentazione dell’algoritmo, la procedura di decomposizione è stata definita adattativa. Il significato di quell’espressione non è immediatamente palese e si apre a molteplici interpretazioni. Questa breve carrellata consente di dissipare ogni incertezza. Infatti, considerati gli esempi proposti, emerge con chiarezza un risultato quanto mai significativo.

Dato un generico segnale, che presenti anche componenti spettrali ad alta frequenza o di dimensione variabile, è impossibile stabilire a priori quali siano gli atomi più opportuni. La scelta, in tal senso, deve essere continuamente aggiornata e deve basarsi sulle proprietà locali dell’intorno considerato.