• Non ci sono risultati.

Conclusioni e discussione

CAPITOLO 4: Analisi di una situazione realistica

Alla fine del capitolo precedente è stato motivato come nella pratica sia impossibile ottenere un sistema VST per realtà aumentata perfettamente e sempre ortoscopico. Considerato ciò, l’impiego di specchi per spostare il centro di proiezione delle camere sarebbe assurdo, ed infatti c’è chi ha il dubbio che sia mai stato impiegato. Inoltre non esistono sistemi commerciali che implementano detta funzionalità.

Il seguito della tesi prende quindi in considerazione implementazioni di visori VST nei quali si può avere la coincidenza tra i centri di proiezione del display e quello dell’occhio, ma si avrà sempre un offset tra i centri appena citati ed il centro di proiezione della camera. La presenza di questo offset porta a delle intrinseche aberrazioni geometriche.

Spesso nei sistemi commerciali le camere sono montate centralmente ed in asse con i display, così da ottenere un offset solo lungo la direzione antero-posteriore. In questo caso si avrà perlopiù un effetto di magnificazione (aumento della dimensione apparente di un oggetto). Per compensare tale effetto si può intervenire via software applicando uno zoom (riduzione o ingrandimento a seconda della posizione della camera rispetto ai display e dei loro angoli di vista), così da riadattare le dimensioni dell’immagine acquisita con quelle dell’oggetto reale percepito ad occhio nudo. Da notare che l’aggiustamento delle immagini tramite zoom fornirà un risultato perfetto solo alla distanza per la quale è stato calcolato il fattore di ingrandimento/riduzione, mentre più in avanti o più indietro si avrà comunque incongruenza tra le dimensioni degli oggetti visti attraverso la telecamera rispetto alla vista ad occhio nudo, poiché non c’è coincidenza tra i centri di proiezione.

In generale, su un piano di riferimento si può avere l’esatta corrispondenza geometrica tra ciò che si vede attraverso il sistema VST e ciò che si vedrebbe ad occhio nudo anche in caso di offset della camera lungo le altre direzioni; lo si può fare applicando una trasformazione di omografia 2D-2D tra piani nello spazio, in questo caso particolare tra il piano immagine della camera ed il piano immagine del display, affinché sia visto dall’occhio senza aberrazioni geometriche.

Poiché l’omografia permette di eliminare le aberrazioni geometriche su un piano, nel seguito della tesi si va ad indagare se con l’applicazione di opportune omografie si sia in grado di ridurre le aberrazioni prospettiche nel caso di sistemi VST reali non ortoscopici.

47 Come detto in precedenza, per l’ottenimento delle immagini dei casi reali è necessario applicare un’omografia ai frame acquisiti dalle telecamere prima di poterle riproiettare sui display. Quest’approccio, come descritto nel capitolo 1, è già stato proposto da Fuchs e Takagi [40, 41, 44]. Date queste prerogative teoriche rimangono comunque aperte le seguenti domande che derivano dall’analisi fatta nel capitolo precedente:

- Al fine di ridurre le aberrazioni geometriche introdotte dal sistema VST, oltre che applicare l’omografia è necessario ruotare i display?

- È strettamente necessario cambiare la convergenza delle camere in funzione della distanza del punto di fissazione?

- Qual è il contributo dovuto alla variabilità del posizionamento dell’occhio rispetto al centro di proiezione dei display?

In questo capitolo si cercherà di dare una risposta ai primi due quesiti, mentre il terzo verrà affrontato nel capitolo successivo.

48

L’omografia

L’omografia è definita come una relazione biunivoca tra i punti di sue spazi, tale per cui ogni punto del primo spazio corrisponde ad uno ed un solo punto del secondo spazio. Trattandosi in questo caso di trasformazione tra due piani immagine, in particolare il piano immagine della camera che inquadra il mondo ed il piano immagine dell’occhio, è possibile semplificare l’approccio al problema utilizzando le omografie planari, ovvero le trasformazioni da 2D a 2D che modellano le corrispondenze tra due viste di uno stesso piano.

La formula utilizzata per il calcolo dell’omografia passa per il calcolo della matrice di omografia intermedia tra la camera frontale e l’occhio, che è la seguente:

𝐻

𝑖𝑛𝑡

= 𝑅 +

𝑡 ⋅ 𝑁⊺

𝑑

(

4.1

)

Dove R e t rappresentano rispettivamente la parte rotativa e la parte traslativa della matrice di trasformazione che collega i due sistemi di riferimento in gioco (camera frontale come punto di partenza ed occhio come punto di arrivo), 𝑁⊺ è il versore al piano target che si sta osservando (quindi il piano contenente la griglia di riferimento), mentre d rappresenta la distanza tra il target (la griglia) ed il sistema di riferimento di arrivo (l’occhio).

Ma come è stata ottenuta tale formula? [39]

49 Sia dato un insieme di punti 𝑃𝑖 disposti sul piano di riferimento. Sia 𝑋1 l’insieme di punti 𝑃𝑖 osservati

dalla camera 1, 𝑋2 l’insieme degli stessi punti 𝑃𝑖 osservati dalla camera 2. Grazie alla matrice di

rototraslazione che collega i due sistemi di riferimento possiamo scrivere che:

𝑋

2

= 𝑅 ⋅ 𝑋

1

+ 𝑡

(4.2)

Il vettore normale alla camera 1 è pari a d, ovvero la distanza perpendicolare dal piano

𝜋

contenente i punti:

𝑁

⋅ 𝑋

1

= 𝑛

1

⋅ 𝑋 + 𝑛

2

⋅ 𝑌 + 𝑛

3

⋅ 𝑍 = 𝑑

(4.3)

Riprendendo quindi la formula (4.2) che lega le due camere e moltiplicando e dividendo per d si ottiene:

𝑋

2

= 𝑅 ⋅ 𝑋

1

+ 𝑡 =

= 𝑅 ⋅ 𝑋

1

+ 𝑡 ⋅ (𝑑

𝑑) =

= 𝑅 ⋅ 𝑋

1

+ 𝑡 ⋅

𝑁

⋅ 𝑋

1

𝑑

=

= (𝑅 +

𝑡⋅𝑁⊺ 𝑑

) ⋅ 𝑋

1

(4.4)

La parte entro parentesi dell’equazione (4.4) è proprio uguale alla 𝐻𝑖𝑛𝑡 dell’equazione (4.1).

La matrice così ottenuta nella realtà non è ancora la matrice omografica finale che dovrà essere applicata all’immagine acquisita dalla telecamera; la 𝐻𝑖𝑛𝑡 viene infatti definita omografia intermedia

in quanto tiene conto unicamente della matrice di proiezione che mette in relazione la telecamera ed l’occhio, quindi considera solamente i parametri estrinseci. Per ottenere la matrice omografica finale è necessario premoltiplicare e postmoltiplicare la 𝐻𝑖𝑛𝑡 per la matrice degli intrinseci

dell’occhio (di seguito il frustum di occhio e display verranno considerati identici e coincidenti, pertanto le matrici degli intrinseci di occhio e display sono identiche) e della camera, come mostrato nella seguente formula:

𝐾

𝐷

∙ (𝑅 +

𝑡⋅𝑁⊺

𝑑

) ∙ 𝐾

𝐶 −1

50

Documenti correlati