• Non ci sono risultati.

3 PROCEDIMENTI DI STIMA

3.2 METODI UTILIZZATI NEL PANORAMA ESTIMATIVO ATTUALE 1 IL COST APPROACH (CENNI)

3.2.3 ANALISI STATISTICHE

I modelli di inferenza statistica vengono utilizzati per cercare di oggettivare il giudizio di stima consentendo di ridurre il carattere soggettivo delle valutazioni. Una delle tecniche maggiormente utilizzata è l'analisi di regressione multipla (ARM).

La tecnica di regressione è considerata, nella letteratura americana sugli studi di valutazione immobiliare, come la naturale evoluzione dell'analisi comparativa dei prezzi di mercato. Essa infatti gioca un ruolo non marginale nella pratica estimativa anglosassone. L'analisi statistica permette di analizzare una moltitudine di dati e questo ben si adatta al problema delle elaborazioni immobiliari dove sono numerose le relazioni di tipo causa-effetto fra un insieme di variabili esplicative e una variabile spiegata. Le analisi statistiche generalmente vengono suddivise in descrittive e inferenziali; le prime hanno il solo scopo di descrivere una popolazione di dati, mentre le seconde creano modelli di supporto per effettuare un'analisi sull'intera popolazione osservandone solamente un campione. La valutazione immobiliare si avvale dunque del secondo, e più complicato, tipo di analisi.

La tecnica statistica più utilizzata per questo scopo come abbiamo detto, è il metodo della regressione attraverso il quale è possibile ottenere una equazione che riesca a quantificare la relazione fra variabili dipendenti (outcome) e variabili indipendenti (input). Le prime sono generalmente i prezzi degli immobili essendo la loro individuazione lo scopo per il quale l'analisi viene effettuata, mentre le seconde sono rappresentate dalle caratteristiche che incidono sulla

54 formazione degli stessi. Il numero delle variabili indipendenti che possono essere utilizzate varia in base sia alla disponibilità di informazioni riguardanti le caratteristiche, sia in base all'effettivo peso esercitato da queste. In particolare se viene assunto che la variabile outcome sia influenzata da una sola variabile indipendente allora il metodo di regressione utilizzato sarà quello della regressione semplice, mentre se le variabili che giocano nell'analisi sono più di una, allora entra in gioco la regressione multipla.

Senza dubbio la regressione multipla trova molto più spazio applicativo a causa della natura del mercato immobiliare che, come sappiamo, è caratterizzato da una eterogeneità di tipologie edilizie, di segmenti, di variabili e quindi il modello che si presta meglio ad analizzarlo è quello che permette di valutare molti fattori che contemporaneamente incidono sulla formazione del prezzo. Le prime applicazioni dell'analisi di regressione a fini valutativi risalgono alla metà degli anni '20 del secolo scorso, quando fu utilizzata in ambito agricolo. Occorre aspettare gli anni '60 prima di avere testimonianze di applicazione pratica di questo modello nell'estimo civile e nel settore fiscale. In Italia i primi tentativi di applicazione del modello di regressione lineare multipla all'estimo immobiliare, risalgono al 1968 con la pubblicazione di un articolo che descriveva un caso riguardante il mercato milanese, che può essere considerato lo studio pioniere nel nostro paese. La ricerca poi è stata ampliata a livello nazionale, principalmente ai beni immobili urbani. Negli anni '80 gli studi si sono focalizzati sui possibili miglioramenti nell'utilizzo della regressione, in particolare sulla dimensione campionaria e sulla scelta delle variabili da inserire nel modello.

Occorre notare, poi, che l'impiego dei calcolatori elettronici che utilizzano programmi statistici favorisce lo sviluppo di questa tecnica di analisi, anche se talvolta risultano necessari programmi molto sofisticati e non a disposizione di ogni tecnico valutatore. C'è da dire anche che il metodo è basato su relazioni matematiche certe si, ma non facilmente comprensibili a tutti come può essere un'analisi attraverso un metodo comparativo.

L'analisi multilevel viene utilizzata se i dati a disposizione del tecnico possono essere rappresentati mediante una struttura gerarchica nella quale gli immobili rappresentano il primo livello e gli ambiti di mercato il secondo. Questa analisi permette di valutare in modo uniforme (garantito dall'utilizzo di funzioni matematiche) tutti gli immobili che appartengono ad uno stesso segmento o ambito di mercato; per questo motivo gli standard internazionali di valutazione ne prevedono l'utilizzo nel processo di stima. L'attendibilità dei risultati ottenuti dipende dalla capacità del tecnico di rilevare i necessari dati di mercato, dalla scelta dello strumento e dalla calibratura dello stesso in base alla tipologia e numerosità dei dati ottenuti e dalla capacità di analisi dei risultati in base alle caratteristiche.

Il modello di regressione multipla in ambito delle valutazioni immobiliari ha subito molti adattamenti, generalmente dovuti a problemi di non linearità e multicollinearità dei dati. Per risolvere il primo problema è stata sviluppata la Stepwise regression, mentre per la multicollinearità viene utilizzata la trasformazioni di variabili e la Ridge regression.

L'ultima frontiera, invece, dell'analisi di regressione è rappresentata dagli Automated Valuation Models che utilizzano software che consentono, anche in modalità on line, di determinare il valore di un immobile entro un intervallo determinato ad un livello di errore scelto precedentemente. Questi software semplificano molto le operazioni complesse di calcolo necessarie nelle elaborazioni statistiche; infatti i calcoli possono essere effettuati più volte inserendo, eliminando o sostituendo le variabili e creando dei sotto-campioni. Molto importante è l'utilizzo che questi sistemi fanno dei GIS ossia dei sistemi di informazione geografica. Questi ultimi permettono di catturare informazione che possono essere fotografie, codici, mappe in modo facile e in tempo reale.

Il procedimento estimativo mediante l'analisi di regressione multipla (MRA) si svolge in 4 fasi: • definizione dei dati del campione;

• identificazione delle variabili; • determinazione della forma;

55 • analisi dei risultati.

L'ultimo punto prevede che i risultati siano sottoposti alla verifica statistico-estimativa e, se questa non dà i risultati sperati, si aprirà un procedimento a ritroso che identifichi una nuova forma di spiegazione delle relazioni, oppure altre variabili o ancora un nuovo campione di dati.

La prima fase del procedimento, ossia la definizione del campione, assume importanza rilevante ai fini dell'attendibilità dei risultati. Le analisi statistiche, infatti, necessitano di un campione di dati numeroso in quanto le previsioni statistiche aumentano di credibilità in modo proporzionale all'aumento dei dati campionari. La numerosità delle osservazioni da valutare nell'analisi di regressione dipende dai gradi di libertà e dalla relazione fra il numero delle osservazioni e il numero delle variabili indipendenti del modello. Il problema principale dell'utilizzo della regressione è quello che si verifichi il fenomeno dell'OVERFITTING ossia sovra-adeguare il modello ai dati, cioè avere tante caratteristiche per poche osservazioni (immobili compravenduti); il modello, quindi, è utile e ottimizzante quando la banca dati a disposizione è ampia. Il campione viene scelto fra i dati disponibili riguardanti le compravendite di beni realizzate in uno stesso ambito geografico in un arco di tempo non troppo distante dal momento della valutazione.

La seconda fase è legata alla scelta delle caratteristiche immobiliari che secondo l'analista influenzano il prezzo dell'immobile. Il problema della selezione delle variabili presenta le stesse criticità di quelle dei modelli di stima pluriparametrici, con la differenza che nell'analisi di regressione è necessario porre particolare attenzione alle relazioni statistiche fra le variabili prese in esame. In questo caso ci si riferisce al fenomeno della correlazione lineare, cioè il legame fra più variabili rispetto alle reciproche variazioni. Il fenomeno è descritto da un indice statistico chiamato coefficiente di correlazione lineare che può assumere valori compresi fra -1 e 1 a seconda se la correlazione è negativa o positiva. Se il valore è 1 le due variabili sono caratterizzate da una perfetta correlazione diretta, se invece è -1 la loro correlazione sarà perfetta e inversa.

Questa relazione può rappresentare un problema se viene ravvisata una sospetta collinearità fra le variabili in esame che può derivare da una relazione di natura tecnica fra le caratteristiche, da elementi che caratterizzano il sistema economico e quindi difficilmente indipendenti gli uni dagli altri, oppure dalle caratteristiche qualitative per le quali non è possibile esprimere un vero e proprio giudizio ma solo un valore dicotomico che influenza altre variabili (es. le presenza dell'ascensore e il livello di piano). Il problema sorge quando questo fenomeno dà origine a prezzi marginali differenti da quelli attesi dal valutatore. L'effetto principale della multicollinearità è quello di aumentare la varianza degli stimatori dei minimi quadrati dei coefficienti di regressione.

In questi casi esistono più soluzioni che vanno dalla ricerca di nuovi dati, passando per l'aggregazione delle variabili correlate in una o più variabili composte (e indipendenti tra loro), fino all'utilizzo della ridge regression, già nominata precedentemente. Questa consiste nell'introduzione all'interno del modello di informazioni soggettive sotto forma di numeri.

A questo punto vengono calcolate, per ogni variabile scelta, la media e la deviazione standard. Si crea quindi la matrice dai dati X, il vettore dei prezzi y e il vettore di stima b dato dai prezzi marginali per ciascuna caratteristica.

La forma sintetica del modello di regressione multipla lineare è rappresentato in forma sintetica da y= X*b+e

Formula 11: forma sintetica del modello di regressione multipla

e viene risolto per “b”, escludendo la variabile aleatoria e ottenendo, quindi, y=X*b.

A questo punto i membri dell'equazione vengono moltiplicati per X' e risolvendo per b si ottiene: b= (X*X')^(-1)*X'*y

56 Calcolati i valori di b dell'equazione di regressione i valori della variabile dipendente (prezzo) vanno a costituire il vettore y^:

y^= X*(X'*C)^(-1)*X'*y

La terza fase consiste nella specificazione della forma del modello da utilizzare per la stima immobiliare. La determinazione del modello risponde a due scopi:

1. trovare la forma della funzione che rappresenti al meglio la relazione fra le variabili indipendenti e quella dipendente;

2. selezionare le variabili da includere all'interno del modello.

1. La determinazione della forma della funzione avviene presumendo che la relazione fra le variabili indipendenti e quella dipendente sia lineare. Il problema è che nella realtà delle caratteristiche immobiliari questo non è verosimile; infatti molte relazione sono curvilinee, ad esempio possono essere rappresentate da funzioni logaritmiche, esponenziali o curve inverse. Le assunzioni che stanno alla base della linearità della relazione fra le variabili sono la distribuzione normale degli errori, il fatto che la varianza è omoschedastica, gli errori sono indipendenti, le variabili esplicative non sono altamente interrelate fra di loro.

La prima assunzione sta a significare che gli errori attorno alla linea di regressione sono normalmente distribuiti per ogni valore delle variabili indipendenti. Omoschedasticità della varianza significa che essa assume uguale valore per tutte le variabili indipendenti attorno alla retta di regressione. Quando i dati non superano questa assunzione sono necessarie delle trasformazioni che possano essere di due tipi:

• rimpiazzare i valori della variabile dipendente con i loro logaritmi naturali; • rimpiazzare i valori della variabile dipendente con le loro radici quadrate.

Dopo aver definito questa equazione se ne verifica la bontà dell'accostamento mediante l'indice di determinazione. Quindi il modello lineare viene trasformato nel modello non lineare che ha il valore dell'indice di determinazione più basso. I modelli non lineari ma linearizzabili più utilizzati nelle stime immobiliari sono il modello logaritmico, il modello moltiplicativo e il modello di potenza.

2. A questo punto il modello con il maggiore indice di determinazione R2 viene scelto per effettuare la stima.

La decisione di includere, o meno, una variabile all'interno del modello rappresenta un passo fondamentale nel processo di analisi. Possono sorgere dei problemi di accuratezza del modello se vengono compiuti all'interno del processo di selezione degli errori, come l'esclusione di variabili significative, oppure nel caso di modelli sotto (inclusione di poche variabili indipendenti) o sovra- specificati, le correlazioni fra le variabili possono influenzare il peso delle stesse e quindi il giudizio di stima.

Per determinare l'ordine con il quale le variabili vengono inserite all'interno del modello di regressione vengono utilizzate nella prassi tre procedure:

• la forward selection; • la stepwise selection; • la backward elimination.

La forward selection crea l'ordine di entrata delle variabili nel modello in base alla loro correlazione con la variabile dipendente. Per fare questo il procedimento si avvale del test di F cioè del test di significatività. La pratica suggerisce il valore dell'intervallo di confidenza del test di F normalmente pari al 95%. Se le variabili superano il test, vengono inserite nella regressione.

57 La backward elimination invece segue una logica opposta a quella della forward selection. Questo procedimento, infatti, inserisce nel modello in un primo momento tutte le variabili per poi eliminarle successivamente mano a mano che alcune non riescano a superare il test F. In questo caso l'intervallo di significatività verrà stabilito ad un valore minimo al di sotto del quale le variabili saranno eliminate.

La stepwise selection è un mix delle due procedure precedentemente esaminate. In un primo momento la variabile viene selezionata nello stesso modo che con la forward selection, ma subito dopo viene testata la sua significatività come con la backward elimination per prendere in considerazione una eventuale rimozione. La stepwaise selection è fra le tre procedure nominate la più comunemente applicata.

I manuali e le riviste statistiche offrono delle soluzioni per la verifica del modello che è una fase necessaria dell'intero processo. In particolare la verifica può essere effettuata mediante tre modalità: 1. raccogliere nuovi dati da inserire nel modello per verificare l'attendibilità della forma funzionale;

2. confrontare i risultati ottenuti con studi precedenti o impostazioni teoriche; 3. il data splitting.

La prima soluzione generalmente non viene utilizzata nella pratica in quanto lo sforzo di collezionare nuovi dati sarebbe ingente; si preferiscono, quindi, le altre due modalità.

La seconda consiste nel confrontare il peso delle variabili ottenuto mediante il calcolo matematico con il peso e sopratutto il segno che soggettivamente, e quindi con procedimenti extra-statistici, l'analista avrebbe assegnato alla variabile. Il modello infatti può trovare dei segni che razionalmente non avrebbero alcun significato anche se plausibili dal punto di vista matematico.

La terza soluzione consiste nella scissione, appunto lo split, dei dati raccolti creando dei sotto- campioni sui quali vengono poste in essere due fasi:

• model-building set; • validation set.

In pratica il procedimento riguarda il confronto fra i coefficienti e i livelli di significatività del model building set e del modello di regressione ottenuto utilizzando tutti i dati.

I metodi statistici sono anche molto utili per descrivere e presentare i dati. Sfortunatamente, però i modelli non sono molto utilizzati a questo scopo perché possono essere fuorvianti. Questi comportamenti fuorvianti possono derivare da manipolazioni delle scale di misura, dei grafici oppure da omissioni di variabili significative effettuate da chi effettua la regressione, e data la complessità del metodo risulta difficile a chi analizza i risultati scoprire gli errori.

Anche la scarsa conoscenza delle assunzioni caratteristiche della regressione può portare a cattive interpretazioni dei risultati.

Una discussione riguardante l'attendibilità del modello nelle stime immobiliari è la capacità di un campione di rappresentare una popolazione così vasta ed eterogenea. Soprattutto viene messa in discussione la scelta casuale delle proprietà selezionate dalla popolazione, che nella realtà non trova giustificazione. Sebbene i gusti dei consumatori possano essere molti e i più disparati, la scelta casuale esula da ogni scelta razionale che, pur caratterizzata da soggettività, sta alla base delle decisioni di acquisto dei potenziali acquirenti.

Per contro i punti di forza dell'analisi di regressione multipla sono: 1. flessibilità e affidabilità previsionali;

2. riescono a ridurre la soggettività caratteristica del processo estimativo; 3. ricercano la forma algebrica migliore della funzione di stima;

4. verificano l'attendibilità dei risultati mediante l'impiego di altri test statistici.

58 immobili abbastanza simili;

6. visualizzare graficamente le relazioni fra le coppie di variabili migliorandone l'interpretazione.

Per quanto riguarda i limiti del procedimento possono essere elencati come segue: la necessità di utilizzare delle funzioni algebriche che hanno forme predefinite e che, pur essendo scelte fra vari modelli disponibili, non rappresentano la realtà in maniera ottimale; il rischio di ottenere risultati non attendibili a causa della correlazione fra le variabili indipendenti; la difficoltà di rappresentare variabili qualitative non misurabili.

Ultimo, ma non meno importante limite è l'eccessiva numerosità di dati sui quali le analisi devono basarsi per essere attendibili.