Top PDF Stima di massima verosimiglianza penalizzata per il modello Rash.

Stima di massima verosimiglianza penalizzata per il modello Rash.

Stima di massima verosimiglianza penalizzata per il modello Rash.

Negli ultimi anni, sempre di più, i metodi di regolarizzazione sono stati oggetto di interesse nel mondo della ricerca. Questi, infatti, permettono di risolvere problematiche che si sono presentate solo di recente nell’analisi dei dati. Quando l’obiettivo dello studio è ottenere un modello in grado di predire al meglio un determinato fenomeno, un modello regolarizzato può restitui- re predizioni con errore quadratico medio inferiore; quando, in un modello di regressione, si hanno molte variabili esplicative, può essere fondamentale una buona selezione delle variabili, cosa che alcuni metodi di regolarizzazione è stato dimostrato svolgono egregiamente. Problemi del genere si pongono spesso nel mondo d’oggi, in cui molti servizi si basano sull’accuratezza delle predizioni dei loro modelli, e in cui il basso costo della raccolta di informazio- ne permette di avere insiemi di dati da analizzare di dimensione anche molto elevata. In questa tesi, i metodi di regolarizzazione vengono utilizzati per le loro proprietà di shrinkage, ovvero la capacità di comprimere le stime di determinati parametri verso lo zero; i parametri incidentali saranno oggetto della compressione, in modo che i parametri strutturali possano essere sti- mati in maniera più efficace. Questo approccio, a differenza di quello basato sulla verosimiglianza condizionata, può essere applicato a qualsiasi tipo di
Mostra di più

80 Leggi di più

Metodi per la riduzione della distorsione dello stimatore di massima verosimiglianza

Metodi per la riduzione della distorsione dello stimatore di massima verosimiglianza

Questo primo capitolo ha il solo obiettivo di richiamare alcuni concetti fon- damentali dell’inferenza statistica; dopo una breve definizione di modello statistico parametrico, vengono richiamate le nozioni di stima e stimatore di un parametro, passando poi alla presentazione delle propriet`a finite e asintotiche degli stimatori stessi. Nel quinto paragrafo viene analizzata la funzione di verosimiglianza, per giungere, nel sesto paragrafo, alla defi- nizione dello stimatore di massima verosimiglianza e ad una sintesi delle sue propriet`a. Infine, nel settimo paragrafo, viene introdotta la definizio- ne di famiglia esponenziale. I testi di riferimento utilizzati sono Azzalini (2001), Pace e Salvan (2001) e Piccolo (2006).
Mostra di più

57 Leggi di più

Sulla stima degli iperparametri di un modello lineare generalizzato dinamico

Sulla stima degli iperparametri di un modello lineare generalizzato dinamico

[186,] 74388.40 75417.80 75709.98 75784.63 75799.59 75801.48 75801.54 75801.54 NA [187,] 74388.59 75417.93 75710.10 75784.74 75799.70 75801.59 75801.66 75801.66 NA [188,] 74388.78 75418.06 75710.21 75784.86 75799.82 75801.70 75801.77 75801.77 NA [189,] 74388.97 75418.19 75710.33 75784.97 75799.93 75801.81 75801.88 75801.88 NA [190,] 74389.15 75418.32 75710.44 75785.08 75800.04 75801.92 75801.99 75801.99 NA dove la prima matrice di R riporta i valori di PL(α) e la seconda quelli di l(y 1 , . . . , y T , α 0 , . . . , α T ; θ). I valori di riga, ad eccezione di quelli nella prima colonna, che riporta i valori della verosimiglianza calcolati con GKFS, indicano i valori di verosimiglianza per ogni iterazione dell’algoritmo WKFS fino a quando il criterio di convergenza imposto sugli α non ` e soddisfatto: i valori NA della matrice indicano che la verosimiglianza non `e stata calcolata perch´ e, appunto, l’algoritmo aveva gi` a raggiunto la convergenza. Da una riga alla successiva cambia il valore degli iperparametri, che vengono ristimati secondo le equazioni riportate nell’algoritmo di tipo EM della sezione 3.1. In pratica, si possono identificare le righe con l’indice p dell’algoritmo di tipo EM e le colonne con l’indice k dell’algoritmo IWKFS della sottosezione 2.4.2. Come si pu` o notare, i valori per ogni riga aumentano andando da si- nistra verso destra, mentre, passando da una riga alla successiva, il valore per cui viene raggiunta la convergenza (ossia l’ultimo valore della riga pri- ma di NA) nel caso di PL(α) diminuisce, in apparente contrasto con la de- finizione di massima verosimiglianza: infatti, il valore corretto ` e quello di
Mostra di più

102 Leggi di più

Validità dei test basati sulla verosimiglianza penalizzata in modelli log-lineari

Validità dei test basati sulla verosimiglianza penalizzata in modelli log-lineari

24 Riduzione della distorsione tramite funzione score penalizzata calcolare la stima di massima verosimiglianza e nel correggerla con una stima della distorsione; metodi di questo tipo sono il jackknife, il bootstrap e il metodo di correzione asintotico; tutti questi metodi sono capaci di rimuovere il termine O(n −1 ) da b(ˆ θ; θ). Nel secondo caso, invece di partire dalle stime, si modifica la funzione score in modo che lo stimatore che ne deriva abbia una distorsione di ordine inferiore; in particolare, nel prossimo paragrafo verrà presentato il metodo implicito capace di rimuovere il termine O(n −1 ) da b(ˆ θ; θ). Per ulteriori informazioni sulla correzione della distorsione, si veda Kosmidis ( 2014 ).
Mostra di più

63 Leggi di più

Alcune anomalie dei test di verosimiglianza

Alcune anomalie dei test di verosimiglianza

Uno dei test statistici più utilizzati e comuni è il test di Wald, che per la sua semplicità e intuitività è spesso riportato di default negli output di software statistici. Nonostante la sua vasta diusione, il test di Wald presenta alcune lacune, in primis la non invarianza rispetto a riparametrizzazioni. Un secondo aspetto problematico è la possibile non monotonicità all'allontanarsi della stima di massima verosimiglianza dal valore sotto l'ipotesi nulla. Tale fenomeno è stato evidenziato da Hauck e Donner (1977) per i test su un coeciente di regressione nel modello di regressione logistica e ulteriormente esplorato da Væth (1985) nelle famiglie esponenziali di ordine uno. Lo scopo della relazione è fornire un approfondimento del `fenomeno di Hauck-Donner' nell'ambito di modelli lineari generalizzati per dati binari e Poisson.
Mostra di più

49 Leggi di più

Applicazione della teoria dei valori estremi per la stima della dimensione massima delle cellule degli alberi

Applicazione della teoria dei valori estremi per la stima della dimensione massima delle cellule degli alberi

Assumendo che n sia sucientemente grande da applicare il modello GEV ai dati, adesso il problema è fare inferenza sui parametri (µ, σ, ξ). Tra le varie tecniche possibili, la tecnica della Verosimiglianza risulta preferibile a tutte, anche se presenta i suoi svantaggi. Una dicoltà concerne le proprietà asintotiche a cui questo metodo deve sottostare. Queste condizioni non sono soddisfatte dal modello GEV perchè i punti nali delle distribuzione sono funzioni dei parametri (µ − σ/ξ per ξ<0). Questa violazione delle condizioni regolari sta a signicare che i risultati standard di questo metodo non sono applicabili automaticamente. Smith (1985) studiò questo problema in dettaglio e ottenne i seguenti risultati:
Mostra di più

63 Leggi di più

Equazioni di stima e metodi di selezione del modello

Equazioni di stima e metodi di selezione del modello

procedure inferenziali. Pertanto, nelle situazioni in cui non si abbiano su- cienti informazioni sul fenomeno d'interesse, provenienti dai dati o da altre fonti (ad esempio indagini precedenti), è auspicabile ricorrere a statistiche robuste rispetto alla specicazione scorretta (misspecication). La letteratu- ra statistica propone l'utilizzo di equazioni di stima robuste, ovvero oppor- tune equazioni di stima che devono sottostare a determinati vincoli. Un'im- portante classe di stimatori legata alle equazioni di stima robuste è quella degli stimatori di tipo M (M-estimators), introdotta da Huber (Huber, 1964, Hampel et al., 1986). Il nome deriva da maximum likelihood type estima- tors essendo, gli stimatori di tipo M, una generalizzazione degli stimatori di massima verosimiglianza.
Mostra di più

65 Leggi di più

Metodi di verosimiglianza per la stima della sovradispersione nel modello binomiale negativo

Metodi di verosimiglianza per la stima della sovradispersione nel modello binomiale negativo

D(y; ˆ µ) = 2φ(l µ (y, φ) − l µ (ˆ µ, φ)), (2.3) dove l µ indica la log-verosimiglianza del modello lineare generalizzato nella para- metrizzazione (µ, φ). Il termine l µ (y, φ) rappresenta la log-verosimiglianza calco- lata ponendo µi = y i , ossia adattando il modello di regressione saturo con p = n. Il termine l µ (ˆ µ, φ) rappresenta invece la log-verosimiglianza calcolata nella stima di massima verosimiglianza ˆµ, ossia adattando il modello di regressione corrente con p < n parametri. La (2.3) esprime una misura della diminuzione nella bontà di adattamento passando dal modello saturo al modello con p variabili esplicative: valori grandi esprimono un allontanamento dei valori predetti ˆµi dai valori osser- vati yi. Può essere anche utilizzato, sotto certe condizioni, come test di bontà di adattamento.
Mostra di più

71 Leggi di più

Stima non distorta in mediana del modello di Rash

Stima non distorta in mediana del modello di Rash

L'obiettivo secondario della tesi risiede nel confronto fra lo stimatore non distorto in mediana e gli altri metodi introdotti per la stima del modello di Rasch; nel Capitolo 4 si presentano gli studi di simulazione che sono stati proposti a tale ne. Per il modello logistico ad un parametro si sono conside- rate le stime: di massima verosimiglianza, non distorta in media, di massima verosimiglianza condizionata e con eetti casuali per i soggetti. Ne risulta che la stima di massima verosimiglianza porta a risultati inferenziali non af- dabili a causa del problema di Neyman Scott sui modelli con un elevato numero di parametri incidentali e di casi in cui le stime non esistono nite; la stima di massima verosimiglianza condizionata e quella con eetti casuali risultano ecienti per la stima dei parametri relativi agli item, ma hanno come principale limite quello di non poter stimare congiuntamente anche i parametri ad eetti ssi per i soggetti. Inne lo stimatore non distorto in media è l'unico che stima congiuntamente l'intero vettore dei parametri del modello e garantisce l'esistenza delle stime; i vari indici di errore, quali il root mean square error, il median absolute error e la copertura empirica degli intervalli di condenza, lo indicano come la miglior scelta in letteratura.
Mostra di più

111 Leggi di più

Teoria moderna della verosimiglianza: applicazioni nella fisica delle particelle

Teoria moderna della verosimiglianza: applicazioni nella fisica delle particelle

Spesso, nelle applicazioni, i modelli possiedono svariati parametri, dei quali solo alcuni di diretto interesse per la ricerca. I restanti, neccessari affinch´e il modello sia realistico, assumono tuttavia un’importanza secondaria. Si dir`a dunque che il vettore dei parametri θ = (φ, λ) di dimensione p `e costituito da k parametri di interesse (indicati con φ) e p−k parametri di disturbo (indicati con λ), dove 1 ≤ k < p. Allo scopo di eliminare λ, un approccio abbastanza generale consiste nel sostituirlo con la sua stima di massima verosimiglianza, ottenuta considerando φ fissato. La stima cos`ı ricavata viene inserita nella funzione di log-verosimiglianza, che assume il nome di log-verosimiglianza profilo
Mostra di più

68 Leggi di più

Verosimiglianza a coppie in modelli normali multivariati

Verosimiglianza a coppie in modelli normali multivariati

La verosimiglianza composita `e costruita da una combinazione di validi oggetti di verosimiglianza, di solito legati a piccoli sottoinsiemi di dati. Il vantaggio della verosimiglianza composita `e quello di ridurre la com- plessit`a computazionale in modo che sia possibile far fronte a grandi in- siemi di dati e modelli complessi che presentano difficolt`a a causa di in- terdipendenze di elevate dimensioni, che non rendono possibile l’utilizzo della verosimiglianza standard. Un altro aspetto vantaggioso della verosi- miglianza composita `e che si pu `o fare inferenza sui parametri di interesse senza fare assunzioni sulla distribuzione congiunta dei dati.
Mostra di più

69 Leggi di più

Inferenza basata sulla verosimiglianza per l'indice di Youden

Inferenza basata sulla verosimiglianza per l'indice di Youden

Nel capitolo precedente si è visto che è difficile riuscire ad ottenere la distri- buzione esatta delle statistiche che derivano dalla verosimiglianza, per cui si studia il loro comportamento quando la numerosità campionaria è molto alta. Per modelli statistici parametrici regolari, il teorema del limite centrale e la legge dei grandi numeri permettono di ottenere una serie di risultati asintotici che riguardano la stima di massima verosimiglianza, intervalli di confiden- za e test d’ipotesi. Tali approssimazioni risultano tuttavia poco accurate in certe situazioni e a partire dagli anni ’80 dello scorso secolo sono emerse nuove procedure basate su approssimazioni di ordine superiore. Lo scopo è di rendere più accurate le usuali approssimazioni normale o chi-quadrato per le statistiche di tipo r e W , nel caso di numerosità campionaria piccola o moderata, e di tenere conto della presenza di parametri di disturbo.
Mostra di più

76 Leggi di più

Verosimiglianza composita marginale

Verosimiglianza composita marginale

Quando si analizzano dati raggruppati, si può modellare esplicita- mente la dipendenza, utilizzando ad esempio i minimi quadrati general- izzati e le equazioni di stima generalizzate, in modo tale da sostituire nelle equazioni di stima la matrice di covarianza diagonale con una matrice di covarianza che riflette le dipendenze entro i gruppi. In alcune situazioni le equazioni di stima generalizzate producono stimatori distorti che pos- sono mancare di robustezza e le funzioni di stima possono soffrire di non identificabilità dei parametri.

76 Leggi di più

Inferenza su p(x<y) basata sulla verosimiglianza profilo modificata: il modello bi-normale

Inferenza su p(x<y) basata sulla verosimiglianza profilo modificata: il modello bi-normale

Questa relazione può essere raffigurata tramite una linea che si ottiene riportando, in un sistema di assi cartesiani e per ogni valore possibile di cut-off, la proporzione di veri positivi in ordinata e la proporzione di falsi positivi in ascissa. L’unione dei punti ottenuti riportando nel piano cartesiano ciascuna coppia (Se) e (1-Sp) genera una curva spezzata con andamento a scaletta (ROC plot). Per interpolazione, è possibile eliminare la scalettatura (smoothing) ed ottenere una curva (ROC curve) che rappresenta una stima basata sui parametri del data set sperimentale (Figura 3). Un buon test diagnostico avrà curva ROC il più possibile sopra la bisettrice.
Mostra di più

33 Leggi di più

Estensione di un modello econometrico multiequazionale: specificazione e stima degli impieghi e dei depositi bancari

Estensione di un modello econometrico multiequazionale: specificazione e stima degli impieghi e dei depositi bancari

impieghi bancari; dal tasso di interesse sugli impieghi, all’aumentare degli interesse diminuisce la richiesta di prestiti alle banche; dalla retribuzione ritardata, cioè la retribuzione del periodo precedente, se aumenta diminuisce la necessità di impieghi bancari del periodo successivo; dall’indice di produzione industriale destagionalizzata; nonché dalla dummy che si riferisce al mesi di giugno e dalle dummy per dicembre 2002 e dicembre 2003 che servono a far adattare meglio la stima al vero valore della serie cioè a lisciare i residui.
Mostra di più

57 Leggi di più

Stima bayesiana di un modello per la curva di fecondità basato sulla distribuzione normale asimmetrica.

Stima bayesiana di un modello per la curva di fecondità basato sulla distribuzione normale asimmetrica.

La distribuzione dei tassi di fecondità per età è una funzione definita sull’in- tervallo di età in cui una donna è fertile. Generalmente questo intervallo è fissato a 15-44 oppure a 15-49 anni, ma a volte i dati comprendono intervalli anche più ampi come 12-55 anni. La curva presenta il massimo in un’età che va dai 20 ai 30 anni e, a seconda del paese e dell’anno, si è visto che può ave- re un «hump», generalmente in età adolescenziale. Inoltre, una caratteristica importante di questa distribuzione, comune alla maggior parte dei paesi, è la presenza di un’asimmetria a sinistra che rende la modellazione difficoltosa e per questo, oltre che per l’importanza della tematica, la ricerca di un modello adatto alla stima dei tassi di fecondità è stato oggetto di molti studi nel corso degli ultimi decenni. In Figura 1 abbiamo visto un esempio di quanto può essere asimmetrica la curva in questione, soprattutto nei primi anni.
Mostra di più

68 Leggi di più

Stima del numero di cluster

Stima del numero di cluster

Nella tabella 4.9 che riassume le performance di tutti i metodi considerati, si `e visto che i risultati migliori, in media, sono stati ottenuti dalle statistiche WGapPC, Clest, PS e dal[r]

88 Leggi di più

Stima della produzione solida in bacini idrografici con differenti caratteristiche mediante l'applicazione del modello EPM

Stima della produzione solida in bacini idrografici con differenti caratteristiche mediante l'applicazione del modello EPM

Moore & Burch, nel 1986, hanno proposto l’evoluzione di questo metodo per essere adattato ad ambienti topografici più complessi. Viene così introdotto il modello RUSLE (Revised Universal Soil Loss Equation). Essendo l’evoluzione della USLE, come questo, è finalizzato alla stima della perdita di suolo media annua provocata dall’erosione rill ed inter-rill a scala di versante, ma non tiene conto dei fenomeni di trasporto e deposizione. Mantiene la stessa struttura moltiplicativa della USLE, ma aggiorna le procedure analitiche per la determinazione di ciascuno dei sei fattori, grazie alle numerose indagini sperimentali susseguenti ai necessari approfondimenti teorici compiuti nel suo ciclo evolutivo. Inoltre, la principale innovazione presentata nel modello RUSLE è quella di aver incorporato i fattori L e S in un unico fattore denominato LS, che prende in considerazione la convergenza dei flussi idrici lungo il versante.
Mostra di più

177 Leggi di più

Stima delle emissioni inquinanti in una rete stradale urbana : definizione e sviluppo di un modello mesoscopico basato su assegnazione dinamica del traffico

Stima delle emissioni inquinanti in una rete stradale urbana : definizione e sviluppo di un modello mesoscopico basato su assegnazione dinamica del traffico

Da un punto di vista modellistico un modello di offerta dinamico mesoscopico esprime flussi e prestazioni del sistema in maniera analoga al caso statico; i due modelli sono molto simili tra loro ma con una importante differenza: nel modello dinamico mesoscopico la propagazione è dipendente dalla prestazione d’arco. In sostanza il numero di utenti presente su un arco in un dato istante dipende dai tempi di viaggio necessari agli utenti per raggiungere quell’arco, che a loro volta dipendono dal numero di utenti incontrati sugli altri archi della rete negli istanti precedenti. Pertanto non è possibile una risoluzione sequenziale del modello di propagazione del flusso sulla rete e del modello di prestazione d’arco proprio per via di una dipendenza circolare tra gli stessi. In letteratura questo problema è noto come “caricamento dinamico della rete” (DNL- Dynamic Network Loading”).
Mostra di più

146 Leggi di più

Show all 217 documents...