• Non ci sono risultati.

1. CLASSIFICAZIONE TRAMITE REGRESSIONE LOGISTICA Carichiamo la tabella con anche la classe assegnata: Ec <-

N/A
N/A
Protected

Academic year: 2021

Condividi "1. CLASSIFICAZIONE TRAMITE REGRESSIONE LOGISTICA Carichiamo la tabella con anche la classe assegnata: Ec <-"

Copied!
2
0
0

Testo completo

(1)

1. CLASSIFICAZIONE TRAMITE REGRESSIONE LOGISTICA

Carichiamo la tabella con anche la classe assegnata:

Ec <-

read.table ('clipboard', header=TRUE)

Svolgiamo una classificazione non perentoria tramite il metodo della regressione logistica.

Rlog =glm(classe ~ Education+Health+Accidents+Employment+Export+HealthyYears+GenderPaymentGap+

IndustrialProduction+ TaxesLabour+ TaxesTotal, family = binomial, data=Ec) oppure

Rlog =glm(classe ~., family = binomial, data=Ec)

Purtroppo fornisce errore. La cosa non è infrequente quando ci sono troppe variabili: si pensi che si chiede di minimizzare una funzione molto non lineare di 10 variabili. Un trucco per saltarci fuori è di ridurre la variabili e per farlo in fretta osserviamo la matrice di correlazione cor(Ec). Vediamo che la classe è più correlata a Employment, Export, TaxesTotal (se ne potrebbero aggiungere altre ma rischiamo di ricreare il problema).

Vediamo ora:

Rlog2 =glm(classe ~ Employment+Export+ TaxesTotal, family = binomial, data=Ec) Ora ha funzionato. Vediamo i punteggi e le probabilità:

round(predict(Rlog2) ,3)

fornisce i punteggi del modello di regressione lieare multipla sottostante. Vediamo che i valori dell’output sono più accentuati, rispetto al caso della regressione fatta sopra. Ecco le relative probabilità:

round(predict(Rlog2,type="response"),3)

(2)

Il metodo ora è severissimo! Non dà scampo.

2. Esercizi dai compiti d’esame

Riferimenti

Documenti correlati

Il metodo della Regressione Lineare (o metodo di stima ai Minimi Quadrati) si occupa di individuare, all’interno di un certo ambito di funzioni, una relazione fra le

Supponiamo ora di avere una differente incertezza per ciascuna misura sulle y e che non esista incertezza sulla misura dell’osservabile x. La nuova relazione non è altro che

L’algoritmo di regressione lineare da’ sempre come risultato una retta, indipendemente dal fatto che i punti si collochino o meno sulla una retta stessa.. E’ necessario

Si vuole studiare la relazione che, nelle albicocche vesuviane, lega le variabili “residuo secco rifrattometrico” e “durezza della polpa” alla “estensione del

La Proc Univariate permette di determinare il valore dei principali indici statistici e inserendo l’opzione normal viene effettuato un test di bontà di adattamento della

Si vuole stabilire se esiste una dipendenza fra il flusso di un corso d’acqua (cioè la quantità di acqua che passa in un minuto) e la profondità del corso d’acqua.. Per ottenere

Se l'appartenenza al mondo dell'inconscio può non necessitare di ulteriore discussione, è allora invece opportuno vedere per quale via questo portato inconscio può entrare a fare

• L’obiettivo della verifica è di valutare se uno studente possiede i concetti di indipendenza statistica di due variabili, di verifica delle ipo- tesi (inferenza statistica),