FACOLTÀ DI ECONOMIA Prova di autovalutazione
ANALISI STATISTICA PER LE IMPRESE (3 CFU)
NB Come potete vedere facendo la somma dei punteggi il numero di quesiti è superiore a quello che è richiesto di risolvere per la prova relativa ai 3 CFU finali, l’insieme è ampio solo per darvi un quadro più ampio delle tipologie di esercizio
Vi invito a svolgere la prova seriamente, con l’obiettivo di testare il livello della vostra preparazione. La correzione in aula degli esercizi avverrà il giorno 30 maggio nell’orario di lezione. BUON LAVORO
TEST ((barrare con una crocetta la risposta che si ritiene esatta, 1.5 punti per ogni risposta esatta) 1. L’analisi fattoriale è una tecnica di analisi statistica che si utilizza per
a. ridurre il numero di osservazioni
b. ridurre il numero di variabili di analisi ad un sottoinsieme delle variabili osservate c. ridurre il numero di variabili di analisi ad un insieme di nuove variabili ottenute come
combinazione lineare di quelle originali X
2. Nell’analisi cluster di tipo gerarchico, ‘risalendo il dendrogramma’ nella direzione in cui il numero di gruppi decresce che cosa succede all’omogeneità interna dei gruppi
a. resta costante
b. cresce
c. decresce X
3. Specificato un modello di regressione logistica logit(Πi)=β0+β1Xi1+β2Xi2+β3Xi3, se il coefficiente β3 fosse pari a 2, potrei concludere: che per un aumento unitario di Xi3
a. il logit(Πi) cresce in media di 2 unità fermo restando tutto il resto
X
b. la probabilità di successo Πi cresce in media di 2 unità fermo restando tutto il resto c. il rapporto tra la probabilità di successo e la probabilità di insuccesso cresce in media di 2 unità fermo restando tutto il resto.
Domanda Aperta da 2 punti
Descrivere sinteticamente l’obiettivo dell’analisi cluster
A partire da un collettivo di unità statistiche (popolazione o campione), l’obiettivo generale dell’analisi cluster è quello di formare gruppi di unità statistiche omogenei al loro interno e tra loro eterogenei.
Ovviamente perchè l’analisi abbai senso è necessario che il numero di gruppi sia molto minore del numero delle unità statistiche.In azienda tale analisi può essere molto utile per segmentare la domanda, la clientela, aree geografiche ecc.
...
...
Esercizio da 6 punti
La seguente tabella riporta l’output relativo all’analisi fattoriale) relativa a 6 variabili (X1,... ,X6).
(principal components; 6 components retained) Component Eigenvalue Proportion Cumulative --- 1 2.73119 _________ _________
2 2.21812 _________ _________
3 0.44160 _________ _________
4 0.34126 _________ _________
5 0.18263 _________ _________
6 0.08521 _________ _________
La tavola dei factor loading ruotata è la seguente:
(varimax rotation)
Rotated factor loadings --- Variable | Factor1 Factor2 | Uniqueness ---+---+--- X1 | 0.7900 0.1773 | 0.3411 X2 | -0.7080 0.2800 | 0.4191 X3 | 0.8031 -0.0277 | 0.3543 X4 | -0.0821 0.9353 | 0.1185 X5 | -0.0054 0.9340 | 0.1277 X6 | -0.7599 0.1953 | 0.3844
a) Completare la tabella nelle colonne Proportion, Cumulative
b) quale quota di variabilità spiegano i primi due fattori?
c) In termini percentuali a quanto ammonta l’incremento di variabilità che riesco a spiegare prendendo 3 fattori invece che 2?
d) In base alla tavola di rotazione dei fattori, scrivere le equazioni che esprimono le variabili originali X come combinazione lineare dei fattori comuni e unici ruotati.
autov Proportion Cumulative incremento
2,73119 0,455 0,455
2,21812 0,370 0,825
0,44160 0,074 0,898 0,074
0,34126 0,057 0,955
0,18263 0,030 0,986
0,08521 0,014 1,000
6,00000 1,000
...
...
...
...
X1=0.7900 F1+ 0.1773 F2+ 0.3411 U1 X2 =0 -0.7080 F1+ 0.2800 F2+ 0.4191 U2
……….
X6= -0.7599F1+ 0.1953F2+ 0.3844 U6 Esercizio da 3 punti
Vogliamo valutare la capacità predittiva di un modello logit stimato su un campione di 300 aziende delle quali si è riscontrato a posteriori che 215 sono risultate ‘sane’ e 85 sono risultate insolventi. La soglia per la classificazione delle aziende è stata fissata a p=0.6.
La seguente tabella di contingenza riporta i valori osservati e previsti dal modello sullo stato di salute dell’azienda
valori osservati
valori previsti insolvente sana totale
insolvente 20 15 35
sana 65 200 265
totale 85 215 300
Sulla base della suddetta tabella:
a) Determinare la percentuale di aziende insolventi previste correttamente
b) Per l’azienda di credito è più grave sbagliare la previsione prevedendo sana un’azienda che risulterà insolvente o prevedere insolvente un’azienda che risulterà sana? Motivare risposta c) Calcolare lo pseudo R2 commentando il valore ottenuto
...
...
.a) 20/85=0,235
Quindi il 23,5% delle aziende insolventi viene previsto correttamente;
...
.b) E’ più grave prevedere sana un’azienda che risulterà insolvente, in quanto in questo caso il finanziamento verrà dato ed il debito non verrà saldato a non verrà saldato nei tempi stabiliti.
Questo per i finanziatori è un grave danno
...
.c) 220/300=0,73
Quindi il 73,3% delle previsioni effettuate risulta corretto.
...
...
...
...
Esercizio da 3 punti
Vogliamo prevedere lo stato di salute di un’azienda AAA che si è recata presso un’azienda di credito per la concessione di un finanziamento. Il modello logit che è stato stimato per effettuare la previsione sullo stato di solvibilità di un’azienda ha fornito le seguenti stime
Parametri stimati (Intercept) -10
X2 -5.6
X3 30.5
X4 19.9
X5 -3.9
X6 -6.5
Di seguito sono riportati i valori che per l’azienda AAA assumono le variabili esplicative specificate nel modello di previsione
X2= 0.005 X3= 0.03
X4= 0.7
X5= 0.2
X6= 0.08
Stabilire sulla base delle informazioni fornite se l’azienda AAA si prevede sana o insolvente fissata la soglia per la classificazione delle aziende pari a 0.5.
...
P=exp(X*Beta)/(1+exp(X*Beta))= exp(3,517)/(1+exp(3,517))=0,97>0,5 quindi l’azienda AAA si prevede SANA
Esercizio 2 punti
Su un campione di 500 individui è stato condotta un’indagine per capire le preferenze dei soggetti rispetto al modo di prenotare le vacanze.
Uno degli interesse è capire se i soggetti che prenotano le vacanze on line preferiscono prenotare on line direttamente dalla pagina web della struttura ricettiva o tramite portali di prenotazione vari (Y=1 se direttamente, 0 se tramite portali di prenotazione). Si è specificato un modello logit per la stima della probabilità di prenotazione diretta, le covariate sono genere
(0=femmina, 1 maschio); vacanza con la famiglia (1 se si’ 0 altrimenti), edu (istruzione in anni di scuola). I parametri stimati sono i seguenti:
interc -4
gener
e 1
famigl
ia 1,5
edu 1
Calcolare l’odds ratio (OR) della variabile FAMIGLIA e commentare il risultato
Devo calcolare exp(1,5)= 4,481689 (strada breve) Strada lunga:
Devo calcolare p/(1-p) per famiglia =1, lo stesso per famiglia =0: il rapporto tra i due valori calcolati è l’OR=4,481689; quindi andare in vacanza con la famiglia fa quadruplicare la probabilità, di prenotare on line direttamente
dalla pagina web della struttura ricettiva
********************************************************************************
Esercizio 3 punti (relativo al programma dei primi 6 cfu, cap 4.7, quindi non entra a far parte della prova parziale del 5 giugno)
Supponiamo che la quantità di vino prodotta in una cantina da un noto marchio DOC sia di
244 milioni di bottiglie nel 2014 e di 245 milioni di bottiglie nel 2015, che le ore lavorate in azienda nel 2015 siano state pari a 130000 e nel 2016 pari a 133000.
Calcolare la variazione della produttività del lavoro tra il 2014 ed il 2015 e commentare i risultati.
bot ore
2014 244 130000
2015 245 133000
IY=245/244=1,004
IL=133000/130000=1,023
IY/IL=0,981
Tra il 2014 ed il 2015 c’è stata una riduzione della produttività del lavoro di circa il 2%.