• Non ci sono risultati.

FACOLTÀ DI ECONOMIA Prova di autovalutazione ANALISI STATISTICA PER LE IMPRESE (3 CFU)

N/A
N/A
Protected

Academic year: 2021

Condividi "FACOLTÀ DI ECONOMIA Prova di autovalutazione ANALISI STATISTICA PER LE IMPRESE (3 CFU)"

Copied!
1
0
0

Testo completo

(1)

FACOLTÀ DI ECONOMIA Prova di autovalutazione

ANALISI STATISTICA PER LE IMPRESE (3 CFU)

NB Come potete vedere facendo la somma dei punteggi il numero di quesiti è superiore a quello che è richiesto di risolvere per la prova relativa ai 3 CFU finali, l’insieme è ampio solo per darvi un quadro più ampio delle tipologie di esercizio

Vi invito a svolgere la prova seriamente, con l’obiettivo di testare il livello della vostra preparazione. La correzione in aula degli esercizi avverrà il giorno 30 maggio nell’orario di lezione. BUON LAVORO

TEST ((barrare con una crocetta la risposta che si ritiene esatta, 1.5 punti per ogni risposta esatta) 1. L’analisi fattoriale è una tecnica di analisi statistica che si utilizza per

a. ridurre il numero di osservazioni 

b. ridurre il numero di variabili di analisi ad un sottoinsieme delle variabili osservate  c. ridurre il numero di variabili di analisi ad un insieme di nuove variabili ottenute come

combinazione lineare di quelle originali X

2. Nell’analisi cluster di tipo gerarchico, ‘risalendo il dendrogramma’ nella direzione in cui il numero di gruppi decresce che cosa succede all’omogeneità interna dei gruppi

a. resta costante 

b. cresce 

c. decresce  X

3. Specificato un modello di regressione logistica logit(Πi)=β01Xi12Xi23Xi3, se il coefficiente β3 fosse pari a 2, potrei concludere: che per un aumento unitario di Xi3

a. il logit(Πi) cresce in media di 2 unità fermo restando tutto il resto 

X

b. la probabilità di successo Πi cresce in media di 2 unità fermo restando tutto il resto  c. il rapporto tra la probabilità di successo e la probabilità di insuccesso cresce in media di 2 unità fermo restando tutto il resto.

Domanda Aperta da 2 punti

Descrivere sinteticamente l’obiettivo dell’analisi cluster

A partire da un collettivo di unità statistiche (popolazione o campione), l’obiettivo generale dell’analisi cluster è quello di formare gruppi di unità statistiche omogenei al loro interno e tra loro eterogenei.

(2)

Ovviamente perchè l’analisi abbai senso è necessario che il numero di gruppi sia molto minore del numero delle unità statistiche.In azienda tale analisi può essere molto utile per segmentare la domanda, la clientela, aree geografiche ecc.

...

...

Esercizio da 6 punti

La seguente tabella riporta l’output relativo all’analisi fattoriale) relativa a 6 variabili (X1,... ,X6).

(principal components; 6 components retained) Component Eigenvalue Proportion Cumulative --- 1 2.73119 _________ _________

2 2.21812 _________ _________

3 0.44160 _________ _________

4 0.34126 _________ _________

5 0.18263 _________ _________

6 0.08521 _________ _________

La tavola dei factor loading ruotata è la seguente:

(varimax rotation)

Rotated factor loadings --- Variable | Factor1 Factor2 | Uniqueness ---+---+--- X1 | 0.7900 0.1773 | 0.3411 X2 | -0.7080 0.2800 | 0.4191 X3 | 0.8031 -0.0277 | 0.3543 X4 | -0.0821 0.9353 | 0.1185 X5 | -0.0054 0.9340 | 0.1277 X6 | -0.7599 0.1953 | 0.3844

a) Completare la tabella nelle colonne Proportion, Cumulative

b) quale quota di variabilità spiegano i primi due fattori?

c) In termini percentuali a quanto ammonta l’incremento di variabilità che riesco a spiegare prendendo 3 fattori invece che 2?

d) In base alla tavola di rotazione dei fattori, scrivere le equazioni che esprimono le variabili originali X come combinazione lineare dei fattori comuni e unici ruotati.

autov Proportion Cumulative incremento

2,73119 0,455 0,455

2,21812 0,370 0,825

0,44160 0,074 0,898 0,074

0,34126 0,057 0,955

0,18263 0,030 0,986

(3)

0,08521 0,014 1,000

6,00000 1,000

...

...

...

...

X1=0.7900 F1+ 0.1773 F2+ 0.3411 U1 X2 =0 -0.7080 F1+ 0.2800 F2+ 0.4191 U2

……….

X6= -0.7599F1+ 0.1953F2+ 0.3844 U6 Esercizio da 3 punti

Vogliamo valutare la capacità predittiva di un modello logit stimato su un campione di 300 aziende delle quali si è riscontrato a posteriori che 215 sono risultate ‘sane’ e 85 sono risultate insolventi. La soglia per la classificazione delle aziende è stata fissata a p=0.6.

La seguente tabella di contingenza riporta i valori osservati e previsti dal modello sullo stato di salute dell’azienda

valori osservati

valori previsti insolvente sana totale

insolvente 20 15 35

sana 65 200 265

totale 85 215 300

Sulla base della suddetta tabella:

a) Determinare la percentuale di aziende insolventi previste correttamente

b) Per l’azienda di credito è più grave sbagliare la previsione prevedendo sana un’azienda che risulterà insolvente o prevedere insolvente un’azienda che risulterà sana? Motivare risposta c) Calcolare lo pseudo R2 commentando il valore ottenuto

...

...

.a) 20/85=0,235

Quindi il 23,5% delle aziende insolventi viene previsto correttamente;

...

.b) E’ più grave prevedere sana un’azienda che risulterà insolvente, in quanto in questo caso il finanziamento verrà dato ed il debito non verrà saldato a non verrà saldato nei tempi stabiliti.

Questo per i finanziatori è un grave danno

...

.c) 220/300=0,73

Quindi il 73,3% delle previsioni effettuate risulta corretto.

...

...

(4)

...

...

Esercizio da 3 punti

Vogliamo prevedere lo stato di salute di un’azienda AAA che si è recata presso un’azienda di credito per la concessione di un finanziamento. Il modello logit che è stato stimato per effettuare la previsione sullo stato di solvibilità di un’azienda ha fornito le seguenti stime

Parametri stimati (Intercept) -10

X2 -5.6

X3 30.5

X4 19.9

X5 -3.9

X6 -6.5

Di seguito sono riportati i valori che per l’azienda AAA assumono le variabili esplicative specificate nel modello di previsione

X2= 0.005 X3= 0.03

X4= 0.7

X5= 0.2

X6= 0.08

Stabilire sulla base delle informazioni fornite se l’azienda AAA si prevede sana o insolvente fissata la soglia per la classificazione delle aziende pari a 0.5.

...

P=exp(X*Beta)/(1+exp(X*Beta))= exp(3,517)/(1+exp(3,517))=0,97>0,5 quindi l’azienda AAA si prevede SANA

Esercizio 2 punti

Su un campione di 500 individui è stato condotta un’indagine per capire le preferenze dei soggetti rispetto al modo di prenotare le vacanze.

Uno degli interesse è capire se i soggetti che prenotano le vacanze on line preferiscono prenotare on line direttamente dalla pagina web della struttura ricettiva o tramite portali di prenotazione vari (Y=1 se direttamente, 0 se tramite portali di prenotazione). Si è specificato un modello logit per la stima della probabilità di prenotazione diretta, le covariate sono genere

(5)

(0=femmina, 1 maschio); vacanza con la famiglia (1 se si’ 0 altrimenti), edu (istruzione in anni di scuola). I parametri stimati sono i seguenti:

interc -4

gener

e 1

famigl

ia 1,5

edu 1

Calcolare l’odds ratio (OR) della variabile FAMIGLIA e commentare il risultato

Devo calcolare exp(1,5)= 4,481689 (strada breve) Strada lunga:

Devo calcolare p/(1-p) per famiglia =1, lo stesso per famiglia =0: il rapporto tra i due valori calcolati è l’OR=4,481689; quindi andare in vacanza con la famiglia fa quadruplicare la probabilità, di prenotare on line direttamente

dalla pagina web della struttura ricettiva

********************************************************************************

Esercizio 3 punti (relativo al programma dei primi 6 cfu, cap 4.7, quindi non entra a far parte della prova parziale del 5 giugno)

Supponiamo che la quantità di vino prodotta in una cantina da un noto marchio DOC sia di

244 milioni di bottiglie nel 2014 e di 245 milioni di bottiglie nel 2015, che le ore lavorate in azienda nel 2015 siano state pari a 130000 e nel 2016 pari a 133000.

Calcolare la variazione della produttività del lavoro tra il 2014 ed il 2015 e commentare i risultati.

bot ore

2014 244 130000

2015 245 133000

IY=245/244=1,004

(6)

IL=133000/130000=1,023

IY/IL=0,981

Tra il 2014 ed il 2015 c’è stata una riduzione della produttività del lavoro di circa il 2%.

Riferimenti

Documenti correlati

Vogliamo valutare la capacità predittiva di un modello logit stimato su un campione di 300 aziende delle quali si è riscontrato a posteriori che 215 sono risultate ‘sane’ e 85

fermo restando tutto il resto. In un modello per la gestione del rischio di insolvenze, al crescere della soglia di probabilità per decidere se una data azienda si prevede Sana

Abbiamo stimato due modelli di regressione lineare dei quali riportiamo il valore del coefficiente di determinazione R 2 ed il valore del coefficiente di determinazione aggiustato

Stabilire quale modello risulta più esplicativo della variabile di risposta Y, motivando la risposta fornita.. Il modello migliore è quello che presenta un R(adj) 2 più grande, quindi

b) da altre di natura straordinaria quali lo smobilizzo del proprio patrimonio c) o dal ricorso al prestito. Esse, rilevate attraverso specifiche “fasi”, trovano nell’

Siamo di fronte a due facce della stessa medaglia: da una parte un’alimenta- zione corretta e bilanciata è in grado di favorire il man- tenimento dell’integrità della dentatura e

La SIDS (Sudden Infant Death Syndrome), chiamata anche “morte in culla” o “morte bianca”, è la morte improvvisa e inaspettata di un lattante sotto l’anno di vita che

libero professionale intramoenia - Consulenz BA1260 (B.2.A.13.6) Compartecipazione al personale per att. libero professionale intramoenia - Altro) BA1270 (B.2.A.13.7)