• Non ci sono risultati.

Statistica 2

N/A
N/A
Protected

Academic year: 2021

Condividi "Statistica 2"

Copied!
58
0
0

Testo completo

(1)
(2)

Probabilità

  Gli eventi sono stati definiti come i possibili risultati di un

esperimento.

  Ogni evento ha una probabilità

  Se tutti gli eventi fossero ugualmente possibili, la probabilità

p(E) di un evento E sarebbe uguale al rapporto tra il numeri f di casi favorevoli e il numero n dei casi possibili, ovvero p(E)=f/n

  Esempio:

Si lancia due volte una moneta. Quale e’ la probabilità che escano due teste ?

1)  I casi possibili sono 4: TT, TC, CT, CC

2)  I casi possibili sono 3: escono 2 teste, esce 1 testa, escono 0

(3)

Probabilità

  Se, in una sequenza di n prove, un evento E si verifica s

volte, si dice che il rapporto s/n è la frequenza relativa di E rispetto alla data sequenza di prove.

  Legge empirica del caso: Effettuando numerose prove,

eseguite nelle stesse condizioni, la frequenza relativa di un evento è assai prossima alla sua probabilità; l’approssimazione è tanto maggiore quanto più numerose sono le prove effettuate

  Definizione frequentista della probabilità: La

probabilità di un evento è il limite a cui tende la frequenza relativa, al tendere all’infinito del numero di prove effettuate

(4)

Probabilità

  Definizione frequentista della probabilità: La

probabilità di un evento è il limite a cui tende la frequenza relativa, al tendere all’infinito del numero di prove effettuate

Ma alcune volte gli Eventi sono “irripetibili”…

  Definizione soggettiva della probabilità: dato un

qualsiasi evento E, se mi è indifferente ricevere la somma s incondizionatamente, oppure la Somma S soltanto se E si verifica, si dice che la probabilità soggettiva p di quell’evento è p=s/S

(5)

  E’ scomodo trattare direttamente gli eventi e può essere

più semplice associare delle quantità numeriche agli eventi.

  Ciò si realizza attraverso la definizione di VARIABILE

CASUALE:

Una variabile casuale X è una variabile quantitativa i cui valori variano seguendo le regole della probabilità

(6)

Variabile casuale (v.c.)

 

Una v.c. X può essere discreta o continua:

  X è discreta se assume un numero finito o numerabile di

risultati. Esempio: il numero di teste in 10 lanci di una moneta, il numero di volte in cui si ha un numero

superiore a 4 in 5 lanci di un dado…

  X è continua se può assumere qualsiasi valore

nell’ambito di uno specifico intervallo. Per esempio:

altezza degli studenti del corso di statistica, il peso della confezione di caramelle di una certa marca….

 

Una v.c. è completamente specificata attraverso

la sua distribuzione di probabilità

(7)

Distribuzione di probabilità

  Si ha dunque che per una variabile casuale

f(x)=P(X=x)

per tutti i possibili valori x che X può assumere.

  f(x) è detta funzione di densità di probabilità

(probability density function (pdf))

  La pdf di una variabile discreta è detta funzione di massa

(indicata anche con p(x)) ed è rappresentabile attraverso un istogramma o sotto forma tabellare

La distribuzione di probabilità p(x) di una variabile casuale X indica la probabilità della variabile casuale per ciascuno dei suoi valori possibili

(8)

Esempio di funzione di probabilità (caso discreto)

Esempio di funzione di densità di probabilità (caso continuo)

Distribuzioni di probabilità

discrete e continue

(9)

Esperimento: lancio di 2 monete

S= {(T,T);(T,C);(C,T);(C,C)} Variabile casuale:

X = numero di teste; v.c. discreta, i suoi possibili valori sono: •  0 (se non si ottiene alcuna testa)

•  1 (se una delle due monete dà testa) •  2 (se entrambe le monete danno testa) Quindi:

•  P(X=0)=P(C,C)=1/4

•  P(X=1)=P((T,C) oppure (C,T))=2/4 •  P(X=2)=P(T,T)=1/4

Distribuzioni di probabilità discrete

x P(x)=P(X=x)

0 ¼

1 ½

(10)

Distribuzioni di probabilità discrete

  0 ≤p(x)≤ 1 Le probabilità associate ai valori di una variabile

casuale devono essere comprese tra 0 e 1 inclusi

  ∑p(x)=1 La somma delle probabilità di tutti i valori x di una

variabile casuale deve essere 1

  La distribuzione di probabilità di una variabile casuale discreta può

essere rappresentata in modo grafico attraverso un istogramma di distribuzione di probabilità x P(x)=P(X=x) 0 ¼ 1 ½ 2 ¼ Esempio precedente:

(11)

Distribuzione di probabilità discrete

Media o Valore Atteso

=

=

x

x

xp

x

E

(

)

(

)

µ

Se una funzione H dipende da p(x) il valore atteso di H puo’ essere calcolato come

=

x

x

p

x

H

x

H

E

(

(

))

(

)

(

)

(12)

Calcolo delle probabilità usando i dati

 

Dalle vendite di TV osservate in passato (below

left), si ricava una rappresentazione tabulare

della distribuzione di probabilità delle vendite

Numero

Unità vendute di giorni

x

f (x )

0 80

0

.40

1 50

1

.25

2 40

2

.20

3 10

3

.05

4 20

4

.10

200

1.00

(13)

Rappresentazione grafica

  Rappresentazione grafica delle vendite giornaliere di TV

.10

.20

.30

.40

.50

Values of Random Variable x (TV sales)

(14)

Esempio

  Valore Atteso di variabili casuali discrete

x f (x ) xf (x ) --- 0 .40 .00 1 .25 .25 2 .20 .40 3 .05 .15 4 .10 .40 1.20 = E (x )

Il valore atteso delle vendite giornaliere di TV è 1.2

Calcoliamo la deviazione standard

(15)

 

Varianza e Deviazione Standard di una

variabile casuale discreta

x x - µ (x - µ )2 f (x ) (x - µ )2f (x )

0 -1.2 1.44

.40 .576

1 -0.2 0.04

.25 .010

2 0.8 0.64

.20 .128

3 1.8 3.24

.05 .162

4 2.8 7.84

.10 .784

1.660 =

σ

2

Esempio

La varianza delle vendite giornaliere è 1.66 TV (al quadrato) La deviazione standard delle vendite è di 1.29 TV

(16)

Funzione di distribuzione cumulativa (cdf)

)

(

)

(

)

(

)

(

)

(

x

P

X

x

P

a

X

b

F

b

F

a

F

=

<

=

x f (x ) F(x) 0 .40 .40 1 .25 .65 2 .20 .85 3 .05 .90 4 .10 1.00 1.00

(17)

La distribuzione di probabilità binomiale

La variabile casuale Binomiale è una distribuzione di probabilità discreta caratterizzata dalle seguenti proprietà:

  Le osservazioni di una distribuzione binomiale sono determinate da

un esperimento fatto da un numero n di prove reiterate

  L’esito di ogni prova dell’esperimento (ovvero ciascuna

osservazione) può essere classificato in due categorie incompatibili ed esaustive, dette per convenzione successo e insuccesso

  La probabilità p di ottenere un successo è costante per ogni

osservazione, così come la probabilità (1-p) che si verifichi un insuccesso

  Le prove dell’esperimento sono indipendenti, ovvero il risultato di

una osservazione, successo o insuccesso, è indipendente dal risultato di qualsiasi altra

La variabile casuale binomiale rappresenta il numero di successi ottenuti in un campione di n prove indipendenti

(18)

La distribuzione di probabilità binomiale -

esempio -

In un’urna ci sono 100 palline, di cui 30 sono rosse e le rimanenti sono blu. Supponendo di estrarre 10 palline con reinserimento, ovvero la pallina estratta viene rimessa nell’urna, qual è la probabilità di estrarre esattamente una pallina

di colore rosso?

•  L’esperimento consiste nell’estrarre una pallina da un urna, con reinserimento della pallina estratta, per n=10 volte si hanno n=10 osservazioni

• L’esito di ogni prova dell’esperimento è “pallina rossa” o “pallina blu” due categorie incompatibili ed esaustive, e “pallina rossa” è l’esito “successo”

• La probabilità di ottenere successo ovvero “pallina rossa” è pari a p=30/100 ed è costante per ogni prova

• Le prove dell’esperimento, ovvero le estrazioni, sono indipendenti • Il numero di successi è un numero compreso tra 0 e 10

• Si vuole calcolare la probabilità che ci sia esattamente un successo in n=10 prove

• Definiamo X = numero di successi in n prove X ~ Binomiale (n, p)

x n x x n x

p

p

x

n

x

n

p

p

x

n

x

p

− −

=





=

(

1

)

)!

(

!

!

)

1

(

)

(

(19)

La distribuzione di probabilità binomiale -

dimostrazione -

  Vogliamo calcolare la probabilità di avere x successi e (n-x) insuccessi.   Dal momento che gli eventi sono indipendenti, le probabilità andranno

moltiplicate

  Dobbiamo avere x successi quando ciascun successo ha probabilità p e n-x

insuccessi quando ciascun insuccesso ha probabilità 1-p

  La probabilità di avere una combinazione sarà uguale alla moltiplicazione

tra questi valori:

  Ci sono però differenti combinazioni alternative, quindi la probabilità di

avere esattamente x successi in n tentativi è data da:

x n x

p

p

− )

1

(

x n x x n x

p

p

x

n

x

n

p

p

x

n

x

p

− −

=





=

(

1

)

)!

(

!

!

)

1

(

)

(

(20)

La distribuzione di probabilità binomiale -

esempio -

  Nell’esempio precedente X~Binomiale(n,p) con n=10 e p=0.25:

187

.

0

)

25

.

0

1

(

25

.

0

)!

1

10

(

!

1

!

10

)

25

.

0

1

(

25

.

0

1

10

)

1

(

1 10 1

1

10 1

=

=





=

− −

p

Per esempio la distribuzione di probabilità binomiale con una probabilità di successo pari a 0.25 può essere rappresentata dal seguente istogramma dove:

  asse orizzontale: possibili valori della variabile

(21)

Ruolo del parametro p:

Nelle 3 distribuzioni Binomiali n = 5, mentre p varia assumendo i valori 0.3, 0.5 e 0.8. Dai grafici possiamo dedurre che:

 Se p = 0.5, la distribuzione è simmetrica, in caso contrario è asimmetrica, positivamente se p< 0.5, negativamente se p > 0.5.

 Per ogni fissato n, la massima dispersione dei valori si ha quando p = 0.5; se p tende a 0 o a 1, la distribuzione tende a concentrarsi sui valori più prossimi a 0 o a n, rispettivamente.

 p definisce la posizione della distribuzione sull'asse reale, nel senso che np identifica un punto vicino alla moda della distribuzione.

(22)

p=0.5 (istogrammi simmetrici) mentre n varia assumendo i valori 5, 10, 20. Per una

corretta interpretazione della figura osserviamo che le altezze dei bastoni sono comparabili perché la scala verticale è la stessa, mentre la scala sull'asse orizzontale è diversa. In sintesi:

  Al crescere di n l'intervallo di variazione del numero dei successi si estende (nell'esempio passa da 0-5 a 0-10 a 0-20) il che comporta, a parità di p, un aumento della dispersione dei valori osservabili.

  Al crescere di n aumenta il numero delle determinazioni osservabili e quindi si riduce il valore delle singole probabilità (l'istogramma si allarga e si abbassa sensibilmente). Tuttavia il picco della distribuzione continua a segnalare con chiarezza il parametro p dell'urna (in termini relativi, 0.5).

(23)

La distribuzione di probabilità binomiale

– caratteristiche principali-

Se X e una variabile casuale che segue una distribuzione binomiale con paramentri n (numero di tentativi) e p (probabilità di successo), X avrà:

 Media pari a :

E(X) = n*p

 Varianza pari a:

(24)

Esempio 1

Determinare la probabilità che su 12 lanci di una moneta buona si ottengano esattamente 8 teste.

p=q=1/2 n=12 x=8

p(x) =

n

x

 ⋅ p

x

⋅ (1− p)

n −x

=

n!

x!(n − x)!

⋅ p

x

⋅ (1− p)

n −x

p

12

(8) =

12

8

 ⋅ 0,5

8

⋅ 0.5

4

=

12 ⋅11⋅10 ⋅ 9

4 ⋅ 3⋅ 2

⋅ 0.5

8

⋅ 0.5

4

≅ 0.1208

(25)

Esempio 2

Determinare la probabilità che estraendo (con rimpiazzo) per 5 volte una carta da un mazzo da 40 si ottengano:

1)  Esattamente 3 figure 2)  Almeno 3 figure

3)  Almeno una figura

(26)

Esempio 2

p=12/40=0.3 1) Esattamente 3 figure

p

5

(3) =

5

3

 ⋅ 0,3

3

⋅ 0.7

2

= 10 ⋅ 0,3

3

⋅ 0.7

2

≅ 0.1323

p

5

(3) + p

5

(4) + p

5

(5) ≅ 0.1323 + 0.0284 + 0.0024 = 0.1631

2) Almeno 3 figure

3) Almeno una figura

p

5

(1) + p

5

(2) + p

5

(3) + p

5

(4) + p

5

(5) =

1− p

5

(0) = 1−

5

0

 ⋅ 0.3

0

⋅ 0.7

5

= 1− 0.16807 = 0.83193

(27)

Esempio 3

Un tiratore colpisce un bersaglio con probabilità 0.2. Quale è la probabilità che su 8 tiri si colpisca 2 volte il bersaglio ? E che si colpisca almeno due volte ?

Soluzione:

p

8

(2) ≅ 0.2936

(28)

Per i dati continui la variabile casuale può assumere qualsiasi valore in un intervallo di infiniti numeri reali

La pdf f(x) di una variabile casuale X ha le seguenti proprietà:

Distribuzioni di probabilità continue

1.  f(x) è definita su tutti i numeri reali

2. f (x) ≥ 0 per tutti i valori di x .

3.  L’area sottesa dalla curva f è uguale a 1: 4. 

=

x

x

f

(

)

1

(

)

b

( )

a

P a X

b

=

f x dx

a b

( )

y

=

f x

( )

y

=

f x

(29)

Se X è una v.c. continua, allora:

-  per ogni numero c, P(x = c) = 0

-  per ogni due numeri a e b con a < b,

(

)

(

)

P a X

b

=

P a X

<

b

(

)

P a X

b

=

<

(

)

P a X

b

=

<

<

(30)

La funzione di probabilità cumulativa,

F(x) per una v.c. continua X è definita

per ogni x da

(

)

( )

x

( )

F x

P X

x

f y dy

−∞

=

=

Per ogni x, F(x) è l’area della curva a

sinistra di x.

(31)

F(x) per il calcolo delle probabilità

(

)

( )

( )

P a X

b

=

F b

F a

Sia X una v.c. continua con pdf f(x) e

cdf F(x). Allora per ogni numero a,

E per ogni numero a and b con a < b,

(

)

1

( )

(32)

Esempio

 

Funzione di probabilità (pdf)

 

Funzione di distribuzione cumulativa

 

Probabilità di eventi

1 ) 1 ( 75 . 0 ) ( otherwise 0 1 1 ) 1 ( 75 . 0 ) ( 1 1 2 2

−∞∞ =

− − =    − − ≤ ≤ = x x f v dv v dv x f      > ≤ < − − + − ≤ = − + = − = =

− ∞ − 1 1 1 1 25 . 0 75 . 0 5 . 0 1 0 ) ( 25 . 0 75 . 0 5 . 0 ) 1 ( 75 . 0 ) ( ) ( 3 3 1 2 x x x x x x F x x dv v dv v f x F x x 73 . 0 25 . 0 75 . 0 5 . 0 95 . 0 ) ( ) ( % 75 . 68 ) 1 ( 75 . 0 ) 5 . 0 ( ) 5 . 0 ( ) 5 . 0 5 . 0 ( 3 5 . 0 5 . 0 2 = ⇒ − + = = = ≤ = − = − − = ≤ ≤ −

x x x x F x X P dv v F F x P

(33)

Valore Atteso

Il

valore atteso

o

valor medio

di una v.c.

continua X con f (x) è:

( )

( )

X

E X

x f x dx

µ

−∞

=

=

(34)

Valore atteso di h(X)

se X è una v.c. continua con pdf f(x) e

h(x) è una funzione di X, allora

[

( )

]

h X

( )

( )

( )

E h x

µ

h x f x dx

−∞

(35)

Varianza e Deviazione Standard

La

varianza

di una v.c. continua X con

pdf f(x) e media è:

2

( )

(

)

2

( )

X

V x

x

f x dx

σ

µ

−∞

=

=

(

)

2

[

]

E X

µ

=

La

deviazione standard

is

µ

( ).

X

V x

σ

=

( )

2

[

]

2

( )

( )

V X

=

E X

E X

(36)

Esempio

[

]

[

]

− + − − + −

=

=

=

=

=

=

=

=

=

1 1 1 1 5 5 1 3 3 1 2 2 2 2 1 1 1 1 4 4 1 2 2 1 2 2

2

.

0

)

75

.

0

(

)

75

.

0

(

)

1

(

75

.

0

)

0

(

)

]

([

0

)

75

.

0

(

)

75

.

0

(

)

1

(

75

.

0

)

(

otherwise

0

1

1

)

1

(

75

.

0

)

(

x

x

dx

x

x

X

E

x

x

dx

x

x

X

E

x

x

x

f

µ

σ

µ

(37)

Distribuzione Uniforme

Una variabile continua X segue una

distribuzione uniforme sull’intervallo [A, B]

se:

(

)

1

; ,

0 otherwise

A x B

f x A B

B A

≤ ≤

=



(38)

Esempio Distribuzione Uniforme

1.  In certi esperimenti l’errore commesso nella determinazione della solubilità di una sostanza è una variabile aleatoria X avente distribuzione uniforme con A=-0.025 e B= 0.025. Trovare la probabilità che l’errore:

a)  Sia compreso tra 0.010 e 0.015;

b) Sia compreso tra –0.012 e 0.012.

P(0.010 ≤ X ≤ 0.015) =

0.015 − 0.010

(39)

Esempio Distribuzione Uniforme

2. Si consideri una variabile aleatoria X con distribuzione uniforme. Essendo noto che E(X)=6 e V(X)=2 trovare:

a) Pr(X>=5.5) b) la mediana di X.

E(X)=

A + B

2

V (X)=(B − A) 2 12

(40)

Esercizio

Marcello sa che il suo amico Carlo arriverà al bar Sport in un istante compreso tra le nove e le dieci di una data mattina. Egli decide di recarsi al bar alle 9:30 e di attendere 10 minuti.

(41)

Esercizio

Un tiratore lancia una freccetta su un bersaglio circolare del raggio di 25 cm il quale ha una zona centrale di raggio 10 cm.

Se il tiratore colpisce il bersaglio e tutti u punti di esso hanno la stessa probabilità di essere colpiti, quale è la probabilità che sia colpito un punto della zona centrale ?

(42)

Distribuzione Normale

2

2

(

) /(2

)

1

( )

2

x

f x

e

µ

σ

x

σ

π

− −

=

− ∞ < < ∞

Una v.c. X è detta avere una distribuzione

normale con parametri

µ

e

σ

<

<

µ

σ

>

0

se la pdf di X è

(43)
(44)
(45)

2 / 2

1

( ;0,1)

2

z

f z

e

σ

π

=

La distribuzione normale con parametri

è chiamata

distribuzione normale standard

.

La v.c. è denotata con Z. La pdf è

0 and

1

µ

=

σ

=

La cdf è

z

− ∞ < < ∞

( )

(

)

( ;0,1)

z

z

P Z

z

f y

dy

−∞

Φ

=

=

(46)

0 z

Standard

normal

curve

Shaded area = ( )

Φ

z

(47)

a.

Area a sinistra di 0.85 = 0.8023

b. P(Z > 1.32)

Sia Z la variabile normale standard.

Trovare (dalla tabella)

(

0.85)

P Z ≤

1

P Z

(

1.32) 0.0934

=

(48)

Trovare l’area a sinistra di 1.78 e

sottrarre l’area a sinistra di –2.1.

= 0.9625 – 0.0179

= 0.9446

c. ( 2.1

P

Z

1.78)

= (

P Z

1.78)

P Z

(

≤ −

2.1)

(49)

Esempi

Calcolare, servendosi della Tavola, le aree sottese dalla curva normale standard relative ai seguenti intervalli:

a)  [0;2] b)  [0;1.24] c)  [-1.4;1.4] d)  [1.5;2.75] e)  [-0.75;1.37] f)  [-2.1;-0.5]

(50)

se X ha una distribuzione normale con

parametri e allora

µ

σ

X

Z

µ

σ

=

ha una distribuzione standard.

(51)

Sia X una v.c. binomiale basata su n prove, con

probabilità di successo p. Per n abbastanza

grande (empiricamente se npq>10), X può

essere approssimata con una distribuzione

normale con

and

.

np

npq

µ

=

σ

=

(52)

In un piccolo college il tasso di superamento

dell’esame di Algebra è 72%. Su 500 studenti

determinare la probabilità che superino l’esame

al più 375 studenti.

500(.72) 360

np

µ

=

=

=

500(.72)(.28) 10

npq

σ

=

=

375.5 360

(

375)

(1.55)

10

P X

≈ Φ

= Φ

= 0.9394

Esempio

(53)

Curva Normale

68%

95%

99.7%

Valore approssimato della percentuale dell’area compresa tra

valori di deviazione standard (regola empirica).

(54)
(55)

Sia X una variabile normale con

= 0.2266

(

65

)

65 80

20

P X

=

P Z

(

.75

)

P Z

=

≤ −

Find (

P X ≤

65).

80 and

20.

µ

=

σ

=

Esempio

e

Trovare

(56)

Una particolare influenza si sviluppa in

una scuola. Si osserva che la durata

dell’influenza è distribuita come una

normale con

6 days and

1.5 days.

µ

=

σ

=

Calcolare la probabilità che a uno

studente selezionato a caso, l’influenza

duri tra 3.75 e 9 giorni.

Esempio

(57)

(

3.75

9

)

3.75 6

9 6

1.5

1.5

P

X

=

P

Z

(

1.5

2

)

P

Z

=

= 0.9772 – 0.0668

= 0.9104

Esempio

(58)

Percentili di una distribuzione normale

(100p)th percentile

for normal

(100 )th for

standard normal

p

µ

σ

=

+

(

µ σ

,

)

Riferimenti

Documenti correlati

Giusti…care la risposta a partire da regole di base e non da formule risolutive …nali (in altre parole, ricavare la formula risolutiva)..

Secondo il punto di vista soggettivista di Jaynes, che non esito a catalogare come un ”estremista antiboltzmanniano”, la meccanica statistica non sarebbe parte della fisica, bensì

Con un campione di n = 100 la forma della distribuzione delle medie è praticamente normale con un valore medio di 0.7502. La cosa importante è che, per campioni

comportamento piu’ probabile del sistema con le tecniche della Meccanica Statistica, se e’ nota l’espressione delle forze.. intermolecolari (per il caso

Nella seguente tabella sono riportati i colori dei petali dei fiori di due diverse specie (specie A e specie B) rilevati su 580 fiori di un giardino1. Specie/Colore Rosso Giallo

Calcolare la probabilità che un aereo non possa proseguire il volo se possiede quattro motori2. Calcolare la probabilità che un aereo non possa proseguire il volo se possiede

Calcolate l’intervallo di confidenza a livello del 95% per la media della durata dei temporali

Ad esempio, in seguito al lancio di un dado un evento può essere: “esce un numero pari”, “un numero maggiore di 7”,.. “un numero minore o uguale a