• Non ci sono risultati.

APPROFONDIMENTI – SCHEDA 3 1. La media e le medie

N/A
N/A
Protected

Academic year: 2021

Condividi "APPROFONDIMENTI – SCHEDA 3 1. La media e le medie "

Copied!
3
0
0

Testo completo

(1)

APPROFONDIMENTI – SCHEDA 3 1. La media e le medie

Nelle schede è presentata solo la media aritmetica ed è chiamata semplicemente media, in accordo con la letteratura statistica maggiormente diffusa in ambito scientifico. Anche i software statistici non forniscono direttamente altre medie, quali ad esempio la geometrica e l’armonica.

Questa scelta è motivata dal fatto che gli ambiti di applicazione delle “altre” medie sono estremamente limitati a situazioni particolari. Alleghiamo comunque alcune pagine di Domingo Paola in cui è presentato un percorso didattico per la riflessione sull’uso scorretto della media (aritmetica) in alcuni contesti e sulla necessità di introdurre in queste situazioni altri tipi di medie.

Sottolineamo che – in ogni caso – data una variabile ha senso calcolare di essa una sola delle medie, quella che si applica correttamente al contesto.

2. Alcune dimostrazioni

a) La media minimizza la somma dei quadrati degli scarti:

( ) ( )

2

1 i 2 1

i

a x x

xi n i

n − ≤

= =

per ogni a reale.

Infatti:

-

( )

2 2

1 i 2 1

i 2 1 i 2 1 i 1 i 2 1 i 2 1

i

- 2

- 2

- x x x x x x nx x nx

x x

x i i i

n n

n n

n n

i

n

∑ ∑ ∑ ∑ ∑ ∑

= = = = = = =

= +

= +

=

-

( )

2 2

1 i 2 1

i 2 1 i 2 1 i 1

i 2 1 i 2 1

i

2 - 2

- 2

- xa a x a x na x nax na

x a

x i i i

n n

n n

n n

i

n − =

∑ ∑

+

=

∑ ∑

+ =

+

= = = = = = =

Osserviamo che:

2 2

1 i 2 2 1 i

2 -

-nx x nax na

xi i

n

n

+

= =

ovvero 0≤x2 -2ax +a2 In quanto il secondo membro della disguaglianza è un quadrato.

Dal punto di vista didattico è importante soffermarsi – dove non già fatto precedentemente – su un punto su cui solitamente i ragazzi incontrano difficoltà:

n k =nk

=1 i

b) La mediana minimizza la somma degli scarti assoluti:

1 2 i 1

i

a x Q

xi n i

n − ≤

= =

per ogni a reale.

x 2 x 2

1 2

i i 2 i 2

Q x x

Q Q

x i

i Q i Q

n − =

− +

= <

Consideriamo il caso a <Q2. Indichiamo con k il numero di dati minori di a e con h il numero di dati maggiori o uguali ad a e minori di Q2. Si ha: h+k=n/2 se n è pari e h+k=(n-1)/2 se n è dispari.

a) 2

2 x x 2 a

2 x 2 x

2 x 1

i i 2 i 2 i i 2 i 2

Q x x

Q x

Q Q

x x

Q Q

x i

i Q i Q

i a i Q

i Q

n − =

− +

− =

− +

− +

= < < <

(

− + −

)

+

(

− + −

)

+

(

− + −

)

=

=

∑ ∑ ∑

<

<

a a Q x a

a x Q a

a x

Q i

i Q i Q

a 2

x 2

x a 2

xi i 2 i 2

(

)

+ − +

(

)

+ − +

(

)

+ − − − =

=

∑ ∑ ∑

<

<

) )(

( )

( )

( 2

x 2

x a 2

xi i 2 i 2

Q a k h n a x a

Q h x a a

Q k x

a i

i Q i Q

a

(

)

+

(

)

+

(

)

+ + − − =

=

∑ ∑ ∑

<

<

) )(

2 2

( 2

x x

a

xi i 2 i 2

a Q n k h a x x

a x

a i

i Q i Q

a

(2)

b) x a

(

a x

) (

x a

) (

a x

) (

x a

) (

xi a

)

i Q i Q

i a i a

i a

n − =

− +

− =

− +

− +

=1 xi< xi xi< axi< 2 xi 2 i

Confrontando i risultati di a) e b) si ha:

(

)

+

∑ (

)

+

∑ (

)

+ + − − ≤

< <

) )(

2 2

( 2

x x

a

xi i 2 i 2

a Q n k h a x x

a x

a i

i Q i Q

a

(

a x

) (

x a

) (

xi a

)

i Q i Q

a

− +

− +

∑ ∑ ∑

<

< i 2 i 2

i a x x

x

Infatti la disuguaglianza precedente corrisponde a:

(

x a

)

a Q n k

h i

Q

+

<

xi 2

2 ) 2a

)(

2 2 ( dove: xi −a ≥0 per a ≤xi <Q2

2−a >0 Q

0 2

2h+ k −n ≤ si ha l’uguaglianza per n pari e il valore -1 per n dispari quindi il primo membro è negativo o nullo e il secondo positivo.

La dimostrazione per il caso a >Q2 è del tutto analoga.

c) La somma degli scarti dalla media è 0:

( )

0

1 i

=

=

x xi

n

Infatti:

( )

- -n 0

1 i 1 i 1 i 1

i

=

=

=

∑ ∑ ∑

= = = =

x x x

x x

xi n i n n i

n

Da questa proprietà segue che la somma degli scarti dalla media positivi è uguale alla somma degli scarti dalla media negativi.

d) La standard deviation è minore o uguale della metà dell’ampiezza dell’intervallo di variazione:

2

≤ R σ

Questa disuguaglianza è molto importante per valutare “a occhio” lo scarto quadratico medio (e la correttezza dei calcoli).

Indichiamo con Y la variabile aleatoria ottenuta traslando X del centro dell’intervallo di variazione:

2

) ( ) 1

( x n

X x

Y = − + . Si ha: σY22X . I valori di Y stanno fra - 2 R e

2

R ; infatti:

2 2

2

) ( ) 1 ( ) ( ) 1 ) ( 1 ( ) 1

( x x x x R

x

y nn =−

+ =

= e

2 2

2

) 1 ( ) ( ) ( ) 1 ) ( ( )

( x x x x R

x

y n n n n − =

+ =

=

Da cui:

4

2 R2

yi ≤ . Quindi:

4 4

2 2 2 2

2 2 y R y R

n yi

Y =

− ≤ − ≤

σ

e) Varianza totale e varianze nelle sottopopolazioni:

(

2 B2

) ( ( )

2

( )

2

)

2 A

tot = fAσ +fB σ + fA xA −x +fB xB −x

σ

Si ha:

( ) ( ) ( ) ( ) ( )

+ + +

=

+

=

=

∑ ∑ ∑ ∑ ∑

=

2 2

2 2

2 1

tot2 1 1 1 x x x x x x x x

x n x x

n x x

n xi x A i x B i x A i A A x B i B B

n

i i i i i

σ

Sviluppiamo il primo addendo:

(

+

)

=

∑ (

)

+

∑ (

)(

)

+

∑ (

)

=

2 2

2 x x 2 x x x x x x

x x x

x A

A A x

A A i

A x A i

A x A A i

xi i i i

(

x x

)

2 2

(

x x

) (

x x

) (

x x

)

2

(

x x

)

2

(

xA x

)

2

A A x

A i A x

A A x A i

A x A

A i

xi i i i i

+

=

+

+

=

∑ ∑ ∑ ∑ ∑

(3)

essendo

(

i A

)

A x

x x

i

= 0.

Quindi:

( )

2 1

( )

2 1

( )

2 2

( )

2

1 n x x f f x x

x n n x

n x n

x x

n xi A xi A A A A xi A i A A A A = A A + A A

⎜⎜

⎛ − + −

=

− +

σ

3. Perché “n-1”

La varianza e la covarianza sono spesso calcolate usando n-1 al denominatore. Questo deriva da alcuni risultati di statistica inferenziale.

Indichiamo con X1,....,Xn le variabili aleatorie campionarie di una variabile aleatoria X di cui si osservano le realizzazioni x1,....,xn. Tali variabili aleatorie sono assunte indipendenti e hanno la stessa distribuzione di X e in particolare la stessa media e la stessa varianza che indichiamo con µ e σ2.

Indichiamo con X la variabile aleatoria media campionaria:

n X X

i n i

= =1

Il suo valore atteso è:

( )

=

( )

= µ =µ

⎜⎜

= ⎛

⎟⎟

⎟⎟

⎜⎜

⎜⎜

=

∑ ∑ ∑ ∑

=

=

=

= n

i i n

i i n i i

n i

X n E n I X E

nI n

X E

I X E I

1 1

1

1 1 1 1

Si dice che X è uno stimatore non distorto di µ, perché la media dei valori campionari x calcolati su tutti i possibili campioni il parametro che si vuole stimare.

In modo analogo al caso del valore atteso, si dimostra che la varianza di X è n σ2

.

Il valore atteso dello stimatore della varianza

( )

n X Xi

n i

2 1

= non è σ2; infatti, se indichiamo tale

stimatore con

Σ

, si ha:

( ) ( ) ( )

2

( )

2

( )

2

( )

2

1 2

2 1 2

1

1 1

) 1

( IE X IE X IE X IE X

X n E I n X

E I X

X E

n I E

I n i i

i i n i i

n i

=

⎟−

⎜⎜

=⎛

⎟−

⎜⎜

= ⎛

⎟⎟

⎜⎜

⎛ −

=

Σ

∑ ∑ ∑

=

=

=

La varianza di una variabile aleatoria si può scrivere come: σ2 =IE

( )

X2 IE

( )

X 2. Quindi:

( )

Xi2 IE

( )

Xi 2 =σ2 µ2

E

I e IE

( )

X 2 =σn2 µ2 Per cui: ( ) σ2 µ2 σ2 µ22 n n E n

I Σ = − − + = .

Lo stimatore

Σ

è quindi uno stimatore distorto (anche se per n grande la sua distorsione è minima).

Dal risultato precedente si può dedurre che uno stimatore non distorto di σ2 è S2, definito come:

( )

1

2 1

2

=

=

n X X S

i n i

Riferimenti

Documenti correlati

Questo indice di posizione è il più usato per ottenere informazioni sull’ordine di grandezza di una variabile quantitativa, tanto che se si parla di media senza aggiungere

• • Quali erano le rotte marittime e terrestri dei commerci Quali erano le rotte marittime e terrestri dei commerci verso le Americhe Oriente e in Europa.. verso le Americhe

1,6 punti: risposta corretta, soluzione migliore ma senza una buona proprietà di linguaggio o senza una buona esposizione.. 1,4 punti: risposta corretta ma non la

This is the origin of the theory elaborated by Earle and D’Altroy on the mobilization of subsistence goods (staple finance) or of prestige goods (wealth finance) as two

Il tessuto urbano di Pescia, risultato dei processi di stratificazione accorsi in oltre un millennio di storia, con- serva ancora oggi i segni tangibili della sua

[r]

Noi ci occuperemo principalmente della media aritmetica, poi cercheremo di capire anche i concetti che stanno alla base delle altre medie algebriche.... Media

Tuttavia la media aritmetica si può calcolare anche nel caso in cui la somma a numeratore non avesse un significato concreto, come avviene ad esempio per il carattere