• Non ci sono risultati.

Elementi di statistica non parametrica Lucio Barabesi

N/A
N/A
Protected

Academic year: 2021

Condividi "Elementi di statistica non parametrica Lucio Barabesi"

Copied!
186
0
0

Testo completo

(1)

Elementi di statistica non parametrica

Lucio Barabesi

(2)
(3)

Indice

1 L'equivalenza in distribuzione 1

1.1 L'equivalenza in distribuzione 1

1.2 L'equivalenza in distribuzione e le variabili casuali simmetriche 4

2 Le statistiche “distribution-free” 8

2.1 I modelli statistici “distribution-free” 8

2.2 Le statistiche “distribution-free” 9

2.3 Le statistiche segno 10

2.4 Le statistiche rango 11

2.5 Le statistiche rango dei valori assoluti 16

3 Il test statistico “distribution-free” 20

3.1 I test statistici “distribution-free” 20

3.2 L'efficienza asintotica relativa 24

3.3 La significatività osservata 35

4 Gli intervalli di confidenza “distribution-free” 36

4.1 Gli intervalli di confidenza “distribution-free” 36 4.2 Gli intervalli di confidenza “distribution-free” per grandi campioni 40 5 I test basati su statistiche lineari dei ranghi con segno 43 5.1 I test basati su statistiche lineari dei ranghi con segno 43 5.2 I test basati su statistiche lineari dei ranghi con segno localmente più potenti 47 5.3 La distribuzione per grandi campioni delle statistiche lineari dei ranghi con segno 49 6 I tests per un parametro di posizione: un campione e due campioni appaiati 56

6.1 Il test dei segni 56

6.2 Le prestazioni del test dei segni 58

6.3 Il test dei segni e gli intervalli di confidenza per la mediana 59

6.4 Il test dei segni per due campioni appaiati 60

6.5 Il test di Wilcoxon 61

6.6 Le prestazioni del test di Wilcoxon 64

6.7 Il test di Wilcoxon e gli intervalli di confidenza per la mediana 65

6.8 Il test di Wilcoxon per due campioni appaiati 66

7 I test basati su statistiche lineari dei ranghi 67

7.1 Le statistiche lineari dei ranghi 67

7.2 La distribuzione per grandi campioni delle statistiche lineari dei ranghi 74

(4)

8 I test per i parametri di posizione: due campioni indipendenti 77 8.1 Le statistiche lineari dei ranghi per i parametri di posizione 77 8.2 La distribuzione per grandi campioni delle statistiche lineari

dei ranghi per i parametri di posizione 82

8.3 Il test di Mann-Whitney-Wilcoxon 84

8.4 Il test della mediana 86

8.5 Le prestazioni del test di Mann-Whitney-Wilcoxon e del test della mediana 88 9 I test per i parametri di scala: due campioni indipendenti 90 9.1 Le statistiche lineari dei ranghi per i parametri di scala 90 9.2 La distribuzione per grandi campioni delle statistiche lineari

dei ranghi per i parametri di scala 96

9.3 Il test di Mood 99

9.4 Il test di Ansari-Bradley 101

9.5 Le prestazioni del test di Mood e del test di Ansari-Bradley 103

10 I test per l'associazione 106

10.1 Verifica di ipotesi sull'associazione 106

10.2 Il test di correlazione di Spearman 106

10.3 Il test di correlazione di Kendall 111

11 L'analisi della varianza 120

11.1 Ulteriori risultati per le statistiche rango 120

11.2 Il test di Kruskal-Wallis 122

11.3 Il test di Friedman 124

11.4 Il test di concordanza di Kendall 127

12 I test funzionali 129

13.1 Il test Chi-quadrato per la bontà di adattamento 129 13.2 Il test Chi-quadrato per la bontà di adattamento con campioni5 134

13.3 La statistica di Kolmogorov 137

13.4 Il test di Kolmogorov 141

13.5 La statistica di Kolmogorov-Smirnov 143

13.6 Il test di Kolmogorov-Smirnov 146

Appendice 148

A.1 Alcune distribuzioni e relative caratteristiche 148

A.2 Alcuni risultati matematici 152

A.3 Alcuni risultati di teoria delle probabilità 152

Tavole 158

Bibliografia essenziale 181

Riferimenti bibliografici 181

(5)

Capitolo 1

L'equivalenza in distribuzione

1.1. L'equivalenza in distribuzione. L'equivalenza in distribuzione è una particolare relazione di equivalenza tra variabili casuali.

Definizione 1.1.1. Le variabili casuali e , con rispettive funzioni di ripartizione e ,\ ] J K sono dette equivalenti in distribuzione se

J ÐBÑ œ KÐBÑ aB − , ‘ .

In modo analogo, i vettori di variabili casuali Ð\ ß \ ß á ß \ Ñ" # 8 e Ð] ß ] ß á ß ] Ñ" # 8 , con rispettive funzioni di ripartizione congiunte J8 e K8, sono detti equivalenti in distribuzione se

J ÐB ß B ß á ß B Ñ œ K ÐB ß B ß á ß B Ñ aÐB ß B ß á ß B Ñ −8 " # 8 8 " # 8 , " # 88 . ˜ Per indicare che e sono equivalenti in distribuzione si adotta la notazione\ ]

\ œ ]. ,

mentre per indicare che Ð\ ß \ ß á ß \ Ñ Ð] ß ] ß á ß ] Ñ" # 8 e " # 8 sono equivalenti in distribuzione si adotta la notazione

Ð\ ß \ ß á ß \ Ñ œ Ð] ß ] ß á ß ] Ñ" # 8 . " # 8 .

Si noti che œ. rappresenta in effetti una relazione di equivalenza, in quanto è immediato verificare che essa risulta riflessiva, ovvero

\ œ \. , simmetrica, ovvero

\ œ ] Í ] œ \. . , e transitiva, ovvero

\ œ ] ] œ ^ Ê \ œ ^. , . . .

Esempio 1.1.1. Si consideri le variabili casuali e , con rispettive funzioni di ripartizione\ ] J e , dove K KÐBÑ œ J ÐB  Ñ- (-−‘). E' immediato verificare che la trasformata ^ œ ] - ha per funzione di ripartizione , per cui dalla Definizione 1.1.1 risulta J \ œ ^. . Di conseguenza, si ha \ œ ] . -. Alternativamente, si consideri le variabili casuali e , con\ ] rispettive funzioni di ripartizione e , dove J K KÐBÑ œ J ÐBÎ Ñ$ ($−‘). Anche in questo caso, è immediato verificare che la trasformata ^ œ ] Î$ ha per funzione di ripartizione ,J per cui dalla Definizione 1.1.1 risulta \ œ ^. e dunque \ œ ] Î. $. –

(6)

2 L'equivalenza in distribuzione Esempio 1.1.2. Si consideri le variabili casuali e equivalenti in distribuzione e sia la\ ] J loro funzione di ripartizione comune. Inoltre, sia data una trasformata misurabile per cuiY EÒY Ð\ÑÓ  ∞. Dalla definizione di valor medio si ha

EÒY Ð\ÑÓ œ( Y ÐBÑ .J ÐBÑ œ( Y ÐCÑ .J ÐCÑ œ ÒY Ð] ÑÓE ,

dal momento che e possiedono la stessa funzione di ripartizione. Dunque, si può\ ] concludere che se e sono equivalenti in distribuzione allora possiedono i medesimi\ ] momenti. Analogamente, se Ð\ ß \ ß á ß \ Ñ" # 8 e Ð] ß ] ß á ß ] Ñ" # 8 sono vettori di variabili casuali equivalenti in distribuzione e se ÐY ß Y ß á ß Y Ñ" # 5 è un vettore di trasformate misurabili per cui EÒY Ð\ ß \ ß á ß \ ÑÓ  ∞4 " # 8 , allora risulta

EÒY Ð\ ß \ ß á ß \ ÑÓ œ ÒY Ð] ß ] ß á ß ] ÑÓ 4 œ "ß #ß á ß 54 " # 8 E 4 " # 8 , .

Si noti infine che la proposizione inversa non è valida, ovvero possono esistere due variabili casuali e che possiedono i medesimi momenti, ma non sono equivalenti in distribuzione.\ ] – Esempio 1.1.3. Si consideri le variabili casuali e equivalenti in distribuzione. Tenendo\ ] presente il risultato dell'Esempio 1.1.2, per un dato insieme misurabile E § ‘ risulta dunque

E IÒ Ð\ÑÓ œ Ò Ð] ÑÓE E IE .

Dal momento che E IÒ Ð\ÑÓ œE PrÐ\ − EÑ e E IÒ Ð] ÑÓ œE PrÐ] − EÑ, allora si ha che

PrÐ\ − EÑ œPrÐ] − EÑ . –

Esempio 1.1.4. Si consideri i vettori di variabili casuali Ð\ ß \ ß á ß \ Ñ" # 8 e Ð] ß ] ß á ß ] Ñ" # 8 equivalenti in distribuzione. Se

E œ ÖÐB ß B ß á ß B ÑÀ ÐB ß B ß á ß B Ñ −" # 8 " # 88ß B  B  á  B ×" # 8 , allora tenendo presente il risultato dell'Esempio 1.1.3, risulta

E IÒ Ð\ ß \ ß á ß \ ÑÓ œ Ò Ð] ß ] ß á ß ] ÑÓE " # 8 E IE " # 8 .

Essendo E IÒ Ð\ ß \ ß á ß \ ÑÓ œE " # 8 PrÐ\  \  á  \ Ñ" # 8 e E IÒ Ð] ß ] ß á ß ] ÑÓ œE " # 8 PrÐ]  ]  á  ] Ñ" # 8 , si deve concludere che

PrÐ\  \  á  \ Ñ œ" # 8 PrÐ]  ]  á  ] Ñ" # 8 . – Esempio 1.1.5. Si consideri i vettori di variabili casuali Ð\ ß \ ß á ß \ Ñ" # 8 e Ð] ß ] ß á ß ] Ñ" # 8 , tali che \ œ ] 3 œ "ß #ß á ß 83 . 3 ( ). Si noti che non si può affermare che Ð\ ß \ ß á ß \ Ñ" # 8 è equivalente in distribuzione a Ð] ß ] ß á ß ] Ñ" # 8 , come si potrebbe ingenuamente concludere in un primo momento. Infatti, Ð\ ß \ ß á ß \ Ñ" # 8 e Ð] ß ] ß á ß ] Ñ" # 8 possiedono in generale funzioni di ripartizione congiunte differenti, anche se con identiche funzioni di ripartizione

marginali. –

Il seguente teorema estende l'equivalenza in distribuzione a trasformate, nel senso che l'equivalenza rimane valida applicando una trasformata misurabile ad ambo i membri della stessa.

Teorema 1.1.2. Se e sono variabili casuali equivalenti in distribuzione e se è una\ ] Y trasformata misurabile, allora

(7)

L'equivalenza in distribuzione 3

Y Ð\Ñ œ Y Ð] Ñ. .

Inoltre, se Ð\ ß \ ß á ß \ Ñ" # 8 e Ð] ß ] ß á ß ] Ñ" # 8 sono vettori di variabili casuali equivalenti in distribuzione e se ÐY ß Y ß á ß Y Ñ" # 5 è un vettore di trasformate misurabili, allora

ÐY Ð\ ß \ ß á ß \ Ñß Y Ð\ ß \ ß á ß \ Ñß á ß Y Ð\ ß \ ß á ß \ ÑÑ œ" " # 8 # " # 8 5 " # 8 . œ ÐY Ð] ß ] ß á ß ] Ñß Y Ð] ß ] ß á ß ] Ñß á ß Y Ð] ß ] ß á ß ] ÑÑ. " " # 8 # " # 8 5 " # 8 .

Dimostrazione. Se è la funzione di ripartizione comune alle variabili casuali e e se J \ ] E è un dato insieme misurabile, allora

PrÒY Ð\Ñ − EÓ œ( ÒY ÐBÑÓ .J ÐBÑ œ( ÒY ÐCÑÓ .J ÐCÑ œ PrÒY Ð] Ñ − EÓ

IE IE .

Dal momento che la precedente relazione è vera per ogni insieme misurabile , dallaE Definizione 1.1.1 risulta Y Ð\Ñ œ Y Ð] Ñ. . E' analoga la dimostrazione nel caso di due vettori

di variabili casuali. …

Esempio 1.1.6. Se e sono variabili casuali equivalenti in distribuzione, si consideri la\ ] trasformata Y ÐBÑ œ ÐB  ÑÎ- $, con e costanti. Dal Teorema 1.1.2 si ha- $

\  ] 

- œ -

$ $

. ,

ovvero in una equivalenza in distribuzione è possibile aggiungere o moltiplicare i membri per

una costante. –

Esempio 1.1.7. Si noti che il risultato dell'Esempio 1.1.6 non rimane valido in generale se si aggiunge o si moltiplica i membri per una quantità stocastica. Si consideri infatti una variabile casuale continua con funzione di ripartizione e tale che \ J \ œ  \. . Se si moltiplica ambo i membri dell'equivalenza per si dovrebbe concludere che le variabili\ casuali ] œ \# e ^ œ  \# sono equivalenti in distribuzione. E' immediato constatare che questa affermazione è falsa in quanto è ovviamente una variabile casuale il cui supporto è] contenuto in ‘, mentre è una variabile casuale il cui supporto è contenuto in ^ ‘. Infatti la funzione di ripartizione di risulta]

KÐCÑ œPrÐ] Ÿ CÑ œPrÐ\ Ÿ CÑ œ J Ð# [ ÈCÑ  J Ð ÈCÑ] IÒ!ß∞ÑÐCÑ, mentre la funzione di ripartizione di risulta^

LÐDÑ œPrÐ^ Ÿ DÑ œ PrÐ  \ Ÿ DÑ œ#

œ "  J Ð[ ÈDÑ  J Ð ÈDÑ] IÐ∞ß!ÑÐDÑ IÒ!ß∞ÑÐDÑ.

Questo esempio serve a sottolineare che si deve porre una certa cautela nell'applicare la nozione di equivalenza in distribuzione. In particolare si noti che il Teorema 1.1.2 rimane

valido solo se si considera trasformate misurabili. –

Esempio 1.1.8. Se Ð\ ß \ ß á ß \ Ñ" # 8 e Ð] ß ] ß á ß ] Ñ" # 8 sono vettori di variabili casuali equivalenti in distribuzione, allora si consideri il vettore di trasformate ÐY ß Y ß á ß Y Ñ" # 8 tale

(8)

4 L'equivalenza in distribuzione che Y ÐB ß B ß á ß B Ñ œ B3 " # 8 3 (3 œ "ß #ß á ß 8). Dal Teorema 1.1.2 risulta dunque \ œ ]3 . 3 (3 œ "ß #ß á ß 8), ovvero si deve concludere che se due vettori di variabili casuali sono equivalenti in distribuzione allora anche le singole componenti dei vettori sono

ordinatamente equivalenti in distribuzione. –

Il seguente teorema consente di ottenere una relazione di equivalenza in distribuzione per un vettore di variabili casuali indipendenti e ugualmente distribuite.

Teorema 1.1.3. Se Ð\ ß \ ß á ß \ Ñ" # 8 è un vettore di variabili casuali indipendenti e ugualmente distribuite e Ðα α"ß #ß á ßα8Ñ è una qualsiasi permutazione di Ð"ß #ß á ß 8Ñ, allora

Ð\ ß \ ß á ß \ Ñ œ Ð\ ß \ ß á ß \ Ñ" # 8 . α" α# α8 .

Dimostrazione. Se è la funzione di ripartizione marginale di J \ 3 œ "ß #ß á ß 83 ( ), allora la funzione di ripartizione congiunta di Ð\ ß \ ß á ß \ Ñ" # 8 è data da

J ÐB ß B ß á ß B Ñ œ8 " # 8 J ÐB Ñ3

3œ"

$8 .

Dal momento che la funzione di ripartizione congiunta di Ð\ ß \ ß á ß \ Ñα" α# α8 risulta K ÐB ß B ß á ß B Ñ œ8 J ÐB Ñ œ J ÐB Ñ œ J ÐB ß B ß á ß B Ñ3 8 " # 8

3œ" 3œ"

8 8

α" α# α8 $ α3 $ ,

allora si ha K ÐB ß B ß á ß B Ñ œ J ÐB ß B ß á ß B Ñ8 " # 8 8 " # 8 per ogni ÐB ß B ß á ß B Ñ −" # 88, e dalla Definizione 1.1.1 si conclude che Ð\ ß \ ß á ß \ Ñ œ Ð\ ß \ ß á ß \ Ñ" # 8 . α" α# α8 . … 1.2. L'equivalenza in distribuzione e le variabili casuali simmetriche. In questa sezione vengono introdotte alcune relazioni di equivalenza in distribuzione per variabili casuali simmetriche. A questo fine si consideri innanzitutto la definizione di variabile casuale simmetrica.

Definizione 1.2.1. Una variabile casuale con funzione di ripartizione è detta simmetrica\ J rispetto ad una costante se-

J Ð  BÑ œ "  J Ð  BÑ - - PrÐ\ œ- BÑ aB − , ‘ . ˜ Esempio 1.2.1. Se è una variabile casuale continua simmetrica rispetto a con funzione di\ - ripartizione e funzione di densità , allora dalla Definizione 1.2.1 risultaJ 0

J Ð  BÑ œ "  J Ð  BÑ aB −- - , ‘ , da cui si ha inoltre

0 Ð  BÑ œ 0 Ð  BÑ aB −- - , ‘ .

Se invece è una variabile casuale discreta simmetrica rispetto a con funzione di\ - ripartizione e funzione di probabilità , allora dalla Definizione 1.2.1 risultaJ :

J Ð  BÑ œ "  J Ð  BÑ  :Ð  BÑ aB −- - - , ‘ , da cui si ottiene inoltre

(9)

L'equivalenza in distribuzione 5

:Ð  BÑ œ :Ð  BÑ aB −- - , ‘ . –

Nel seguente teorema si ottiene una condizione necessaria e sufficiente per la simmetria rispetto ad una costante.

Teorema 1.2.2. La variabile casuale ha una distribuzione simmetrica rispetto alla costante\ - se e solo se

\ - œ. - \ .

Dimostrazione. Si dimostra innanzitutto che la condizione è necessaria. Se è simmetrica\ rispetto a con funzione di ripartizione , allora la funzione di ripartizione della trasformata- J ] œ \  - è data da

KÐCÑ œPrÐ] Ÿ CÑ œPrÐ\ -Ÿ CÑ œ PrÐ\ Ÿ- CÑ œ J Ð  CÑ- ,

mentre, tenendo presente la definizione di variabile casuale simmetrica, la funzione di ripartizione della trasformata ^ œ- \ risulta

LÐDÑ œPrÐ^ Ÿ DÑ œPrÐ  \ Ÿ DÑ œ- PrÐ\  - DÑ œ œ "  J Ð  DÑ - PrÐ\ œ- DÑ œ J Ð  DÑ- .

Dal momento che e possiedono la medesima funzione di ripartizione, dalla Definizione] ^ 1.1.1 si ha ] œ ^. , ovvero \ -œ. - \. Si dimostra ora che la condizione è sufficiente.

Se \ - œ. - \, allora dalla definizione di equivalenza in distribuzione risulta PrÐ\ -Ÿ BÑ œ PrÐ  \ Ÿ BÑ- .

Tenendo presente la precedente relazione si ha

J Ð  BÑ œ- PrÐ\ Ÿ- BÑ œ PrÐ\ - Ÿ BÑ œ PrÐ  \ Ÿ BÑ œ- œPrÐ\  - BÑ œ "  J Ð  BÑ - PrÐ\ œ- BÑ ,

ovvero è simmetrica rispetto a .\ - …

Esempio 1.2.2. Sia Ð\ ß \ Ñ" # un vettore di variabili casuali tale che Ð\ ß \ Ñ œ Ð\ ß \ Ñ" # . # " e si consideri la trasformata Y ÐB ß B Ñ œ B  B" # " #. Dal Teorema 1.1.2 si ottiene dunque

\  \ œ \  \" # . # " , ovvero

\  \ œ  Ð\  \ Ñ" # . " # .

Dunque, per il Teorema 1.2.2 la trasformata Ð\  \ Ñ" # è simmetrica rispetto a .! – Esempio 1.2.3. Sia una variabile casuale simmetrica rispetto a con E\ - Ð\Ñ  ∞. Dal Teorema 1.2.2 si ha \ -œ. - \. Dal momento che variabili casuali equivalenti in distribuzione hanno la stessa media vedi Esempio 1.1.2 , alloraÐ Ñ

EÐ\  Ñ œ Ð  \Ñ- E - ,

(10)

6 L'equivalenza in distribuzione

ovvero

EÐ\Ñ - œ- Ð\ÑE ,

da cui infine risulta EÐ\Ñ œ-. –

Il seguente teorema considera un insieme di equivalenze in distribuzione per un vettore di variabili casuali le cui componenti sono indipendenti e simmetriche.

Teorema 1.2.3. Se Ð\ ß \ ß á ß \ Ñ" # 8 è un vettore di variabili casuali indipendenti tali che \3 è simmetrica rispetto a (-3 3 œ "ß #ß á ß 8), allora

Ð\ " -"ß \ # -#ß á ß \ 8 -8Ñ œ Ð. -" \ ß \ " # -#ß á ß \ 8 -8Ñ œ á œ. . œ Ð. -" \ ß" -#  \ ß á ß# -8 \ Ñ8 ,

dove l'equivalenza in distribuzione è estesa a tutte le possibili #8 configurazioni di vettori.

Dimostrazione. Si dimostra la prima delle equivalenze in distribuzione. Per il Teorema 1.2.2 la simmetria di \3 rispetto a implica -3 \ 3 -3 œ. -3 \3, ovvero dalla definizione di equivalenza in distribuzione si ottiene

PrÐ\ 3 -3 Ÿ BÑ œ PrÐ-3 \ Ÿ BÑ 3 œ "ß #ß á ß 83 , . Data l'indipendenza delle componenti di Ð\ ß \ ß á ß \ Ñ" # 8 , risulta dunque PrÐ\ " -" Ÿ B ß \ " # -# Ÿ B ß á ß \ # 8 -8Ÿ B Ñ œ8

œ$ Ð\  Ÿ B Ñ œ Ð  \ Ÿ B Ñ$ Ð\  Ÿ B Ñ œ

3œ" 3œ#

8 8

3 3 3 " " " 3 3 3

Pr - Pr - Pr -

œPrÐ-" \ Ÿ B ß \ " " # -# Ÿ B ß á ß \ # 8 -8Ÿ B Ñ8 ,

ovvero si ha Ð\ " -"ß \ # -#ß á ß \ 8 -8Ñ œ Ð. -" \ ß \ " # -#ß á ß \ 8 -8Ñ. In modo analogo si ottiene la dimostrazione delle altre equivalenze in distribuzione. …

Esempio 1.2.4. Sia Ð\ ß \ ß á ß \ Ñ" # 8 un campione casuale da una variabile casuale \ simmetrica rispetto a . Dal Teorema 1.2.3 risulta dunque-

Ð\  ß \  ß á ß \  Ñ œ Ð  \ ß  \ ß á ß  \ Ñ" - # - 8 - . - " - # - 8 .

Inoltre, se si considera la trasformata Y ÐB ß B ß á ß B Ñ œ 8" # 8 " 3œ"8 B3, dal Teorema 1.1.2 si ha

" "

8 Ð\  Ñ œ 8 Ð  \ Ñ,

3œ" 3œ"

8 8

3 - . - 3

ovvero

\ – œ  \– - . - ,

(11)

L'equivalenza in distribuzione 7 dove – è la media campionaria. Tenendo presente il Teorema 1.2.2, la

\ œ 8" 3œ"8 \3

precedente equivalenza in distribuzione ci porta dunque a concludere che in questo caso la

media campionaria è simmetrica rispetto a .- –

Esempio 1.2.5. Sia Ð\ ß \ ß á ß \ Ñ" # 8 un campione casuale da una variabile casuale \ continua e simmetrica rispetto a . Dal Teorema 1.2.3 risulta!

Ð\ ß \ ß á ß \ Ñ œ Ð  \ ß  \ ß á ß  \ Ñ" # 8 . " # 8 .

Si consideri ora il vettore di trasformate ÐY ß Y ß á ß Y Ñ" # 8 tale che Y ÐB ß B ß á ß B Ñ œ B3 " # 8 Ð3Ñ, dove BÐ3Ñ rappresenta l' -esimo elemento ordinato nel vettore 3 ÐB ß B ß á ß B Ñ" # 8 (3 œ "ß #ß á ß 8). Si noti che Y Ð  B ß  B ß á ß  B Ñ œ  B3 " # 8 Ð83"Ñ (3 œ "ß #ß á ß 8), in quanto cambiando il segno agli elementi del vettore ÐB ß B ß á ß B Ñ" # 8 se ne inverte l'ordinamento. Dal Teorema 1.1.2 si ottiene dunque

Ð\ ß \ ß á ß \Ð"Ñ Ð#Ñ Ð8ÑÑ œ Ð  \. Ð8Ñß  \Ð8"Ñß á ß  \ ÑÐ"Ñ ,

dove \Ð3Ñ rappresenta l' -esima statistica ordinata (3 3 œ "ß #ß á ß 8). In particolare, tenendo presente l'Esempio 1.1.8, si ottiene \Ð3Ñ œ  \. Ð83"Ñ (3 œ "ß #ß á ß 8). E' analogo verificare che se Ð\ ß \ ß á ß \ Ñ" # 8 è un campione casuale da una variabile casuale continua e\ simmetrica rispetto a , allora-

Ð\Ð"Ñ ß \- Ð#Ñ ß á ß \- Ð8Ñ Ñ œ Ð  \- . - Ð8Ñß  \- Ð8"Ñß á ß  \ Ñ- Ð"Ñ ,

che implica \Ð3Ñ- œ. - \Ð83"Ñ Ð3 œ "ß #ß á ß 8Ñ. – Esempio 1.2.6. Sia Ð\ ß \ ß á ß \ Ñ" # 8 un campione casuale da una variabile casuale \ continua e simmetrica rispetto a . Tenendo presente l'Esempio 1.2.5, si applichi! all'equivalenza in distribuzione Ð\ ß \ ß á ß \Ð"Ñ Ð#Ñ Ð8ÑÑ œ Ð  \. Ð8Ñß  \Ð8"Ñß á ß  \ ÑÐ"Ñ la trasformata , dove Y Y ÐB ß B ß á ß B Ñ œ B" # 8 Ð6Ñ con 6 œ Ð8  "ÑÎ# se è dispari e8 Y ÐB ß B ß á ß B Ñ œ ÐB" # 8 Ð6Ñ BÐ6"ÑÑÎ# con 6 œ 8Î# se è pari. Dal Teorema 1.1.2 per 8 8 dispari si ha dunque

\Ð6Ñ œ  \. Ð6Ñ , mentre per pari si ha8

" "

# Ð\Ð6Ñ \Ð6"ÑÑ œ . # Ð\Ð6Ñ \Ð6"ÑÑ.

Dal momento che la mediana campionaria è usualmente definita come ~ con

\ œ \Ð6Ñ 6 œ Ð8  "ÑÎ# se è dispari ed è definita come 8 \ œ Ð\~  \ ÑÎ# con 6 œ 8Î# se è8

Ð6Ñ Ð6"Ñ

pari, allora risulta

\ œ  \~ ~

. ,

ovvero, tenendo presente il Teorema 1.2.2, si deve concludere che in questo caso la mediana campionaria è simmetrica rispetto a . Risulta analogo verificare che se ! Ð\ ß \ ß á ß \ Ñ" # 8 è un campione casuale da una variabile casuale continua e simmetrica rispetto a , allora la\ -

mediana campionaria è simmetrica rispetto a .- –

(12)

Capitolo 2

Le statistiche “distribution-free”

2.1. I modelli statistici “distribution-free”. Nella statistica inferenziale classica si assume nota la morfologia funzionale delle funzioni di ripartizione congiunte specificate dal modello statistico e in particolare si assume che queste siano dello stesso tipo a meno di un insieme di parametri. Invece, nella statistica moderna si tende a non fare assunzioni funzionali sulla distribuzione congiunta del campione, ovvero si considera i cosiddetti modelli statistici

“distribution-free” (una definizione anglosassone ormai consolidata anche nella terminologia statistica italiana). Un modello statistico “distribution-free” ha la seguente definizione formale.

Definizione 2.1.1. Si consideri il campione Ð\ ß \ ß á ß \ Ñ" # 8 con funzione di ripartizione congiunta J −8 Y, dove è una classe di funzioni di ripartizione congiunte, ovvero unY modello statistico. Se contiene più di una famiglia di funzioni di ripartizione congiunte,Y

allora è detto modello statistico “distribution-free”. ˜

Esempio 2.1.1. Il modello statistico

Y œ ÖJ À J ÐB ß B ß á ß B Ñ œ8 8 " # 8 FÒÐB  ÑÎ Óß3 . 5 .− ß‘ 5 −‘ ×

3œ"

8

$

non è “distribution-free”, in quanto contiene una sola famiglia di funzioni di ripartizione congiunte, ovvero le funzioni di ripartizione congiunte di un campione casuale da una R Ð ß. 5#Ñ. Il precedente modello statistico è tipico nell'inferenza classica. Invece, se V8

rappresenta la classe delle funzioni di ripartizione di un vettore di variabili casuali8 continue, allora

Y œ ÖJ À J −8 8 V8×

costituisce un modello statistico “distribution-free”. –

Frequentemente il modello statistico è del tipo Y<, ovvero è indicizzato mediante un insieme di “parametri” non necessariamente reali . Importanti modelli statistici “distribution-free”< Ð Ñ possono essere indicizzati in questa maniera. Ad esempio nel seguito sarà fatto riferimento al modello statistico “distribution-free”

VJ 8 8 " # 8 3 V

3œ"

8

œ ÖJ À J ÐB ß B ß á ß B Ñ œ$J ÐB Ñß J − × ,

dove rappresenta la classe delle funzioni di ripartizione di una variabile casuale continua.V Ovviamente, VJ rappresenta il modello statistico relativo ad un campione casuale

(13)

Le statistiche “distribution-free” 9 proveniente da una variabile casuale continua. Una importante sottoclasse di VJ è data dal modello statistico “distribution-free”

`-ßJ 8 8 " # 8 3 - ` - ‘

3œ"

8

œ ÖJ À J ÐB ß B ß á ß B Ñ œ$J ÐB  Ñß J − ß − ×, dove ` rappresenta la classe delle funzioni di ripartizione di una variabile casuale continua con mediana pari a , ovvero!

`œ ÖJ À J − ß J Ð!Ñ œ "Î#× .V

Si noti che `-ßJ rappresenta il modello statistico relativo ad un campione casuale proveniente da una variabile casuale continua con funzione di ripartizione J ÐB  Ñ- e con mediana pari a . Una sottoclasse di - `-ßJ è data dal modello statistico “distribution-free”

f-ßJ 8 8 " # 8 3 - f - ‘

3œ"

8

œ ÖJ À J ÐB ß B ß á ß B Ñ œ$J ÐB  Ñß J − ß − ×, dove rappresenta la classe delle funzioni di ripartizione di una variabile casuale continua ef simmetrica rispetto a , ovvero!

f œ ÖJ À J − ß J ÐBÑ œ "  J Ð  BÑ×V . Dunque, f-ßJ rappresenta il modello statistico relativo ad un campione casuale proveniente da una variabile casuale continua con funzione di ripartizione J ÐB  Ñ- e simmetrica rispetto a . Due ulteriori sottoclassi di - VJ di uso frequente sono rappresentati dai modelli statistici

“distribution-free”

_JßJ 8 8 " # 8 3 3 J V J ‘

3œ" 3œ8 "

8 8

œ ÖJ À J ÐB ß B ß á ß B Ñ œ$" J ÐB Ñ $ J ÐB  Ñß J − ß − ×

"

,

e

i(ßJ 8 8 " # 8 3 3 ( V ( ‘

3œ" 3œ8 "

8 8

œ ÖJ À J ÐB ß B ß á ß B Ñ œ$" J ÐB Ñ $ J ÐB Î Ñß J − ß − ×

"

,

dove ." Ÿ 8 Ÿ 8"

2.2. Le statistiche “distribution-free”. Le statistiche “distribution-free” hanno la seguente definizione formale.

Definizione 2.2.1. Si consideri il campione Ð\ ß \ ß á ß \ Ñ" # 8 con funzione di ripartizione congiunta J −8 Y, dove è un modello statistico. La statistica Y X œ X Ð\ ß \ ß á ß \ Ñ" # 8 è detta “distribution-free” su se la sua funzione di ripartizione rimane invariata per ogniY

J −8 Y . ˜

Esempio 2.2.1. Si consideri un campione casuale Ð\ ß \ ß á ß \ Ñ" # 8 con funzione di ripartizione congiunta J −8 Y5, dove

Y5 œ ÖJ À J ÐB ß B ß á ß B Ñ œ8 8 " # 8 FÐB Î Ñß3 5 5− ‘ ×

3œ"

8

$ .

(14)

10 Le statistiche “distribution-free”

Il modello statistico Y5 è ovviamente quello relativo ad un campione casuale da una R Ð!ß5#Ñ. Se e \– W# rappresentano rispettivamente la media campionaria e la varianza campionaria corretta, allora è noto che la statistica – è distribuita come una di

X œÈ8\ÎW >

Student con Ð8  "Ñ gradi di libertà. Poichè la distribuzione di non dipende dal parametroX 5, allora è una statistica “distribution-free” su X Y5. – L'Esempio 2.2.1 evidenzia che una tipica statistica dell'inferenza classica può essere considerata “distribution-free” su un particolare modello statistico classico. Tuttavia, usualmente una statistica è detta “distribution-free” quando il modello statistico èY anch'esso “distribution-free”. Quando si dispone di campioni di numerosità elevata risulta interessante considerare statistiche “distribution-free” per grandi campioni, che sono definite formalmente di seguito.

Definizione 2.2.2. Si consideri il campione Ð\ ß \ ß á ß \ Ñ" # 8 con funzione di ripartizione congiunta J −8 Y, dove è un modello statistico per ogni . La statisticaY 8 X œ X œ X Ð\ ß \ ß á ß \ Ñ8 8 " # 8 è detta “distribution-free” per grandi campioni su , se perY 8 Ä ∞ risulta X Ä Z8 . per ogni J −8 Y, dove è una data variabile casuale limite.Z ˜ Esempio 2.2.2. Si consideri il modello statistico “distribution-free”

Y5ßJ œ ÖJ À J −8 8 VJß EÐ\Ñ œ !ß VarÐ\Ñ œ 5#  ∞×.

Se Ð\ ß \ ß á ß \ Ñ" # 8 è un campione casuale con funzione di ripartizione congiunta J −8 Y5ßJ, si consideri la statistica X œ X œ8 È8\ÎW– dell'Esempio 2.2.1. Si noti che X può essere espressa come

X œ \

Î 8 W –

. 5

5 È

Dal momento che W Ä# : 5# per 8 Ä ∞ (vedi Esempio A.3.4), per il Teorema di Sverdrup (Teorema A.3.4) si ha W Ä: 5 per 8 Ä ∞. Inoltre, per il Teorema Fondamentale Classico del Limite (Teorema A.3.6) si ha È8\Î Ä RÐ!ß "Ñ– 5 . . Combinando questi risultati mediante il Teorema di Slutsky (Teorema A.3.5) si ottiene infine

X œ \ Ä R Ð!ß "Ñ WÎ 8

– È . .

Si deve dunque concludere che la statistica è “distribution-free” per grandi campioni suX

Y5ßJ. –

2.3. Le statistiche segno. In questa sezione viene introdotta una prima classe di statistiche

“distribution-free”, ovvero le cosiddette statistiche segno.

Definizione 2.3.1. Sia Ð\ ß \ ß á ß \ Ñ" # 8 un campione casuale con funzione di ripartizione congiunta J −8 `!ßJ. Si definiscono statistiche segno le trasformate

^ œ3 IÐ!ß∞ÑÐ\ Ñ 3 œ "ß #ß á ß 83 , .

Il vettore di statistiche Ð^ ß ^ ß á ß ^ Ñ" # 8 è detto vettore dei segni. ˜

(15)

Le statistiche “distribution-free” 11 Si noti che ogni statistica segno ^3 assume valore se " \  !3 (ovvero se \3 è maggiore della mediana) e il valore altrimenti (! 3 œ "ß #ß á ß 8) e ovviamente da questo fatto deriva la loro denominazione. Il seguente teorema fornisce la distribuzione congiunta delle statistiche segno.

Teorema 2.3.2. Se Ð\ ß \ ß á ß \ Ñ" # 8 è un campione casuale con funzione di ripartizione congiunta J −8 `!ßJ, il relativo vettore dei segni Ð^ ß ^ ß á ß ^ Ñ" # 8 ha componenti indipendenti ed ugualmente distribuite come F3Ð"ß "Î#Ñ.

Dimostrazione. Dal momento che dalla Definizione 2.3.1 ogni statistica segno ^3 è trasformata solo della relativa \3 (3 œ "ß #ß á ß 8) e poichè il campione casuale Ð\ ß \ ß á ß \ Ñ" # 8 ha componenti indipendenti, allora anche le componenti del vettore dei segni Ð^ ß ^ ß á ß ^ Ñ" # 8 sono indipendenti. Inoltre si noti che il supporto della statistica segno

^ 3 œ "ß #ß á ß 83 ( ) è l'insieme Ö!ß "×. Dalla assunzione di continuità fatta per \3 si ha PrÐ^ œ "Ñ œPrÐ\  !Ñ œ "  J Ð!Ñ œ " 3 œ "ß #ß á ß 8

3 3 # , ,

e di conseguenza

PrÐ^ œ !Ñ œ " PrÐ^ œ "Ñ œ " 3 œ "ß #ß á ß 8

3 3 # , .

E' immediato dunque concludere che la statistica segno ^3 è F3Ð"ß "Î#Ñ. … Corollario 2.3.3. Sia Ð\ ß \ ß á ß \ Ñ" # 8 un campione casuale con funzione di ripartizione congiunta J −8 `!ßJ. Se X œ X Ð^ ß ^ ß á ß ^ Ñ" # 8 , ovvero è una statistica basata solo sulX vettore dei segni, allora è “distribution-free” su X `!ßJ.

Dimostrazione. Il risultato segue immediatamente dal Teorema 2.3.2 e dalla Definizione 2.3.1, in quanto per qualsiasi distribuzione congiunta J −8 `!ßJ la statistica è distribuitaX come una trasformata di un vettore di variabili casuali indipendenti ed ugualmente distribuite

come .F3Ð"ß "Î#Ñ …

Esempio 2.3.1. Sia Ð\ ß \ ß á ß \ Ñ" # 8 un campione casuale con funzione di ripartizione congiunta J −8 `!ßJ. Si consideri la statistica

F œ ^

3œ"

8 3 ,

che ovviamente rappresenta il numero di osservazioni positive nel campione. Utilizzando il Teorema 2.3.2 si verifica facilmente che F µ F3Ð8ß "Î#Ñ. Di conseguenza, poichè la funzione di ripartizione di rimane invariata per ogni funzione di ripartizione congiunta diF

`!ßJ, allora è una statistica “distribution-free” su F `!ßJ. Questo risultato può essere

ottenuto immediatamente dal Corollario 2.3.3. –

2.4. Le statistiche rango. La classe delle statistiche rango è fondamentale per costruire statistiche “distribution-free”. La seguente è la definizione formale di statistica rango.

Definizione 2.4.1. Sia Ð\ ß \ ß á ß \ Ñ" # 8 un campione casuale con funzione di ripartizione congiunta J −8 VJ. Si definiscono statistiche rango le seguenti trasformate

(16)

12 Le statistiche “distribution-free”

V œ3 Ð\  \ Ñ 3 œ "ß #ß á ß 83 4

4œ"

8 Ò!ß∞Ñ

I , .

Il vettore di statistiche ÐV ß V ß á ß V Ñ" # 8 è detto vettore dei ranghi. ˜ Si noti che la statistica V3 rappresenta la posizione di \3 all'interno del campione ordinato, ovvero

\ œ \3 ÐV Ñ3 , 3 œ "ß #ß á ß 8 ,

e da questo deriva ovviamente la denominazione di statistiche rango.

Definizione 2.4.2. Si definisce insieme delle permutazioni l'insieme e8 §‘8 dato da

e8œ ÖÐ< ß < ß á ß < ÑÀ Ð< ß < ß á ß < Ñ" # 8 " # 8 è una permutazione di Ð"ß #ß á ß 8Ñ× . ˜

Nel seguente teorema viene ottenuta la distribuzione congiunta del vettore dei ranghi.

Teorema 2.4.3. Se Ð\ ß \ ß á ß \ Ñ" # 8 è un campione casuale con funzione di ripartizione congiunta J −8 VJ, allora la funzione di probabilità congiunta del relativo vettore dei ranghi ÐV ß V ß á ß V Ñ" # 8 è data da

PrÐV œ < ß V œ < ß á ß V œ < Ñ œ " Ð< ß < ß á ß < Ñ −

" " # # 8 8 8x , " # 8 e8 .

Dimostrazione. E' immediato verificare che il vettore di variabili casuali ÐV ß V ß á ß V Ñ" # 8 è discreto con supporto e8. Si noti inoltre che per un prefissato Ð< ß < ß á ß < Ñ −" # 8 e8 risulta

PrÐV œ < ß V œ < ß á ß V œ < Ñ œ" " # # 8 8 PrÐ\ œ \" Ð< Ñ" ß \ œ \# Ð< Ñ#ß á ß \ œ \8 Ð< Ñ8 Ñ œ œPrÐ\  \  á  \ Ñ." .# .8 ,

dove è la posizione del numero (.3 3 3 œ "ß #ß á ß 8) nella permutazione Ð< ß < ß á ß < Ñ" # 8 . Dal Teorema 1.1.3 si ha Ð\ ß \ ß á ß \ Ñ œ Ð\ ß \ ß á ß \ Ñ" # 8 . ." .# .8 , che implica (vedi Esempio 1.1.4)

PrÐ\  \  á  \ Ñ œ." .# .8 PrÐ\  \  á  \ Ñ" # 8 . Dunque

PrÐV œ < ß V œ < ß á ß V œ < Ñ œ" " # # 8 8 PrÐ\  \  á  \ Ñ œ" # 8

œ PrÐV œ "ß V œ #ß á ß V œ 8Ñ" # 8 . Inoltre, dal momento che #Ðe8Ñ œ 8x, si ha

Ð< ß< ßáß< Ñ−

" " # # 8 8

" # 8 e8

PrÐV œ < ß V œ < ß á ß V œ < Ñ œ

œ ÐV œ "ß V œ #ß á ß V œ 8Ñ œ 8x ÐV œ "ß V œ #ß á ß V œ 8Ñ

Ð< ß< ßáß< Ñ−

" # 8 " # 8

" # 8 e8

Pr Pr .

(17)

Le statistiche “distribution-free” 13

Infine, essendo

Ð< ß< ßáß< Ñ−

" " # # 8 8

" # 8 e8

PrÐV œ < ß V œ < ß á ß V œ < Ñ œ " ,

allora si ha

PrÐV œ "ß V œ #ß á ß V œ 8Ñ œ "

" # 8 8x .

Si deve concludere dunque che

PrÐV œ < ß V œ < ß á ß V œ < Ñ œ" " # # 8 8 PrÐV œ "ß V œ #ß á ß V œ 8Ñ œ" # 8

œ " Ð< ß < ß á ß < Ñ −

8x , " # 8 e8 ,

ovvero il vettore dei ranghi ÐV ß V ß á ß V Ñ" # 8 è distribuito uniformemente su e8. … Dal Teorema 2.4.3 è possibile ricavare i seguenti quattro corollari.

Corollario 2.4.4. Sia Ð\ ß \ ß á ß \ Ñ" # 8 un campione casuale con funzione di ripartizione congiunta J −8 VJ. La funzione di probabilità della statistica rango V3 (3 œ "ß #ß á ß 8) risulta

PrÐV œ <Ñ œ " < œ "ß #ß á ß 8

3 8 , ,

la funzione di probabilità congiunta di una scelta di due statistiche rango ÐV ß V Ñ3 4

(3 Á 4 œ "ß #ß á ß 8) risulta

PrÐV œ < ß V œ < Ñ œ " < Á < œ "ß #ß á ß 8 8Ð8  "Ñ

3 " 4 # , " # ,

mentre la funzione di probabilità congiunta di una scelta di statistiche rango5 ÐV ß V ß á ß V Ñ 3 Á 3 Á á Á 3 œ "ß #ß á ß 83" 3# 35 ( " # 5 ) risulta

PrÐV œ < ß V œ < ß á ß V œ < Ñ œ "

8Ð8  "Ñá Ð8  5  "Ñ

3" " 3# # 35 5 ,

5 œ "ß #ß á ß 8 < Á < Á á Á < œ "ß #ß á ß 8 , " # 5 .

Dimostrazione. Dal Teorema 2.4.3 risulta che ogni determinazione del vettore ÐV ß V ß á ß V Ñ" # 8 in e8 è ugualmente probabile. Inoltre vi sono Ð8  "Ñx elementi di e8 per cui V œ < < œ "ß #ß á ß 83 ( ), e dunque si ha

PrÐV œ <Ñ œ Ð8  "Ñx " œ " < œ "ß #ß á ß 8

8x 8

3 , .

Analogamente, vi sono Ð8  #Ñx elementi di e8 per cui V œ <3 " e V œ <4 #

(< Á < œ "ß #ß á ß 8" # ), e quindi

PrÐV œ < ß V œ < Ñ œ Ð8  #Ñx " œ " < Á < œ "ß #ß á ß 8 8x 8Ð8  "Ñ

3 " 4 # , " # .

(18)

14 Le statistiche “distribution-free”

Infine, si noti che vi sono Ð8  5Ñx elementi di e8 per cui V œ < ß V œ < ß á ß V œ <3" " 3# # 35 5 (< Á < Á á Á < œ "ß #ß á ß 8" # 5 ), e quindi

PrÐV œ < ß V œ < ß á ß V œ < Ñ œ Ð8  5Ñx " œ "

8x 8Ð8  "Ñá Ð8  5  "Ñ

3" " 3# # 35 5 ,

5 œ "ß #ß á ß 8 < Á < Á á Á < œ "ß #ß á ß 8 , " # 5 . … Corollario 2.4.5. Sia Ð\ ß \ ß á ß \ Ñ" # 8 un campione casuale con funzione di ripartizione congiunta J −8 VJ. Si ha

EÐV Ñ œ " Ð8  "Ñ 3 œ "ß #ß á ß 8 , ,

3 #

VarÐV Ñ œ " Ð8  "Ñ 3 œ "ß #ß á ß 8

"#

3 # , ,

e

CovÐV ß V Ñ œ  " Ð8  "Ñ 3 Á 4 œ "ß #ß á ß 8 , .

"#

3 4

Dimostrazione. Dal Corollario 2.4.4 e tenendo presente il Teorema A.2.1, si ha EÐV Ñ œ " < œ " Ð8  "Ñ 3 œ "ß #ß á ß 8 , .

8 #

3

<œ"

8

Analogamente

EÐV Ñ œ " < œ " Ð8  "ÑÐ#8  "Ñ 3 œ "ß #ß á ß 8 , ,

8 '

3# #

<œ"

8

da cui

VarÐV Ñ œ " Ð8  "ÑÐ#8  "Ñ  " Ð8  "Ñ œ " Ð8  "Ñ 3 œ "ß #ß á ß 8 , .

' % "#

3 # #

Di nuovo dal Corollario 2.4.4 e tenendo presente il Teorema A.2.1, si ha

EÐV V Ñ œ " < < œ " ÒÐ <Ñ  < Ó œ 8Ð8  "Ñ 8Ð8  "Ñ

3 4 " #

< œ" <œ" <œ"

8 8 8 8

< Á< œ"

# #

" # "

œ " Ò 8 Ð8  "Ñ " " 8Ð8  "ÑÐ#8  "ÑÓ œ

8Ð8  "Ñ % '

# #

œ " Ð8  "ÑÐ$8  #Ñ 3 Á 4 œ "ß #ß á ß 8

"# , ,

per cui

CovÐV ß V Ñ œ ÐV V Ñ  ÐV Ñ ÐV Ñ œ3 4 E 3 4 E 3 E 4

(19)

Le statistiche “distribution-free” 15

œ " Ð8  "ÑÐ$8  #Ñ  " Ð8  "Ñ œ  " Ð8  "Ñ 3 Á 4 œ "ß #ß á ß 8

"# % # "# , . …

Corollario 2.4.6. Sia Ð\ ß \ ß á ß \ Ñ" # 8 un campione casuale con funzione di ripartizione congiunta J −8 VJ. Se X œ X ÐV ß V ß á ß V Ñ" # 8 , ovvero è una statistica basata solo sulX vettore dei ranghi, allora è “distribution-free” sulla classe X VJ.

Dimostrazione. Il risultato segue immediatamente dal Teorema 2.4.3, in quanto per qualsiasi distribuzione congiunta di J −8 VJ la statistica è distribuita come una trasformata di unX vettore di variabili casuali uniformemente distribuito su e8. … Corollario 2.4.7. Sia Ð\ ß \ ß á ß \ Ñ" # 8 un campione casuale con funzione di ripartizione congiunta J −8 VJ. Si consideri una scelta di statistiche rango 5 ÐV ß V ß á ß V Ñ3" 3# 35 e sia

ÐVÐ3 Ñ" ß VÐ3 Ñ#ß á ß VÐ3 Ñ5 Ñ il relativo vettore di statistiche rango ordinato in senso crescente

(3 Á 3 Á á Á 3 œ "ß #ß á ß 8" # 5 ). Si ha

PrÐV œ < ß V œ < ß á ß V œ < Ñ œ 8

Ð3 Ñ Ð"Ñ Ð3 Ñ Ð#Ñ Ð3 Ñ Ð5Ñ 5

"

" # 5 Š ‹ ,

5 œ "ß #ß á ß 8 " Ÿ < , Ð"Ñ  <Ð#Ñ  á  <Ð5Ñ Ÿ 8 .

Dimostrazione. Sia Ð< ß < ß á ß < ÑÐ"Ñ Ð#Ñ Ð5Ñ una scelta di elementi di 5 Ð"ß #ß á ß 8Ñ tale che

" Ÿ <Ð"Ñ  <Ð#Ñ  á  <Ð5Ñ Ÿ 8. Dal Corollario 2.4.4 si ha

PrÐV œ < ß V œ < ß á ß V œ < Ñ œ "

8Ð8  "Ñá Ð8  5  "Ñ

3" Ð"Ñ 3# Ð#Ñ 35 Ð5Ñ .

Tuttavia questa è solo una possibile permutazione di ÐV ß V ß á ß V Ñ3" 3# 35 per cui si ha

VÐ3 Ñ" œ < ß VÐ"Ñ Ð3 Ñ# œ < ß á ß VÐ#Ñ Ð3 Ñ5 œ <Ð5Ñ. Poichè esistono di tali permutazioni ed ognuna è5x

ugualmente probabile, allora

PrÐV œ < ß V œ < ß á ß V œ < Ñ œ 5x " œ 8Ð8  "Ñá Ð8  5  "Ñ

Ð3 Ñ" Ð"Ñ Ð3 Ñ# Ð#Ñ Ð3 Ñ5 Ð5Ñ

œ 8 5 œ "ß #ß á ß 8 " Ÿ <  <  á  < Ÿ 8

Š ‹5 " , , Ð"Ñ Ð#Ñ Ð5Ñ . …

Esempio 2.4.1. Si consideri due campioni casuali Ð\ ß \ ß á ß \ Ñ" # 8" e Ð] ß ] ß á ß ] Ñ" # 8# provenienti da due variabili casuali continue ed equivalenti in distribuzione. Dunque, se 8 œ 8  8" #, si noti che il campione misto Ð\ ß \ ß á ß \ ß ] ß ] ß á ß ] Ñ" # 8" " # 8# formato dai due campioni casuali originali può essere considerato sua volta un campione casuale con funzione di ripartizione congiunta J −8 VJ. Di conseguenza, siano ÐV ß V ß á ß V Ñ" # 8" i ranghi assegnati a Ð\ ß \ ß á ß \ Ñ" # 8" e ÐV8 "" ß V8 #" ß á ß V Ñ8 i ranghi assegnati a Ð] ß ] ß á ß ] Ñ" # 8# nel campione misto. Si consideri la statistica

[ œ V

8

3œ"

3

"

,

che fornisce evidentemente la somma dei ranghi assegnati a Ð\ ß \ ß á ß \ Ñ" # 8" . Si noti che quando i ranghi assegnati a Ð\ ß \ ß á ß \ Ñ" # 8" sono i più bassi (ovvero "ß #ß á ß 8") si ottiene il valore minimo che [ può assumere, dato da 83œ"" 3 œ 8 Ð8  "ÑÎ#" " . Alternativamente,

(20)

16 Le statistiche “distribution-free”

quando i ranghi assegnati a Ð\ ß \ ß á ß \ Ñ" # 8" sono i più elevati (ovvero 8  "ß# 8  #ß á ß 8# ) si ottiene il valore massimo che [ può assumere, dato da 83œ"" Ð8  3Ñ œ# 8 Ð8  8  "ÑÎ#" # . Di conseguenza, è immediato verificare che il supporto di [ risulta Ö8 Ð8  "ÑÎ#ß 8 Ð8  "ÑÎ#  "ß á ß 8 Ð8  8  "ÑÎ#×" " " " " # . Se -8 ß8" #ÐAÑ rappresenta il numero di sottoinsiemi di 8" interi di Ð"ß #ß á ß 8Ñ la cui somma è , dal momento cheA

[ œ V

8

3œ"

Ð3Ñ

"

,

allora tenendo presente il Corollario 2.4.7 la funzione di probabilità di [ è data da

: ÐAÑ œ Ð[ œ AÑ œ 8 - ÐAÑ

8 ß8 8 8 ß8

"

"

" # Pr Π" # ,

A œ 8 Ð8  "ÑÎ#ß 8 Ð8  "ÑÎ#  "ß á ß 8 Ð8  8  "ÑÎ#" " " " " # .

Poichè la distribuzione di [ rimane invariata per ogni funzione di ripartizione congiunta di VJ, allora si deve concludere che [ è “distribution-free” su VJ. Questo risultato può essere

ottenuto immediatamente dal Corollario 2.4.6. –

2.5. Le statistiche rango dei valori assoluti. Le statistiche rango dei valori assoluti costituiscono un'ulteriore importante classe di statistiche “distribution-free”.

Definizione 2.5.1. Sia Ð\ ß \ ß á ß \ Ñ" # 8 un campione casuale con funzione di ripartizione congiunta J −8 f!ßJ. Si definiscono come statistiche rango dei valori assoluti le seguenti trasformate

V œ3 Ð ± \ ±  ± \ ± Ñ 3 œ "ß #ß á ß 8

4œ"

8

Ò!ß∞Ñ 3 4

I , .

Il vettore di statistiche ÐV ß V ß á ß V Ñ" # 8 è detto vettore dei ranghi dei valori assoluti. ˜ E' immediato constatare che ÐV ß V ß á ß V Ñ" # 8 non è altro che il vettore dei ranghi assegnati ai valori assoluti degli elementi del campione casuale originale. Il seguente teorema fornisce la distribuzione congiunta delle statistiche rango dei valori assoluti.

Teorema 2.5.2. Se Ð\ ß \ ß á ß \ Ñ" # 8 è un campione casuale con funzione di ripartizione congiunta J −8 f!ßJ, allora la funzione di probabilità congiunta del relativo vettore dei ranghi dei valori assoluti ÐV ß V ß á ß V Ñ" # 8 è data da

PrÐV œ < ß V œ < ß á ß V œ < Ñ œ " Ð< ß < ß á ß < Ñ − 8x

" " # # 8 8 , " # 8 e8 .

Dimostrazione. E' immediato verificare che Ð ± \ ± ß ± \ ± ß á ß ± \ ± Ñ" # 8 è ancora un campione casuale. Dunque, poichè ÐV ß V ß á ß V Ñ" # 8 è un vettore dei ranghi relativo ad un campione casuale, allora dal Teorema 2.4.3 si ha che ÐV ß V ß á ß V Ñ" # 8 è uniformemente

distribuito su e8. …

Si noti che se una variabile casuale continua è simmetrica il punto di simmetria coincide con la mediana. Dunque, essendo f!ßJ §`!ßJ, la distribuzione congiunta del vettore dei segni è

Riferimenti

Documenti correlati

D basta conoscere la temperatura di una delle sorgenti e il calore ceduto alla sorgente più fredda in un ciclo. Nome……… Cognome……….………

6 Considera il moto del punto materiale rappresentato dal grafico precedente: quale delle seguenti affermazioni è vera. A La velocità

C Il corpo rigido si può spostare nello spazio e può ruotare: esso è in equilibrio quando la somma vettoriale di tutte le forze applicate è nulla.. D Il corpo rigido si può

Cinesi, giapponesi e tutti gli altri gruppi etnici asiatici che abitano in Italia hanno spesso difficoltà a leggere

I precedenti risultati possono essere generalizzati al caso di un vettore di parametri.. Il limite inferiore di Rao-Cramer. ´ Dato un modello statistico Y ) , in questa sezione

• Stima per intervallo, si definisce un intervallo di valori centrato sulla stima puntuale x e si associa a questo una probabilità (livello di confidenza, CL) che in esso

Cognome

Which one of the following best expresses the main conclusion of the above argumentA. Students must be helped to recognise the importance of good