• Non ci sono risultati.

P A RTE 1 Intro duzione all’inferenza

N/A
N/A
Protected

Academic year: 2021

Condividi "P A RTE 1 Intro duzione all’inferenza"

Copied!
24
0
0

Testo completo

(1)

Inferenza s tatistica c lassica

MariaPieraRogantin DIMA–Universit`adiGenova–rogantin@dima.unige.it BiostAT2014 Asti1-2luglio2014

P A RTE 1 Intro duzione all’inferenza

1 Introduzione Situazioniconcrete: singolorisultatoincerto–esitoalungotermineprevedibile. Perlostudiodiunfenomenochemanifestacasualit`a,`eneces- sarial’osservazioneripetutadellostessofenomenonelleidentiche condizioni. Identichecondizioni: ifattoricontrollabiliassumonolestessecaratteristiche; ifattorinoncontrollabilipossonoesseredifferentiegeneranola casualit`adelfenomeno. Leregolarit`aevidenziatedaifenomenicasualiripetutisonol’oggetto distudiodellateoriadellaprobabilit`a. 2

Laprobabilit`apermettediintrodurreunmodelloteoricodella variabilit`aperprevedereilcomportamentoincasinonesaminati. Raccoltadatiosimulazioneesperimentoesintesidelleinfor- mazioni(graficieindici) Valutazionedelleprobabilit`ainbaseallefrequenzeosservate. L’osservazioneparzialepu`oesserinsitanelproblemaconcreto: -limitazioniperproblemidicosti(tempoedenaro) -sondaggieelezioni -esperimentiinvasivi(industriali,farmaceutici) -previsionitemporali Finalit`a:costruzionediunmodelloprobabilistico -chepartadall’esperienza, -consistenteformalmente -capacedidescrivereifenomeni -capacedivalutareleinevitabiliapprossimazionicommessenel passaggiodalleinformazioniparzialideidatiosservatiaconside- razionisull’interapopolazioneosull’interofenomeno. 3

(2)

Fidarsidell’esperienzaeLeggedeigrandinumeri X1,X2,...,Xnvariabilialeatorieindipendenticonstessadistribuzione inparticolare:ugualemediaμeugualevarianzaσ2. Variabilealeatoriamediacampionaria: Xn=1 n

n i=1Xicon:mediadiXn=μvarianzadiXn=σ2 n Leggedeigrandinumeri Selanumerosit`antendeall’infinito,laprobabilit`acheXnassuma valorialdifuoridell’intervallo (μ−δ,μ+δ) tendea0,qualunquesialasemiampiezzaδdell’intervallo. Pi`uprecisamenteP |Xn−μ|>δ 0sen→∞ Utilizzo:tantepi`uprovesifanno,tantopi`ulavalutazionedella mediaμdiXfattasullabasedell’esperienzaavr`aunaprobabilti`a altadiesserevicinaaμstessa. 4

Campionamentoestima Comepassaredalleinformazionisuuncampioneaconsiderazioni suunapopolazioneosuunfenomeno, valutandointerminiprobabilisticiglierrorichesicommettono? Primoobiettivo:stimareiparametridivariabilialeatorieche modellanounfenomeno/caratteristicasull’interapopolazione. 5 ESEMPIO Sivuoleconoscereseillivellodelpiombonelsanguedegliabitanti diunazonasiaaldisottodiunacertasoglia. Siesegueiltestsolosualcuniabitantiesiusanoirisultatiper fareunaprevisionesututti. Nonsipu`oesseresicuridell’esattezzadellaprevisionemasipu`o giustificarlainsensoprobabilisticosescegliamogliabitantise- condocertemodalit`a. Comescegliereilcampione?Comestimarel’errore? Comedefinireunintervalloentroilqualesitrova,conuna certaprobabilit`a,illivellomediodipiombodell’interazona. Comesaperequantoilvaloremedioottenutodalcampione`e effettivamentevicinoalvaloremedioreale? 6

Popolazioniecampioni Esempidipopolazionisonol’insiemedituttigliabitantidiuna citt`aodiunaregione,l’insiemedeglistudentiiscrittiauncorso dilaurea,unprodottoalimentarevendutoinunadeterminata regionegeografica.

` E

importanteselezionareuncampioneinmodocorretto,cio`ein modochesia Rappresentativodellapopolazione(se,adesempio,sivuole studiareilprezzomediodiunprodottononsipu`oavereun campioneformatosolodasupermercati,senzapiccoline- gozi); Formatodaelementifradiloroindipendenti(Esempio.Va- riabile:pressionesanguigna.Popolazione:abitantidiuna regione.Campione:nosoloricoveratiinospedale). 7

(3)

Tecnichedicampionamento:molte Qui:campioniscelticasualmenteconprobabilit`auniformesull’intera popolazione. Schemadelprocedimentoquandolapopolazione`efinita Popolazionedinumerosit`aNecampionedinumerosit`an. Possiamoimmaginare(manonsempre`erealistico)chegliele- mentidellapopolazioneabbianounaetichettaechedaun’urna conNpallineconleetichetteseneestragganonconreintro- duzione. Ipotesidireintroduzione:nondeltuttoragionevole,magaran- tiscel’indipendenzaesemplificaicalcoli.SeN>>npocadif- ferenza. Errorecampionario:differenzafraivaloriottenutinelcampione eilcorrispondenteparametrodellavariabiledefinitasull’intera popolazione. Valutazionedell’erroresullabasediconsiderazioniprobabilistiche, utilizzandoleconoscenzesulladistribuzionedeglielementidel campione. 8

Esempidiparametrisucuifareinferenza media(ovaloreatteso)μdiunacaratteristicaquantitativa, adesempio: -raccoltomediodiunanuovaspecieibridadicereali -tempomediodifunzionamentodilampadine -duratamediaingiornidiunamalattia -quantit`amediadivitamineconservateinunprodottoin- dustriale -concentrazionemediadialgatossicanelmare frequenzarelativa(oproporzione)pdiunacaratteristicache assumeduepossibilivalori,adesempio: -frequenzadiovulazionediunovaiosottopostoacureper problemiall’endometrio -frequenzadiguarigioniinuntempoprefissatodaunadata malattia varianzaσ2diunacaratteristicaquantitativa,adesempio: -precisionenellaproduzionedipezziconfissatespecifiche Confrontofraparametri:differenzadimedieefrequenze,rap- portodivarianze 9 Stimapuntuale ConsideriamounavariabilealeatoriaXchemodellaunacaratte- risticadellapopolazionechesivuoleanalizzare. ESEMPIO.Stimadellamediadellapressionearteriosasistolica (mmHg)Xnellapopolazionediriferimento.Campionedi8in- dividui,lacuipressione`e: x1x2x3x4x5x6x7x8 126128133136126129131135 Sceltadellostimatore–duefraipossibili: -mediacampionaria:X=X1+X2+···+Xn n -valorecentraledell’intervallodeivaloriassuntinelcampione: T=max(X1+X2+···+Xn)+min(X1+X2+···+Xn) 2 Stime:x=130et=131. Qualestimatorescegliere? Lamedia`elostimatoremiglioreperch´ehabuonepropriet`a. 10

Qualisonoipossibilicampioniestraibilidaunapopolazione? Qualisonoivalorielecorrispondentiprobabilit`adellostimatore Xmediacampionaria? ESEMPIO Popolazionedi4individuiA,B,C,D.Campionidinumerosit`a2. Nellapratica,solouncampionesar`aestratto! Pressionearteriosasistolica(mmHg)diquesti4individui: ABCD 125129131133valoridiunavariabileX. Aciascunvaloreassegnamoprobabilit`a1 4. Abbiamol’interapopolazione:μ=125+129+131+133 4=129.5. 11

(4)

Otticadichivuolestimareμsenzaavereleinformazionisututta lapopolazionemasoloquellediuncampionedinumerosit`a2. Stimadellamediadellapopolazioneconlamediaempiricacal- colatasulcampione. Afiancotuttiicampionielecor- rispondentistimedellamediaper capire -qualisonoipossibilicampioni, -ipossibilivaloriperlostimatore, -lecorrispondentiprobabilit`a. Nellasituazionereale:unsolo campione.

campioneX1X2X AA125125125 AB125129127 AC125131128 AD125133129 BA129125127 BB129129129 BC129131130 BD129133131 CA131125128 CB131129130 CC131131131 CD131133132 DA133125129 DB133129131 DC133131132 DD133133133 12

PossibilivaloridellostimatoreXecorrispondentiprobabilit`a x125127128129130131132133 P(X=x)1/162/162/163/162/163/162/161/16 dovestalacasualit`a? perch´ediciamocheX`eunavariabilealeatoria? lacasualit`astanell’estrarreacasouncampioneenell’ottenere unodeipossibilivaloriconunadeterminataprobabilit`a Osservazione:connessuncampionesiottieneunastimadiμ ugualeallamediaeffettiva. MAstime”lontane”da129.5sonoper`oinnumerominoredelle stime”vicine”. 13 DistribuzionecampionariadiXesuovaloreatteso

125 126 127 128 129 130 131 132 133

0.06

0.08

0.10

0.12

0.14

0.16

0.18 PP E(X)=125+2×127+2×128+3×129+2×130+3×131+2×132+131 16=129.5 X`ecentratanelvaloredelparametrochevuolestimare. Propriet`agenerale–nondipendedaiparticolarivaloridell’esempio. 14

Propriet`adeglistimatori UnostimatoreTdiunparametroθ`e nondistortoocentratoseE(T)=θ. consistentese`enondistortoelasuavarianzatendeazero quandolanumerosit`adelcampionetendeall’infinito. Duestimatoridiθ 0246810 0.0 0.2 0.4 0.6 0.8 1.0

0246810

0.0 0.2 0.4 0.6 0.8 1.0

nonsemprelanondistorsione`e-dasola-unabuonapropriet`a 15

(5)

Alcunistimatori StimatoredelvaloreattesoμdiunavariabilealeatoriaX NellapopolazioneE(X)=μeV(X)=σ2 StimatoreXnconE(X)=μevarianzaV(X)=σ2 n X`estimatorediμnondistortoeconsistente Stimatoredellafrequenzapdiunavariabileavalori0e1 NellapopolazioneXvale1conprob.pe0conprob.1−p Stimatoredip:frequenza(relativa)disuccessinelcampione:

ˆ P

=1 n

n i=1Xi =Xn conE(ˆ P)=pV(ˆ P)=p(1−p) n 16

Variabilealeatoriamediacampionariastandardizzata: Zn=X−μ

vacon:mediadiZ=0=1rianzadiZnnσ √ n elentralelimitecdemarIlteo unavereada”tende”Zall’infinito,tenden`anumerositlaSen 1.rianzava0edediairmalenodistribuzionem ,ogniinalcolatacZdicumulatadistribuzionedifunzioneLan tendedis-difunzioneallapuntoall’infinito,tendenquando,t riaaleatoriabilevaNno,ctcalcolataNdicumulatatribuzionein tandardizzata.srmaleno difunzione,Xv.a.unalaistribuzionedlasiaqualunqueUtilizzo: quellaconrerossimappaopu`siXdicumulatadistribuzionedi leea)etXdirianzavaunamediatessascon(rmalenov.a.di .n`erandegi`upquantoremiglioantot`erossimazioneapp 17

P A RTE 2 Intervalli di confidenza

18

Intervallidiconfidenza intervallonelqualeciaspettiamostiailparametrodastimarecon unelevatogradodifiducia. ”fiducia”assegnatainterminiprobabilistici 1−αlivellodisignificativit`a(olivellodiconfidenza). (livelliusuali95%oil99%...manonsolo) 19

(6)

Intervallidiconfidenzaperlamediaμ Tramiteuncampionedinumerosit`an: •Stimapuntualediμ:x (valoreassuntodallostimatoreXnelcampione •Intervallodiconfidenzaperμ alivellodisignificativit`adi1−α:  X−δ,X+δ conδtalecheP X−δ<μ<X+δ =1−α Laprobabilit`adisbagliare`eα(tipicamente5%,1%–bassa)

` E

unintervalloaleatorio(cercheremodicapiredopo) Larealizzazionecampionaria`e: (x−δ,x+δ) 20

Comesicalcolaδ? checosavuoldireche`eunintervalloaleatorio?

` E

necessarioconoscereladistribuzionediprobabilit`adiX ...manonbasta. -osiconosceladistribuzionedellav.a.Xchemodellailfenomeno; -osiusailteoremadellimitecentrale SeXhadistribuzionenormaleX∼N(μ,σ)allora X∼N μ,

σ √ n

 ovveroZ=X−μ

∼N(0,1)σ √ n 21  μδ+X<Xδ<−P=.950  μδ+=X<δ<−μP )σ(μ,∼NXCASO conσ=2noto n=9

0.0 0.1 0.2 0.3 0.4 0.5

0.6 0.5 0.4 0.3 0.2 0.1 0.0

0.6

μ−δμμ+δ X∼N μ,

2 √ 9

 22

1α=P μδ<X<μ+δ =P μδμ

Xμ <σ √ n

μ+δμ <σ √ n

σ √ n

 =P δ σ √ n<Z<δ σ √ n δ σ √ n=z1−α/2δ=z1−α/2

σ √ n

0.0 0.1 0.2 0.3 0.4 0.5

0.6 0.5 0.4 0.3 0.2 0.1 0.0

0.6

μ−δμμ+δ

0.0 0.1 0.2 0.3 0.4 0.5

0.6 0.5 0.4 0.3 0.2 0.1 0.0

0.6

1.9601.96 Z∼N(0,1)X∼N(μ,σ/ n) Int.diconfidenzaperμ: X−z1−α/2

σ √,X+z1−α/2 n

σ √ n

 Notazione:za,taquantilea-esimo,comeusatoneisoftware,adesempioinR 23

(7)

Realizzazionedell’intervallodiconfidenzaperμnelcampi- one:  x−z1−α/2

σ √,x+z1−α/2 n

σ √ n

 Nonsappiamoseμnellapopolazioneappartengaonoeffetti- vamenteaquestointervallo,icuilimitisonocalcolatiusandoil valorecampionariox. Conun’altrastimapuntualeperlamedia,provenientedaun altrocampione,avremmoavutoancheundiversointervallodi confidenza. Fratuttiipossibiliintervallidiconfidenzacostruitiinquesto modosullabasedituttiipossibilicampioni,il95%contiene lamediadiXnellapopolazioneeil5%nonlacontiene 24

Simulazioneper50campioni -numerosit`an=80 -varianzaσ2=4 -livellodisignifcativit`a 1−α=95%  x−1.962 80,x+1.962 80

 μ 4campioninoncontengonolamediavera,l’8% 25 CASOX∼N(μ,σ)conσsconosciuto SistimalavarianzaconS2=1 n1 n i=1 Xi−X2 esiconsideralavariabiletdiStudent  X−t1−α/2

S √,S+t1−α/2 n

S √ n

 Stessasimulazioneprece- dentemaσ`estimato  x−1.96s 80,x+1.96s 80

 μ 26

CASOXcondistribuzionequalsiasi Sicalcolaesplicitamenteladistribuzionedellostimatore Siutilizzal’approssimazionenormalegarantitadalTeorema delLimiteCentraleselanumerosit`adelcampione`e “grande” 27

(8)

` E

megliounlivellodisignificativit`adel95%odel99%? Livellodel99%: probabilit`adierrorepi`upiccola ampiezzadell’intervallopi`ugrande z0.950=1.64z0.975=1.96z0.995=2.58 0.95 0.990.90 Quellochesiguadagnainprecisionesiperdeinampiezza Nell’esempioprecedenteconσ=2en=80,sex=2.5: -al90%sihaδ=0.37I.d.c.(1.92,3.08) -al95%sihaδ=0.44I.d.c.(2.06,2.94) -al99%sihaδ=0.58I.d.c.(2.13,2.87) 28

Esempio:pressionesanguignasupopolazionedi4individui DistribuzionecampionariadiX

125 126 127 128 129 130 131 132 133

0.06

0.08

0.10

0.12

0.14

0.16

0.18 PP

Fissatoα=15% (idatisonopochi,bisognaaumentareα) sitrovaδ=2.6. Infatti P μδ<X<μ+δ >85% P 129.52.6<X<129.5+2.6 = P 126.9<X<132.1 =14/16=0.87% x125127128129130131132133 P(X=x)1/162/162/163/162/163/162/161/16 29 Qualipossibiliintervallidiconfidenzaeconqualeprobablit`a? xintervallodiconfidenzaprobabilit`adiottenerlocontieneμ 125(122.4,127.6)1/16NO 127(124.4,129.6)2/16 128(125.4,130.6)2/16 129(126.4,131.6)3/16 130(127.4,132.6)2/16 131(128.4,133.6)3/16 132(129.4,134.6)1/16 133(130.4,135.6)1/16NO NOTA:ancheinquestocasonellapraticahoUNsolointervallo diconfidenzaperch´ehoUnsolocampione 30

Altrimodelli •X∼N(μ,σ),σsconosciuto,i.d.c.perμ •X∼N(μ,σ),μnotoosconosciuto,i.d.c.perσ2 •X∼Bernoulli(p)approssimato,i.d.c.perp •Xconleggequalsiasi,conngrande,i.d.c.perμ •X∼Poisson(λ),X∼Exp(λ),X∼Bernoulli(p)...sipossono farecalcoliespliciti 31

(9)

I.d.c.approssimatiperlafrequenzarelativap diunacaratteristicaqualitativadicotomica Stimiamopcon ˆ P,calcolatosuuncampionedinumerosit`an:

ˆ P

=X1+X2+···+Xn n

ˆ P

`eunamediacampionariadiv.a.X1,X2,...,Xnchevalgono1conproba- bilit`apoppure0conprobabilit`a1pecon E(Xi)=peV(Xi)=p(1p) Distribuzionedi ˆ P?Slimiteeldremateoilutilizzasilevatoe`ene centrale.Approssimativamente:

ˆ P∼N

⎛ ⎝p, p(1−p) n

⎞ ⎠ V(ˆ P)sconosciuta;pu`oesserestimatatramite

ˆ P

da:S2 ˆ P

=

ˆ P(1

ˆ P) n1 r:α−livelloa,p1edRealizzazionepriacampionaiuni.d.c ⎛ )ˆp−(1ˆpˆpˆp(1) ⎝ˆpz+z−,ˆp1−α/22α/1− 1−nn−1

⎞ ⎠oppuret1−α/2 32

Esempio Intervallodiconfidenzaalivellodisignificativit`adel95%perla frequenza(relativa)diovulazionediunovaiosottopostoacure perproblemiall’endometrio. Inuncampionedi190donnesitrovache89hannoavutol’ovulazione dallatosottopostoacure: ˆp=89/190=46.8% Realizzazionecampionariadiuni.d.cperlafrequenzanellapopo- lazione`e:  0.4681.96 0.468·(10.468) 189,0.468+1.96 0.468·(10.468) 189

 = (0.397,0.540) 33

P A RTE 3 T e st P a rametrici

34

Introduzioneallaverificadiipotesisuparametri Atteggiamentodiversodallastimadeiparametrimamodello probabilisticosimile Esempidisituazioniriconducibiliaverificadiipotesisuparametri. -ilraccoltodiunanuovaspecieibridadigrano`esuperioreaquellodiuna speciecomune? -unnuovotipodilampadinehaunaduratadifunzionamentomaggioredi quelletradizionali? -unnuovoprodottofarmaceuticoriduceilnumerodigiornidimalattia rispettoaunotradizionale? -unmetododiconservazionedeicibi`emigliorediunaltrorelativamente allaconservazionedellevitamine? -unmacchinariocontinuaaprodurrepezzirispettandocertespecifiche? -laconcentrazionedialgatossicanelmare`etaledadestarepreoccu- pazione? -l’ovaiosottopostoacureperproblemiall’endometrio,continuaadovulare comel’altro? 35

(10)

Esempio Farmacochedovrebberidurreuncertotipodieczema. Ricercheprecedentihannomostratoil40%deitopidiunacerta specieaffettidall’eczemasonoliberidasintomiin4settimane. Riteniamoilfarmacoefficacesepi`udel40%deitopisonosenza sintomiin4settimane. Duepopolazioni: -laprimatopinontrattati(il40%guariscein4settimane) -lasecondaditopidicuiauncampione`esomministratoil farmaco. Numerosit`andelcampionedellasecondapopolazione pfrequenzarelativaditopisenzasintomi Formuliamol’ipotesicheilfarmacononabbiaeffettop=0.40 (sembranonnaturale...). Peraffermarecheilfarmaco`eefficacedobbiamorifiutarel’ipotesi. 36

Formulazionedelleipotesi Dueipotesi: H0ipotesiprincipaleoipotesinulla H1ipotesialternativa Atteggiamento:sirimaneconvintidellaconoscenza/supposizione dipartenza(l’ipotesiprincipale)amenochenonsiabbianoforti evidenzesperimentalipernegarla Esempi: -farmacoH0:p=0.4eH1:p>0.4 -lampadineH0:μ=1400eH1:μ=1400 -macchinarioH0:σ2≥σ2 0eH1:σ2 2 0

Ipotesisempliceocomposta: -H0:p=0.4semplice-H0:σ2≥σ2 0composta 37 Ilmodellostatistico LastatisticatestT:funzionedelleosservazionicampionarie (pu`oessereunostimatore)dicui`enotaladistribuzionequando siaconosciutoilvaloredelparametro. Iltest`eunaregoladidecisione Sisuddividelospaziodeipossibilivaloriassuntidallastatistica testindueregionidisgiunte,A0eR0,esiaccettaosirifiuta l’ipotesiprincipaleasecondacheilvaloreottenutonelcampione appartengaallaprimaoallaseconda. Illivellodeltest Atteggiamento:sirimaneconvintidellaconoscenza/supposizione dipartenza(l’ipotesiprincipale)amenochenonsiabbianoforti evidenzesperimentalipernegarla Livellodeltestα:probabilit`adell’errorechesicommetterifiu- tandol’ipotesiprincipalequandoquesta`evera 38

Laregionedirifiutodell’ipotesiprincipaleH0:θ=θ0 P(T∈R0|H0vera)=α

0.0 0.2

0.4 0.2 0.0

0.4 0.2 0.0

0.4

c1θc2

0.0 0.2

0.4 0.2 0.0

0.4

c1θ

0.0 0.2

0.4 0.2 0.0

0.4 θc2 0.00

0.10

0.20 0.10 0.00

0.20 0.10 0.00

0.20

c1c2

0.00 0.10

0.20 0.10 0.00

0.20

c1

0.00 0.10

0.20 0.10 0.00

0.20

c2

H1:θ=θ0 Testbilaterale R0=(−∞,c1)(c2,∞) H1:θ<θ0 Testunilateralesinistro R0=(−∞,c1) H1:θ>θ0 Testunilateraledestro R0=(c2,∞) 39

(11)

Esempio:Xmodellalaconcentrazionedialgatossica Assumiamo(attenzione!):X∼N(μ,σ)eσnoto quindiX∼N μ,

σ √ n

 Livellodiallertaseμ>10000cellule/litro H0:μ≥10000H1:μ<10000 Poniamo:α=5%.SesirifiutaH0sipu`ofareilbagnocon probabilit`adiconseguenzedel5%. Campionedinumerosit`a10. Costruzionedeltestintrepassi: 1.H0:μ=10000H1:μ=8500 2.H0:μ=10000H1:μ<10000 3.H0:μ≥10000H1:μ<10000 10000 40

SisupponeH0vera:X∼N(10000,2100/√ 10) R0=(−∞,x0.05)talecheα=0.05=P x0.05<X|μ=10000 conR:x0.05=8908 mu0=10000;std=2100/sqrt(10) c1=qnorm(.05,mu0,std);c1 Sesihaunvaloresperimentaleminore di8908sirifiutaH0conprobabilit`adi averpresoladecisionesbagliatadel5% Esesitrovaunvaloresperimentale maggioredi8908? SeH1:μ=8500 β=P x0.05<X|μ=8500 conR:β=27% mu1=8500;1-pnorm(c1,mu1,std) siaccettaH0conprobabilit`adiaver presoladecisionesbagliatadel27%

100008500 H accettata - H rifiutataH accettata - H rifiutata0101 100008500 H accettata - H rifiutataH accettata - H rifiutata0101 41 Errorediprimaspecieeerroredisecondaspecie DECISIONEPROBABILIT

` A

H0accettataH0rifiutataH0accettataH0rifiutata H1rifiutataH1accettataH1rifiutataH1accettata H0vera correttasbagliata1αα H1falsa H0falsa sbagliatacorrettaβ1β H1vera α=Prob(rifiutareH0|H0vera)=Prob.errorediprimaspecie β=Prob(rifiutareH1|H1vera)=Prob.erroredisecondaspecie Propriet`adiunbuontest: laprobabilit`adiprendereladecisionesbagliata`einferiorealla probabilit`adiprendereladecisionegiusta: α<1−βoppureβ<1−α⇒α+β<1 42

Caso H0:μ=10000H1:μ<10000 R0noncambia (`ecalcolata“sotto”H0) Cambialaprobabilit`adell’erroredi secondaspecieβ. Diventaunafunzionediμ110000 H accettata - H rifiutataH accettata - H rifiutata0101 Caso H0:μ≥10000H1:μ<10000 MantenendolastessaR0 laprobabilit`adell’errorediprima speciediventa Laprobabilit`adell’errorediseconda specieβ`elastessadelcasoprece- dente.

10000 H accettata - H rifiutataH accettata - H rifiutata0101 43

(12)

Ilp-value–Unaltromodoperdecidere probabilit`asottoH0diottenereunvalorecampionario“pi`ulon- tano”daH0e“pi`uvicino”aH1diquelloottenuto,x oppure livellodeltestselasogliadiR0fossex H0:μ=μ0nell’esempio:μ0=10000x=9000 H1:μ<μ0 H1:μ>μ0 H1:μ=μ0

100009000 100009000 10000110009000

p(9000)=0.066 pnorm(9000,mu0,std) p(9000)=0.934 1-pnorm(9000,mu0,std) p(9000)=0.132 2*pnorm(9000,mu0,std) Ilp-valuevaconfrontatoconα.Sep<αsirifiutaH0. 44

LapotenzadiuntestP(θ)

` E

laprobabilit`adiaccettarel’ipotesialternativaH1alvariare delparametroθ0insiemeacuiappartieneθquandoH0`evera -Θ1insiemeacuiappartieneθquandoH1`evera -Seθ∈Θ1,P(θ)probabilit`adisceltacorretta:P(θ)=1−β(θ) -Seθ∈Θ0,P(θ)probabilit`adisceltasbagliata:P(θ)≤α(θ) Esempioalgatossica H0:μ≥10000 H1:μ<10000 Θ0=(10000,+) Θ1=(−∞,10000) P(μ)=P X<x0.05|μ∈R 01 α 1000085001-(8500)

45 Potenzaenumerosit`acampionaria Laprobabilit`adiaccettareH1,quando`evera,aumenta all’aumentaredellanumerosit`acampionaria. SeivaloridelparametrosottoH1esottoH0sonomoltovicini, solocongrandicampionisiriesceadavereunaprobabilit`aalta dieffettuarelasceltacorretta. Potenzadeltest H0:μ≥10000 H1:μ<10000 n=10rosso n=20blu 01 α 10000

0

1 α 10000 46

Lapotenzapertestunilateraliebilaterali Unilaterale: P(μ)=P X<x0.05|μ∈R Bilaterale: P(μ)=P X<x0.025|μ∈R +P X>x0.975|μ∈R rosso–unilaterale H0:μ≥10000 H1:μ<10000 blu–bilaterale H0:μ=10000 H1:μ=10000 01 α 10000 mu=seq(7000,13000);c1_u=qnorm(.05,mu0,std);p=pnorm(c1_u,mu,std) c1_b=qnorm(.025,mu0,std);c2_b=qnorm(.975,mu0,std) p_b=pnorm(c1_b,mu,std)+1-pnorm(c2_b,mu,std) 47

(13)

Numerosit`acampionarianfissatiαeβ H0:μ=μ0H1:μ=μ1conμ10⇒R0=(−∞,s) α=P X<s|μ=μ0 =P Xμ0 σ/ n<sμ0 σ/ n =P Xμ0 σ/ n<zα β=P X>s|μ=μ1 =P Xμ1 σ/ n>sμ1 σ/ n =P Xμ1 σ/ n>z1−β Das−μ0 σ/ n=zαes−μ1 σ/ n=z1−β=−zβsiottiene: n=

 zα+zβ2 σ2 0−μ1)2 Valeanchenelcasoμ10. ndeveesseretantomaggiorequantopi`u: -`eminoreladistanzafraivaloriattesisottoledueipotesi; -`emaggiorelavarianza; -sonominoriidueerrori(equindizαezβmaggiori) 48

Confrontofraintervallidiconfidenzaetest I.d.calivello1−α.Testalivelloα X∼N(μ,σ),σnotoParametrodiinteresseμ Bilaterale: δB=z1−α/2 σ √ n centratoxin,`econfidenzadiL’intervallo A`ecentratoinμ.00

 ( ) ( )( ) x

A

x

B

0 TestUnilateralesinistroeI.d.c.destro: δU=z1−α

σ √ n s)+,μ∞:(μerpinistroδI.d.c.−Aμ=(δ,∞)0U00U onfrontal’i.d.concrepu`cosiunilateraletestIl bilateralealivello12α

x

A

 ( )

0

) (

Osservazioni:a)δUB(idisegnisopranonsonoinscala) b)δ`eugualeperi.d.c.etest(noncosperinferenzasuparametrop) 49 Testmultipliecorrezionipermolteplicit`a Inmoltesituazionisperimentali,suglistessidati,sieffettuanopi`u testconipotesiprincipali H(1) 0,H(2) 0,...,H(K) 0 1−α=Prob(accettareH(i) 0|H(i) 0vera).Poniamoα=0.05 K=2 Probabilit`adiaccettareentrambeleipotesi(seindipendenti)quandovere: (1α)2=0.952=0.90 Probabilit`adirifiutarealmenounadelledueipotesiquandovere: 1(1α)2=10.952=0.10 K=20 Probabilit`adiaccettaretuttele20ipotesiquandovere: (1α)20=0.9520=0.36 Probabilit`adirifiutarealmenounadelle20ipotesiquandovere: 1(1α)20=10.9520=0.64 α 50

CorrezionediBonferroni

` E

unapossibile.Variealtresonostatesviluppate. Illivellodisignificativit`adiciascunodeiKsiponeaα/K Neicasiprecedenti: K=2.Probabilit`adirifiutarealmenounadelledueipotesiquandovere: 1(1(0.05/2))2=0.0493 K=20.Probabilit`adirifiutarealmenounadelle20ipotesiquandovere: 1(1(0.05/20))20=0.0488 Diconseguenzailp-valueottenutosuunsingolotestvienemolti- plicatoperKperessereconfrontatoconα. 51

(14)

Altrimodelli suuncampione X∼N(μ,σ),σsconosciuto,testperμ X∼N(μ,σ),μnotoosconosciuto,testperσ2 X∼Bernoulli(p)approssimato,testperp Xconleggequalsiasi,conngrande X∼Poisson(λ),X∼Exp(λ),X∼Bernoulli(p)...sipos- sonofarecalcoliesatti suduecampioni X1∼N(μ11)eX2∼N(μ22): testperμ1−μ2 ·suduediversepopolazioni ·sullastessapopolazione testperσ2 1 2 2

X1Bernoulli(p1)eX2Bernoulli(p2),testperp1−p2 Poisson,Esponenziale,Gamma,... 52

Testperlafrequenzarelativap Esempio:eczemaneitopi(continua) Dopo4settimane:H0:p≥0.40eH1:p>0.40 Inuncampionedi25topitrattaticonilnuovofarmaco:ˆp=0.45 SupponiamoH0vera.Fissiamoα=5%.Approssimativamente

 0.400.60 ˆ P∼N0.40, 25

 RegionedirifiutodiH0:p-valuedi0.48: (p0.95,1)=(0.56,1) conp0.95quantile95-simodi unaN(0.40,0.098) conR:conR: >qnorm(0.95,0.40,sqrt(0.4*0.6/25))>1-pnorm(0.48,0.40,sqrt(0.4*0.6/25)) [1]0.5611621[1]0.2071081 Nonc’`eevidenzasperimentaleperrifiutareH0 53 Testperl’uguaglianzadellemediediduev.a.Normali Esempio:XFeXSmodellanolariduzionedelcolesterolonel sangue,conunnuovofarmacoeconunfarmacostandard. XF∼N(μFF)XS∼N(μSS) Sivuoleverificare:H0:μF=μSeH1:μFSovvero H0:μF−μS=0eH1:μF−μS<0 nFenSnumerosit`adeiduecampioniindipendentidiXFeXS. XF∼N μFF nF XS∼N μSS nS Consideriamo XF−XS∼N

⎛ ⎜ ⎝μF−μS,   σ2 F nF+σ2 S nS

⎞ ⎟ ⎠

Testsullamediadiunav.a.condistribuzionenormale. 54

1.Levarianzeσ2 Feσ2 Ssononote Fissatoαsieffettuailtestnelmodousuale. 2.Levarianzeσ2 Feσ2 Ssonosconosciute StimateconglistimatorinondistortiS2 FeS2 S Sisupponeσ2 S=2 Fconknoto. UnostimatorenondistortodiV XFXS `e: S2=k(nF1)S2 F+(nS1)S2 S k(nF+nS2)·knF+nS nFnS Inoltre  XFXS FμS) Stdcond=nF+nS2 Inparticolareseσ2 S=σ2 FenF=nS=n, S2= S2 F+S2 S /ned=2n2 Fissatoαsieffettuailtestnelmodousuale. 55

(15)

Confrontotraduetrattamenti(MauroGasparini) IlconfrontofraunnuovotrattamentoTeuntrattamentostan- dardSsibasisuunparametroθ(misurateoricadiconfrontoda stimare) Peresempio:θ=πT−πS πTeπS:prob.dimalattiasottoiltrattamentoesottolostandard Altroesempio:θ=μS−μT μTeμS:quantit`amediediunanticorpo(favorevole)sottoTe sottoS(pi`ugrande`emeglio`e) Pi`upiccolo`eθ,pi`uTrisultamigliorediS. - θ0 valoreneutroTmiglioreSmigliore ˆ Θ

stimatorediθ Supponiamopersemplicit`a

ˆ Θ∼N(θ,σ)conσnotoˆ Θˆ Θ 56

1.Testdisuperiorit`a Unaprovaclinicadisuperiorit`a`espessoformulatacometestper leipotesi

⎧ ⎨0effetti)egli(eguaglianzad=θ:H0 ⎩ritrattamento)el`atriodeus0(θ<:Hp1 sinistrolivelloaαunilateraleeTst σA)=(z,∞α1−0ˆ Θ SirifiutaHse0

ˆ θappartieneaA.non0 θα21livellodirepilateralebconfidenzadiIntervallo  ˆ θˆ θ,σz+−zσα21−2α1−ˆ Θˆ Θ SirifiutaHsenoncontienelo00

( )

0 ) (



^

57 2.Noninferiorit`aedequivalenza SupponiamochenonsirichiedacheTsiasuperioreaS,masolo chesiaequivalente. Inproveclinichecisonoduecasiimportanti: dimostrarecheunfarmacocompletamentenuovod`arisul- tatinonpeggioridiunaterapiastandard.Seilfarmaco nuovofosse,peresempio,menotossicodellostandard,al- lorasarebbeutiledimostrarnelanoninferiorit`arispettoallo standard; dimostrarecheunanuovaformulazionediunfarmacofor- niscealcorpoumanolastessaquantit`adisostanzaattiva diunaformulazionestandard.Taledimostrazionediequa biodisponibilit`apu`oindurreleautorit`asanitarie,sottocerte condizioni,adautorizzarel’usodiunfarmacogenerico(o equivalente)insostituzionediunfarmacobrevettato. 58

3.Noninferiorit`acometestecomeintervallodiconfidenza Concentriamociprimasullanoninferiorit`a:occorrestabilireun marginediequivalenzaΔtaleche,seθ<Δ,alloraTeSsono equivalenti,osimili.

⎧ ⎨eellod`atrioriprd)usΔ(≥θ:Hstanda0Hrit.trattamento)el`adinferionon(Δθ<:1 0.>ΔconΔcon0maconi`uponfrontacisNonθ oeguente:sla`ertunaioppecisioneddregolaLa l’intervalloconfi-didichiasel’equivalenzaraSi contenutointeramente`eα21livelloiddenza nell’intervallodiequivalenza(−∞,Δ)

0 ) (



^

Ilproblemadellaequivalenza`eformulatointerminiditestdi ipotesi,ma`erisoltocontecnichedistima.Pensareinterminidi stimachiarisceilfinedelproblemaedaiutaaformularecorretta- mentel’ipotesichesivuoledimostrare. 59

(16)

Sceltadelmarginediequivalenza LasceltadelmarginediequivalenzaΔ`ecruciale. Inuncontestodiprovecliniche,peresempio,conunacatena diprovediequivalenza(suunaseriedigenerici,peresempio), senonsiprestaattenzionesipu`oarrivareadapprovarecome genericitrattamentiinefficienti (vedilecritichediGarattinisuhttp://www.ricercaepratica.it/) Ilmarginediequivalenzadeveessereconfrontatoconunanalogo marginerelativoalconfrontoconilplacebo. D’altraparte,ilplacebonon`esempreetico... 60

Problemaunilateraleobilaterale? Sarebbesufficientesolounintervallodiconfidenzaunilateraledi livello1−α; maunintervallobilateraledilivello12αconferisceinformazioni supplementaridipossibileinteresse,comel’inclusioneomenodi unimportantevalorealternativodiinteresse,peresempioθ=0, nell’intervallodiconfidenza. Inoltreperaltriproblemi,peresempioperlaequabiodisponibilit`a, occorronosiaunlimitesuperioreΔcheunlimiteinferioreΓ. Laregoladidecisionerimanelastessa: Sidichiaral’equivalenzasel’intervallodiconfidenzadilivello 12α`einteramentecontenutonell’intervallodiequivalenza,Δ). 61

P A RTE 4 Inferenza n el mo dello linea r e

62

Introduzionealmodellolineare yex1,...,xp−1rilevazioniquantitativesununit`asperimentali. Esempio:consumodiossigenoinatleti ossigenoetapesotempop_fermp_medp_max 44.6094489.4711.3762178182 45.3134075.0710.0762185185 54.2974485.848.6545156168 59.5714268.158.1740166172 49.8743889.029.2255178180 ... Sivuoleesprimereycomecombinazionelinearedix1,...,xp−1 pi`uunresiduo. Yvariabilerispostax1,...,xp−1variabiliesplicative yi=β0+β1xi1+β2xi2+···+βp−1xip−1+εi =xt iβ+εi peri=1,...,n 63

(17)

Esempio: regressionelinearesemplice y=β0+β1x+ε b0+b1xi(cheappartieneallaretta) `elamiglioreapprossimazionelineare diyitramitexi.

(x , y )ii

(x , β x + )ii12(xi)xi1bb0+, (),yixi 0102030

40

50

60 203040

x

y Minimizzazionedell’errorediapprossimazione Sitrovanoqueivalorideiparametricherendonominimasomma deiquadratideiresiduidiogniunit`asperimentale: εi=yixt iβperi=1,...,n 64

Laregressionelinearesuuncampione yrealizzazionicampionariediunav.a. Sipossono calcolareintervallidiconfidenza effettuaretest suiparametriβperstabilireselevariabiliesplicativedelmodello sonotutteutiliperl’approssimazionedellavariabilerisposta 65 Condizionisumediaevarianzadeiresidui VariabilerispostaconleggeNormale εeffettodicausenonidentificate,perturbazionealeatoria;allora Yvettorealeatoriodicuisiosservanoalcunerealizzazioniy. Supponiamo εi∼N(0)σcostanteecov(εij)=0 QuindiYi∼N xt iβ ecov(Yi,Yj)=0 dovext iβ=β0+β1xi1+β2xi2+···βp−1xip1 IlvettoreYnon`equindiuncampionediunastessavariabile aleatoriainquantoivaloriattesidiciascunaYisonodiversi. Nonsipu`overificarel’ipotesidinormalit`asullerealizzazionidiY. Levariabilix1,...,xp−1sonoconsideratedeterministiche. 66

StimatorideicoefficientidelmodelloB Esempio:Altezzadeipioppiindipendenzadeldiametro Residuals: Min1QMedian3QMax -27.8027-5.5330-0.48825.862617.4961 Coefficients: EstimateStd.ErrortvaluePr(>|t|) (Intercept)14.01721.394710.05<2e-16*** Diametro12.78640.268647.61<2e-16*** --- Signif.codes:0‘***’0.001‘**’0.01‘*’0.05‘.’0.11 Residualstandarderror:7.836on292degreesoffreedom MultipleR-squared:0.8859,AdjustedR-squared:0.8855 F-statistic:2267on1and292DF,p-value:<2.2e-16 Coefficients: -colonnaEstimate:stimebkdeiparametriβk -colonnaStd.Error:stimedelledeviazionestandarddeglistimatoriBk 67

Riferimenti

Documenti correlati

[r]

5.. Disegnando il triangolo si deduce che il minimo viene assunto sulla cf che passa per A e il massimo su quella che passa per C.

[r]

[r]

• Ci dicono che un certo treno percorre una certa tratta in 45 minuti in media, con deviazione pari a 2 minuti (che non mettiamo in dubbio).. A priori `e chiaro che il vero tempo

Indichiamo con N il numero di litri d’acqua venduti da un supermercato in un giorno, numero aleatorio, di solito molto elevato. Ignorando approssimativamente per semplicit`a il

La direzione della banca vuole conoscere il numero medio di correntisti che si presenta nell’arco di una giornata, e la probabilit`a che si presentino pi`u di k correntisti, al

Come ci si aspetta questa volta la funzione non è un insieme di punti, bensì una curva continua che associa ad ogni possibile misura del lancio un valore che