• Non ci sono risultati.

Tecniche descrittive

N/A
N/A
Protected

Academic year: 2021

Condividi "Tecniche descrittive"

Copied!
43
0
0

Testo completo

(1)

Tecniche descrittive

• Utilizzano modelli matematici per semplificare le relazioni fra le

variabili in studio

• Il fine è la descrizione semplificata del fenomeno attraverso il modello

(2)

Tecniche descrittive

• Metodo: il modello è creato ad hoc sui dati sperimentali

• Diversi livelli di complessità del modello a seconda del fenomeno in studio

• Esempi: distribuzioni di probabilità,

analisi fattoriale, analisi discriminante, cluster analysis

(3)

Tecniche descrittive

Applicazioni:

• Indagini esplorative sui dati

sperimentali per la successiva formulazione di idee

(4)

Analisi Discriminante

Fine: suddividere il campione in gruppi

Metodo

1. Fase di addestramento 2. Fase di analisi

(5)

Analisi Discriminante Analisi Discriminante

Assunti:

• I fattori predittivi devono avere distribuzione gaussiana

• I fattori devono essere scarsamente correlati fra loro

• Le correlazioni devono essere costanti all’interno dei gruppi

• Le medie e deviazioni standard dei fattori

(6)

Analisi Discriminante Analisi Discriminante

La fase di addestramento utilizza un campione di soggetti, di cui si conosce l’appartenenza a uno dei gruppi considerati, per calcolare i parametri necessari alla

classificazione di un nuovo soggetto

(7)

Analisi Discriminante Analisi Discriminante

I valori prodotti dalla funzione

discriminante hanno media = zero, varianza = 1 e garantiscano la

massima differenza possibile fra le medie di gruppo

(8)

Analisi Discriminante Analisi Discriminante

La fase di analisi applica i parametri

calcolati per la classificazione di nuovi soggetti in una delle classi possibili

La classificazione si basa sul calcolo di una funzione in grado di fornire un valore soglia opportunamente

determinato che discrimini i gruppi

(9)

Analisi Discriminante Analisi Discriminante

Funzione ottenuta come combinazione lineare dei parametri misurati, cioè come somma dei parametri moltiplicati per opportuni coefficienti dik= b0k+bjkxi1+…bpkxip

dik è il valore della k funzione discriminante relativa al soggetto i

bjk è il valore del coefficiente j per la funzione k

(10)

Analisi Discriminante Analisi Discriminante

Parametri determinati in modo che:

1. i valori prodotti dalla funzione

discriminante abbiano media zero, varianza unitaria

2. garantiscano la massima differenza possibile fra le medie di gruppo

(11)

Analisi Discriminante Analisi Discriminante

Per ogni soggetto viene calcolata la probabilità di appartenere a

ciascun gruppo e si procede

all’assegnazione del soggetto al gruppo per cui è maggiore la

probabilità di appartenenza

(12)

Analisi Discriminante Analisi Discriminante

2 gruppi: la soglia che divide i due

gruppi è situata nel punto di mezzo delle due medie di gruppo

Più di 2 gruppi: le funzioni utilizzate sono tante quante il numero dei gruppi meno uno (non è possibile usare una sola

soglia ma occorre calcolare la probabilità di appartenenza del soggetto al gruppo)

(13)

Analisi Discriminante Analisi Discriminante

• Al termine della fase di apprendimento è possibile riassegnare i soggetti ai

gruppi di appartenenza utilizzando le funzioni discriminanti calcolate

• Questa operazione permette di valutare l’efficienza del sistema di classificazione

(14)

Analisi Discriminante Analisi Discriminante

Successo dipende:

• dall’efficienza con cui abbiamo

creato le funzioni di classificazione

• dalle ipotesi che abbiamo formulato

• dai parametri che abbiamo

conseguentemente considerato

(15)

Analisi Discriminante Analisi Discriminante

Utilizzo:

• Sistema di classificazione in grado di classificare ogni nuovo soggetto senza conoscere realmente a quale gruppo appartiene

• Individuare quali fattori incidono

maggiormente nella discriminazione fra

(16)

Cluster Analysis

Scopo: individuare la miglior

suddivisione in gruppi del campione in esame

Cluster: addensamento attorno a un valore centrale in uno spazio a n dimensioni

(17)

Cluster Analysis

Assunti:

• Variabili che determinano la suddivisione possono essere a

distribuzione gaussiana o categoriche

• Individua i gruppi in modo che siano

massimamente omogenei al loro interno e eterogenei fra loro

(18)

Cluster Analysis

La funzione dell’analisi dei cluster è quella di classificare i casi in un certo numero di gruppi senza che venga richiesta una preliminare identificazione dei gruppi.

Questi gruppi possono essere utilizzati in ulteriori analisi statistiche per la verifica di ipotesi riguardanti nuove variabili non utilizzate nella classificazione

(19)

Cluster Analysis

Analisi Cluster gerarchica: generano

suddivisioni gerarchicamente ordinate (n-1 possibili cluster)

Analisi Cluster non gerarchica: generano un’unica suddivisione (numero

prefissato di gruppi); riservati a dati quantitativi, basati sulle distanze

(20)

Cluster Analysis

Analisi Cluster gerarchica

1. Identificazione delle variabili 2. Selezione del tipo di distanza 3. Selezione di una tecnica di

raggruppamento

4. Identificazione del numero dei gruppi

5. Valutazione e interpretazione della soluzione

(21)

Cluster Analysis

• Si parte da un algoritmo che

inizialmente prevede tanti gruppi quanti sono i casi e in seguito unisce i gruppi tra loro a due a due fino ad ottenere un unico cluster.

• Le misure delle distanze sono generate dalla matrice di prossimità

• A seconda del tipo di scala si sceglie il

(22)

Cluster Analysis

• Quanti gruppi scegliere rimane un problema!

– dai coefficienti di agglomerazione, si sceglie il livello precedente al livello con

coefficiente più alto

– Dal dendrogramma che delinea le relazioni, si sceglie la soluzione che prevede una

certa similarità degli elementi del cluster e che sia parsimoniosa

(23)

Cluster Analysis

• Valutazione e interpretazione dei risultati

– Statistica descrittiva

• Relativa alle variabili di partenza

• Relativa ai cluster e ai punteggi prodotti dai cluster

– Statistica inferenziale

(24)

Cluster Analysis

Analisi Cluster non gerarchica (k- medie)

1. Identificazione delle variabili*

2. Identificazione del numero dei gruppi

3. Identificazione dei semi della ripartizione

4. Valutazione e interpretazione della soluzione

(25)

Cluster Analysis

La distanza fra i gruppi viene calcolata sulle medie dei gruppi che devono essere il più diverse possibili

Si individua il centroide ovvero il punto che ha come coordinate le variabili considerate

Si assegnano gli oggetti ai gruppi in modo da minimizzare le distanze

Si ridefiniscono (iterative method) i centroidi in modo da rendere minima la varianza interna e massima la varianza tra i cluster Il processo termina fino a quando non c’è più un decremento

significativo della funzione da minimizzare@

Metodo per creare la distanza (k-medie):

Distanza euclidea: la somma dei quadrati delle differenze di tutte

(26)

Cluster Analysis

• Il numero dei gruppi è stabilito dal ricercatore in base alle

considerazioni teoriche sul fenomeno in studio

• Le distanze sono calcolate tra i casi

(27)

MISURA della MISURA della

CORRELAZIONE

CORRELAZIONE

(28)

Correlazione fra più variabili di uno stesso

campione

• Analisi della correlazione

• Analisi della regressione

• Analisi della covarianza

• Analisi della correlazione parziale

(29)

Analisi della Correlazione

Scopo: analizzare la relazione fra variabili quantitative (a

distribuzione gaussiana o non gaussiana)

Fornisce sia il senso della relazione che la significatività

(30)

Analisi della Correlazione

Correlazioni parametriche:

• r di Pearson

Correlazioni non parametriche:

• Tau di Kendall

• Rho di Spearman

(31)

Analisi della Correlazione

r di Pearson

• Misura dell’associazione lineare fa due variabili. I valori del coefficiente vanno da -1 a 1. Il segno del coefficiente

indica una relazione positiva o

negativa. Il suo valore assoluto indica la forza della relazione.

(32)

Analisi della Correlazione

• Tau di Kendall

• Rho di Spearman

Entrambi misura dell’associazione non

parametrica basata su dati o ordinali o a ranghi.

• I valori di entrambi i coefficienti vanno da -1 a 1.

Il segno del coefficiente indica una relazione

positiva o negativa. Il suo valore assoluto indica la forza della relazione.

• Dipendono dalla numerosità campionaria quindi va associato alla significatività

(33)

Analisi della Correlazione

Utilizzi

• Misura dell’associazione fra variabili

(34)

Relazione fra risultati prodotti da diverse

ricerche

• Misura dell’effect-size

• Meta analisi

• Review

(35)

Effect size o forza dell’effetto

• Grado con cui il fenomeno è presente nella popolazione

• Intensità della relazione fra fattore e variabile dipendente

• Confronto fra variabilità dovuta ai fattori e la variabilità totale

• Variabilità misurata come varianza spiegata

• Diversi indici a seconda dei dati e dei test utilizzati

(36)

Meta Analisi

Scopo: permette di confrontare i risultati di diverse ricerche riguardanti uno

stesso argomento nonostante siano basate su numerosità campionaria

diverse e diversi test statistici utilizzati Finalità: comprendere il funzionamento del fenomeno da studi diversi a volte discordanti

(37)

Meta Analisi

Per evitare di fare confronti inutili occorre

specificare ovvero delimitare l’ambito di analisi in modo da semplificare il problema e quindi l’interpretazione dei risultati

Limitare le variabili in studio e eventualmente applicare più di una metanalisi

ES. Studio dell’effetto dell’ansia sulle prestazioni

(38)

Meta Analisi

Procedimento:

1. Raccolta e codifica degli studi

2. Calcolo degli indici di confronto

3. Sintesi: calcolo dell’effetto medio 4. Interpretazione dei

(39)

Meta Analisi: 1. Raccolta e codifica

• Gli studi raccolti devono essere

adeguati e di ampia numerosità per

evitare l’errore dovuto alle pubblicazioni (pubblication bias) e all’errore di

campionamento

• Definire l’ipotesi di riferimento che

specifica le variabili da utilizzare (fattori o predittori, covariate o moderatori)

(40)

Valutazione delle differenze fra le medie rapportate alla deviazione standard casuale

Tale valutazione, nel caso di due gruppi indipendenti, può essere calcolata dalla formula

effect size x x

1

2

Meta Analisi:

2. Calcolo degli indici di

confronto

(41)

Nel caso conosciamo solo la numerosità dei gruppi e il valore del parametro t possiamo ottenere lo stesso indice dalla formula

effect size t n n

 

1

2

Meta Analisi:

2. Calcolo degli indici di

confronto

(42)

Effetto medio: media degli effetti nelle diverse ricerche effettuate

Permette di ottenere una valutazione complessiva dei risultati

Meta Analisi:

3. Calcolo dell’effetto medio

(43)

Permette di trasformare le descrizioni delle ricerche effettuate su un particolare argomento in una valutazione obiettiva dei risultati ottenuti

Tuttavia necessitano di una interpretazione dettagliata e motivata dell’analisi

Meta Analisi: 4.

Interpretazione

Riferimenti

Documenti correlati

Si rappresentino le rette r ed s, si dia una valutazione approssimativa delle coordinate del loro punto di intersezione, si risolva il sistema lineare, e si confrontino il

Dal diagramma di Dynkin possiamo ricavare la matrice di Cartan e quindi i sistemi di radici ridotti sono completamente determinati (a meno di isomorfismi) dai loro diagrammi di

in tutto il continente l’attuazione delle «Agende 21» previste nella Dichiarazio- ne di Rio: un’occasione per riallineare in- torno alla sfida dello sviluppo sostenibile il

Esempio: l’aspetto finalistico di molti modelli utilizzati in sociologia ed anche in economia; la non omogeneità nel comportamento dei grup­ pi umani; i pericoli

This study seems to suggest that an external magnetic field might be required to accelerate the development of the instability and observe a shock formation in this configuration

qualcuno possa voler fare una passeggiata da solo. Mi venne in mente la scena di Ali al matrimonio; avevo raggiunto i limiti della sopportazione e non riuscivo più a mantenere

Svolgere a scelta otto esercizi presi da otto gruppi diversi. Le risposte devono essere giustificate.. 1. di def., limiti, continuit`a, derivabilit`a, crescenza, massimi, min-

Per il Turno 3 devono ripresentarsi i Gruppi 1,8,10,11,12,14 La approvazione della parte di laboratorio dipenderà dalla consegna delle schede riviste correttamente secondo le