• Non ci sono risultati.

4.7 Limiti attesi nel modello in assenza del segnale

4.7.9 Analisi dei limiti per PADME

1678

Nell’analisi per l’esperimento PADME il parametro su cui si vuole fare lo studio per definire i

1679

limiti è 2, cioè la costante di accoppiamento tra il campo elettromagnetico standard e quello

1680

oscuro. Nel paragrafo 4.7.1 è stata fatta una prima misura basandoci sul numero di eventi di

1681

segnale e di fondo osservati per un ipotesi di 1013P OT . Anche attraverso l’utilizzo del metodo

1682

CLs l’analisi sarà effettuata per le distribuzione di segnale e di fondo (bremsstrahlung, γγ e

1683

γγγ) normalizzate allo stesso numero di positroni su targhetta.

1684

L’analisi sarà condotta utilizzando RooFit[86] e RooStat [86] [87] così come sono

implemen-1685

tati per la determinazione dei limiti di nuova fisica in grandi esperimenti.

1686

4.7. LIMITI ATTESI NEL MODELLO IN ASSENZA DEL SEGNALE 77 Le distribuzioni che vengono sottoposte all’analisi sono quelle di segnale per le diverse masse

1687

analizzate ([2.5, 20]M eV con ∆MA0 = 2.5M eV ) e il campione di fondo che hanno superato i

1688

tagli di selezione e normalizzati al numero di P OT desiderato.

1689

Ciò che si ottiene da uno studio con un livello di confidenza al 95% è riportato in figura

1690

4.33. In nero sono riporatati i valori determinati dal metodo per il parametro 2 scalato rispetto

1691

al suo valore atteso dalla teoria, cioè 2atteso = 10−6, in verde è riportata l’intervallo di valori

1692

possibili entro 2σ e in giallo quelli entro 3σ. Come si può osservare l’andamento è in accordo

1693

con quello ottenuto in 4.30, quindi se nell’analisi dei dati provenienti dalla presa dati otteniamo

1694

un valore di 2 esterno all’intervallo delineato dall’errore, possiamo concludere affermando che

1695

si è avuta la scoperta del fotone oscuro.

1696

200 400 600 800 1000 1200 1400 1600 1800 2000 2200Rej

1 cl rec +cl (E<Ethr&dist) 1 cl rec +cl (E<Ethr&dist)*

1 cl rec +cl (E>Ethr) 1 cl rec +cl (E>Ethr)*

1 cl rec +cl (E>Ethr&dist) 1 cl rec +cl (E>Ethr&dist)*

(a) Grafico rappresentante per i diversi metodi l’efficienza del segnale e la radice della reiezione del fondo, per il campione di dati generato con l’ipotesi di massa di 20 MeV.

200 400 600 800 1000 1200 1400 1600 1800 2000 2200Rej

ε

1 cl rec +cl (E<Ethr&dist) 1 cl rec +cl (E<Ethr&dist)*

1 cl rec +cl (E>Ethr) 1 cl rec +cl (E>Ethr)*

1 cl rec +cl (E>Ethr&dist) 1 cl rec +cl (E>Ethr&dist)*

(b) Grafico rappresentante per i diversi metodi l’efficienza del segnale per il campione, generato con l’ipotesi di massa di 20 MeV, di pileup e la radice della reiezione del fondo.

Metodo

1 cl rec +cl (E<Ethr&dist) 1 cl rec +cl (E<Ethr&dist)*

1 cl rec +cl (E>Ethr) 1 cl rec +cl (E>Ethr)*

1 cl rec +cl (E>Ethr&dist) 1 cl rec +cl (E>Ethr&dist)*

(c) Per ognuno dei diversi metodi viene graficato il prodotto 

reiezione per l’analisi effettuata sul campione di segnale per l’ipotesi di massa di 20MeV con produzione di pileup.

Figura 4.23: Plot relativi allo studio di efficienze per il campione relativo all’ipotesi di massa di 20MeV.

4.7. LIMITI ATTESI NEL MODELLO IN ASSENZA DEL SEGNALE 79

M(MeV)

2 4 6 8 10 12 14 16 18 20

ε

0.05 0.1 0.15 0.2 0.25 0.3

0.35 EffEnergyCut

EffRadiusCut EffBremm_1 EffBremm3sigma_1 EffBremm2sigma_1

Figura 4.24: Nel grafico vengono riportate per il campione di segnale immerso nel pileup, per ogni ipotesi di massa del bosone oscuro, le diverse efficienze ottenute dall’analisi effettuata. In legenda si possono trovare le nomenclature relative ai diversi tagli: con “EffEnergyCut” si è rappresentato l’efficienza ottenuta applicando il taglio iniziale in cui si determina la sognlia energetica a Ethr = 20M eV ; “EffRadiusCut” rappresenta quella relativa al taglio sul raggio del cluster affinchè sia interno al calorimetro e infine “EffBremm”riguarda l’efficienza nel determinare gli eventi che sono taggati come bremmstrahlung, rappresentando di quest’ultima anche quella relativa al numero di eventi che si hanno nell’intervallo di 3σ e di 2σ.

M(MeV)

2 4 6 8 10 12 14 16 18 20

ε

0.1 0.15 0.2 0.25 0.3

0.35 EffEnergyCut

EffRadiusCut EffBrem_1 EffBrem3sigma_1 EffBrem2sigma_1

Figura 4.25: Nel grafico vengono riportate per il campione di segnale, per ogni ipotesi di massa del bosone oscuro, le diverse efficienze ottenute dall’analisi effettuata. In legenda si possono trovare le nomenclature relative ai diversi tagli: con “EffEnergyCut” si è rappresentato l’efficienza ottenuta ap-plicando il taglio iniziale in cui si determina la sognlia energetica a Ethr = 20M eV ; “EffRadiusCut”

rappresenta quella relativa al taglio sul raggio del cluster affinchè sia interno al calorimetro e infine

“EffBremm”riguarda l’efficienza nel determinare gli eventi che sono taggati come bremmstrahlung, rap-presentando di quest’ultima anche quella relativa al numero di eventi che si hanno nell’intervallo di 3σ e di 2σ.

4.7. LIMITI ATTESI NEL MODELLO IN ASSENZA DEL SEGNALE 81

per il campione di massa a 12.5 Mev M2

per il campione di massa a 15 Mev M2

per il campione di massa a 17.5 Mev M2

per il campione di massa a 20 Mev M2

Figura 4.26: Per ogni campione analizzato corrispondente alle diverse ipotesi di massa, viene rappresentato l’andamento della variabile MA20.

0 50 100 150 200 250 300 350 400 450 500

(a) Per ogni campione analizzato corrispondente alle diverse ipotesi di massa, viene rappresentato l’anda-mento dell’energia ricostruita dei fotoni in funzione di MA20.

(b) Per ogni campione analizzato corrispondente alle diverse ipotesi di massa, viene rappresentato l’andamento dell’energia ricostruita dei fotoni in funzione dell’angolo di incidenza nel calorimetro.

Figura 4.27: Le diverse distribuzioni sono ottenute osservando l’andamento di diversi campioni: in nero sono riportati gli eventi che hanno superato il taglio relativo alla coincidenza temporale ed ener-getica per il bremmstrahlung; nei diversi colori invece si possono osservare gli stessi eventi apparte-nenti a campioni generati sotto l’ipotesi di diverse masse(rosa:MA0 = 17.5M eV , blu:MA0 = 10.0M eV , verde:MA0 = 5.0M eV ).

200

100 0 100 200 300 400 500 600

2)

2'(MeV MA 103

104

105

106 M2 per il campione di massa con PileUp per il campione di massa di fondo M2

per il campione di fondo dei 3γ M2

(a)

0 50 100 150 200

2)

2'(MeV MA 104

per il campione di massa con PileUp M2

per il campione di massa di fondo M2

per il campione di fondo dei 3γ M2

(b)

Figura 4.28: Distribuzione di massa al quadrato del bosone ricostruito con gli eventi che hanno superato tutti i tagli. Si può osservare in figura la sovrapposizione di questi eventi per ognuno dei tre campioni. L’istogramma rosso corrisponde al campione di fondo per il campione di bremsstrahlung e dei due fotoni, il blu è relativo al fondo di tre fotoni, e infine il nero corrisponde al campione di segnale con l’aggiunta del pileup. I grafici riportati sono ottenuti applicando il metodo attraverso il quale si fa il clustering dei segnali e si ammette che ci siano altri cluster all’interno di ECAL, ma temporalmente sconnessi, cioè esterni all’intervallo temporale secondo cui vengono classificati come contemporanei.

Inoltre ai grafici osservati viene applicata una normalizzazione per ottenere le distribuzioni quando si hanno 4 · 1013P ositron On T arget. Il campione di segnale è normalizzato per avere 2= 10−4.

4.7. LIMITI ATTESI NEL MODELLO IN ASSENZA DEL SEGNALE 83

M(MeV)

2 4 6 8 10 12 14 16 18 20

evBkgN

102

103

104

NBkg1_3sigma NBkg1_2sigma N3gamma1_3sigma N3gamma1_2sigma

Figura 4.29: Rappresentazione del numero di eventi di fondo in funzione dell’ipotesi di massa. Nella legenda vengono descritti i diversi tipi di campione rappresentato: NBkg1_3sigma(2sigma) è il numero di eventi di fondo totale che supera i tagli di selezione; N3gamma1_3sigma(2sigma) invece rappresenta l’andamento del numero di eventi di fondo derivanti sono la e+e→ γγγ.

M(MeV)

2 4 6 8 10 12 14 16 18 20

2

ε

6

10 5

10 4

10

3sigma

2sigma

Figura 4.30: Rappresentazione del parametro 2 con un livello di confidenza del 84% in funzione dell’ipotesi di massa per le efficienze di segnale e di fondo per eventi interni all’intervallo di 2σ e 3σ.

4.7. LIMITI ATTESI NEL MODELLO IN ASSENZA DEL SEGNALE 85

2 4 6 8 10 12 14 16 18 20

M(MeV)

6

10 5

10 4

10

2 ε σ per gli eventi di campione in 22

con eff=0.7 per gli eventi di campione in 2σ

2

con eff=0.8 per gli eventi di campione in 2σ

2

con eff=0.9 per gli eventi di campione in 2σ

2

Figura 4.31: Rappresentazione del parametro 2 con un livello di confidenza del 68% in funzione dell’ipotesi di massa per le efficienze di segnale e di fondo per eventi interni all’intervallo di 2σ con lo studio degli eventi appartenenti ad un range energetico in funzione delle diverse masse. Si possono inoltre osservare il rosa gli eventi che appartengono al suddetto intervallo, metre in nero gli eventi di segnale con un efficienza del 90% rispetto agli eventi che superavano i tagli tradizionali, in blu quelli con  = 0.8 e infine in rosso gli eventi per cui  = 0.7.

Figura 4.32: Costruzione della zona di confidenza.

4.7. LIMITI ATTESI NEL MODELLO IN ASSENZA DEL SEGNALE 87

Figura 4.33: Limiti dell’esperimento PADME sul parametro di accoppiamento 2 per un livello di confidenza al 95%. In verde si ha la significanza entro 2σ e in giallo quella entro 3σ.

Analisi attraverso le reti neurali

1698

Nel campo dell’apprendimento automatico, una rete neurale artificiale (“neural network”) è un

1699

modello matematico composto da “neuroni” artificiali, che si ispira a una rete composta da

1700

neuroni.

1701

Questi modelli matematici possono essere utilizzati sia per ottenere una comprensione delle

1702

reti neurali biologiche, ma ancor di più per risolvere problemi di intelligenza artificiale come

1703

quelli che si pongono in diversi ambiti tecnologici, come ad esempio in fisica.

1704

La rete neurale è costituita da un gruppo di interconnessioni di informazioni costituite da

1705

neuroni artificiali e processi che utilizzano un approccio di connessionismo di calcolo.

Nel-1706

la maggior parte dei casi una rete neurale artificiale è un sistema adattivo che cambia la sua

1707

struttura basata su informazioni esterne o interne che scorrono attraverso la rete durante la fase

1708

di apprendimento. In termini pratici le reti neurali sono strutture non-lineari di dati statistici

1709

organizzate come strumenti di modellazione. Esse possono essere utilizzate per simulare

rela-1710

zioni complesse tra ingressi e uscite che altre funzioni analitiche non riescono a rappresentare.

1711

Una rete neurale artificiale riceve segnali esterni su uno strato di nodi (unità di elaborazione)

1712

d’ingresso, ciascuno dei quali è collegato con numerosi nodi interni, organizzati in più livelli,

1713

ogni nodo elabora i segnali ricevuti e trasmette il risultato a nodi successivi.

1714

Il segnale nella connessione tra due neuroni artificiali è un numero reale e l’output tra questi

1715

neuroni è calcolato attraverso una funzione non lineare sulla somma degli input. I neuroni

1716

artificiali e le connessioni hanno tipicamente un peso che regola il processo di apprendimento,

1717

questo aumenta o diminuisce la forza del segnale alla connessione. I neuroni possono avere una

1718

soglia che determina quali segnali possono essere considerati segnali da elaborare e inviare allo

1719

strato successivo. Tipicamente questi neuroni sono organizzati in piani e il segnale viaggia dal

1720

primo, in cui si hanno gli input, sino all’ultimo subendo un’elaborazione ad ogni nodo.

1721

Componente fondamentale della rete neurale è perciò il neurone, che, attraverso una

fun-1722

zione di attivazione, riceve l’input dai neuroni precedenti se il segnale di quest’ultimo supera

1723

la soglia che viene impostata dall’utente, elabora l’informazione e attraverso una funzione di

1724

uscita elabora il risultato finale, spesso quest’ultima funzione è semplicemente quella di

identi-1725

tà. Fondamentali sono anche le connessioni,che consentono il trasferimento delle informazioni

1726

da un neurone ad un altro, e il peso che viene assegnato per l’appunto a questo trasferimento.

1727

88

5.1. PREPARAZIONE DEL CAMPIONE DA ANALIZZARE 89

5.1 Preparazione del campione da analizzare

1728

L’analisi attraverso le reti neurali viene applicato in questo caso specifico per far apprendere alla

1729

rete come discriminare gli eventi di segnale rispetto agli eventi di fondo, per capire l’efficienza di

1730

questi nuovi metodi e confrontarla con l’analisi effettuata basata su tagli applicati alle variabili

1731

cinematiche.

1732

La prima considerazione da fare riguarda la N-tupla che si vuole dare in pasto al programma,

1733

in particolare si crea un tree contenente le informazioni che riguardano il calorimetro ECAL e il

1734

veto dei positroni per ogni evento, questo perché nell’analisi tradizionale sono questi i rivelatori

1735

a cui si fa riferimento per la disciminazione fondo/segnale. Si decide inoltre di dare in pasto solo

1736

quegli eventi che superano la soglia di 20MeV, in analogia ad una presa dati in cui si imposta

1737

un’energia di soglia Ethr che funge da trigger. Le variabili inserite sono perciò energia,tempo e

1738

vettore posizione per ogni segnale registrato con E > Ethrin ECAL, numero di segnali registrati

1739

nel calorimetro in totale per ogni evento e quanti cluster si hanno soprasoglia, inoltre si creano

1740

delle variabili che contengano le informazioni del veto per i positroni, in particolare contenenti

1741

il numero di finger che rivela un segnale e il corrispondente tempo. Per studiare la variazione

1742

della risposta della rete in funzione delle variabili si crea un altro set di dati che contiene sono

1743

energia, tempo e coordinate spaziali del cluster leading e le informazioni riguardanti i primi 10

1744

segnali nel calorimetro. 1 Questi file vengono generati per il campione di segnale con pileup,

1745

per il campione di fondo del processo e+e → γγγ, e infine il campione di segnale per il fondo a

1746

due fotoni e quello di bremmstrahlung. Per ogni tipologia di campione analizzato è necessario

1747

creare una variabile che fornirà il “peso” di ogni evento per tener conto delle sezioni d’urto dei

1748

processi di fondo2 sopratutto quando la rete deve testare il modello costruito, e un’altra che

1749

discrimini il fondo da segnale, il suo valore sarà 1 nel caso di eventi di segnale e 0 nel caso di

1750

eventi di fondo.

1751

Il file da sottoporre alla rete deve però essere unico, per cui i tre file prodotti vengono

1752

unificati e dopo di chè subiscono un processo tale da rendere il campione generico, costituito,

1753

cioè, da eventi di segnale e di fondo miscelati fra loro.

1754