4.7 Limiti attesi nel modello in assenza del segnale
4.7.9 Analisi dei limiti per PADME
1678
Nell’analisi per l’esperimento PADME il parametro su cui si vuole fare lo studio per definire i
1679
limiti è 2, cioè la costante di accoppiamento tra il campo elettromagnetico standard e quello
1680
oscuro. Nel paragrafo 4.7.1 è stata fatta una prima misura basandoci sul numero di eventi di
1681
segnale e di fondo osservati per un ipotesi di 1013P OT . Anche attraverso l’utilizzo del metodo
1682
CLs l’analisi sarà effettuata per le distribuzione di segnale e di fondo (bremsstrahlung, γγ e
1683
γγγ) normalizzate allo stesso numero di positroni su targhetta.
1684
L’analisi sarà condotta utilizzando RooFit[86] e RooStat [86] [87] così come sono
implemen-1685
tati per la determinazione dei limiti di nuova fisica in grandi esperimenti.
1686
4.7. LIMITI ATTESI NEL MODELLO IN ASSENZA DEL SEGNALE 77 Le distribuzioni che vengono sottoposte all’analisi sono quelle di segnale per le diverse masse
1687
analizzate ([2.5, 20]M eV con ∆MA0 = 2.5M eV ) e il campione di fondo che hanno superato i
1688
tagli di selezione e normalizzati al numero di P OT desiderato.
1689
Ciò che si ottiene da uno studio con un livello di confidenza al 95% è riportato in figura
1690
4.33. In nero sono riporatati i valori determinati dal metodo per il parametro 2 scalato rispetto
1691
al suo valore atteso dalla teoria, cioè 2atteso = 10−6, in verde è riportata l’intervallo di valori
1692
possibili entro 2σ e in giallo quelli entro 3σ. Come si può osservare l’andamento è in accordo
1693
con quello ottenuto in 4.30, quindi se nell’analisi dei dati provenienti dalla presa dati otteniamo
1694
un valore di 2 esterno all’intervallo delineato dall’errore, possiamo concludere affermando che
1695
si è avuta la scoperta del fotone oscuro.
1696
200 400 600 800 1000 1200 1400 1600 1800 2000 2200Rej
1 cl rec +cl (E<Ethr&dist) 1 cl rec +cl (E<Ethr&dist)*
1 cl rec +cl (E>Ethr) 1 cl rec +cl (E>Ethr)*
1 cl rec +cl (E>Ethr&dist) 1 cl rec +cl (E>Ethr&dist)*
(a) Grafico rappresentante per i diversi metodi l’efficienza del segnale e la radice della reiezione del fondo, per il campione di dati generato con l’ipotesi di massa di 20 MeV.
200 400 600 800 1000 1200 1400 1600 1800 2000 2200Rej
ε
1 cl rec +cl (E<Ethr&dist) 1 cl rec +cl (E<Ethr&dist)*
1 cl rec +cl (E>Ethr) 1 cl rec +cl (E>Ethr)*
1 cl rec +cl (E>Ethr&dist) 1 cl rec +cl (E>Ethr&dist)*
(b) Grafico rappresentante per i diversi metodi l’efficienza del segnale per il campione, generato con l’ipotesi di massa di 20 MeV, di pileup e la radice della reiezione del fondo.
Metodo
1 cl rec +cl (E<Ethr&dist) 1 cl rec +cl (E<Ethr&dist)*
1 cl rec +cl (E>Ethr) 1 cl rec +cl (E>Ethr)*
1 cl rec +cl (E>Ethr&dist) 1 cl rec +cl (E>Ethr&dist)*
(c) Per ognuno dei diversi metodi viene graficato il prodotto √
reiezione per l’analisi effettuata sul campione di segnale per l’ipotesi di massa di 20MeV con produzione di pileup.
Figura 4.23: Plot relativi allo studio di efficienze per il campione relativo all’ipotesi di massa di 20MeV.
4.7. LIMITI ATTESI NEL MODELLO IN ASSENZA DEL SEGNALE 79
M(MeV)
2 4 6 8 10 12 14 16 18 20
ε
0.05 0.1 0.15 0.2 0.25 0.3
0.35 EffEnergyCut
EffRadiusCut EffBremm_1 EffBremm3sigma_1 EffBremm2sigma_1
Figura 4.24: Nel grafico vengono riportate per il campione di segnale immerso nel pileup, per ogni ipotesi di massa del bosone oscuro, le diverse efficienze ottenute dall’analisi effettuata. In legenda si possono trovare le nomenclature relative ai diversi tagli: con “EffEnergyCut” si è rappresentato l’efficienza ottenuta applicando il taglio iniziale in cui si determina la sognlia energetica a Ethr = 20M eV ; “EffRadiusCut” rappresenta quella relativa al taglio sul raggio del cluster affinchè sia interno al calorimetro e infine “EffBremm”riguarda l’efficienza nel determinare gli eventi che sono taggati come bremmstrahlung, rappresentando di quest’ultima anche quella relativa al numero di eventi che si hanno nell’intervallo di 3σ e di 2σ.
M(MeV)
2 4 6 8 10 12 14 16 18 20
ε
0.1 0.15 0.2 0.25 0.3
0.35 EffEnergyCut
EffRadiusCut EffBrem_1 EffBrem3sigma_1 EffBrem2sigma_1
Figura 4.25: Nel grafico vengono riportate per il campione di segnale, per ogni ipotesi di massa del bosone oscuro, le diverse efficienze ottenute dall’analisi effettuata. In legenda si possono trovare le nomenclature relative ai diversi tagli: con “EffEnergyCut” si è rappresentato l’efficienza ottenuta ap-plicando il taglio iniziale in cui si determina la sognlia energetica a Ethr = 20M eV ; “EffRadiusCut”
rappresenta quella relativa al taglio sul raggio del cluster affinchè sia interno al calorimetro e infine
“EffBremm”riguarda l’efficienza nel determinare gli eventi che sono taggati come bremmstrahlung, rap-presentando di quest’ultima anche quella relativa al numero di eventi che si hanno nell’intervallo di 3σ e di 2σ.
4.7. LIMITI ATTESI NEL MODELLO IN ASSENZA DEL SEGNALE 81
per il campione di massa a 12.5 Mev M2
per il campione di massa a 15 Mev M2
per il campione di massa a 17.5 Mev M2
per il campione di massa a 20 Mev M2
Figura 4.26: Per ogni campione analizzato corrispondente alle diverse ipotesi di massa, viene rappresentato l’andamento della variabile MA20.
0 50 100 150 200 250 300 350 400 450 500
(a) Per ogni campione analizzato corrispondente alle diverse ipotesi di massa, viene rappresentato l’anda-mento dell’energia ricostruita dei fotoni in funzione di MA20.
(b) Per ogni campione analizzato corrispondente alle diverse ipotesi di massa, viene rappresentato l’andamento dell’energia ricostruita dei fotoni in funzione dell’angolo di incidenza nel calorimetro.
Figura 4.27: Le diverse distribuzioni sono ottenute osservando l’andamento di diversi campioni: in nero sono riportati gli eventi che hanno superato il taglio relativo alla coincidenza temporale ed ener-getica per il bremmstrahlung; nei diversi colori invece si possono osservare gli stessi eventi apparte-nenti a campioni generati sotto l’ipotesi di diverse masse(rosa:MA0 = 17.5M eV , blu:MA0 = 10.0M eV , verde:MA0 = 5.0M eV ).
200
− −100 0 100 200 300 400 500 600
2)
2'(MeV MA 103
104
105
106 M2 per il campione di massa con PileUp per il campione di massa di fondo M2
per il campione di fondo dei 3γ M2
(a)
0 50 100 150 200
2)
2'(MeV MA 104
per il campione di massa con PileUp M2
per il campione di massa di fondo M2
per il campione di fondo dei 3γ M2
(b)
Figura 4.28: Distribuzione di massa al quadrato del bosone ricostruito con gli eventi che hanno superato tutti i tagli. Si può osservare in figura la sovrapposizione di questi eventi per ognuno dei tre campioni. L’istogramma rosso corrisponde al campione di fondo per il campione di bremsstrahlung e dei due fotoni, il blu è relativo al fondo di tre fotoni, e infine il nero corrisponde al campione di segnale con l’aggiunta del pileup. I grafici riportati sono ottenuti applicando il metodo attraverso il quale si fa il clustering dei segnali e si ammette che ci siano altri cluster all’interno di ECAL, ma temporalmente sconnessi, cioè esterni all’intervallo temporale secondo cui vengono classificati come contemporanei.
Inoltre ai grafici osservati viene applicata una normalizzazione per ottenere le distribuzioni quando si hanno 4 · 1013P ositron On T arget. Il campione di segnale è normalizzato per avere 2= 10−4.
4.7. LIMITI ATTESI NEL MODELLO IN ASSENZA DEL SEGNALE 83
M(MeV)
2 4 6 8 10 12 14 16 18 20
evBkgN
102
103
104
NBkg1_3sigma NBkg1_2sigma N3gamma1_3sigma N3gamma1_2sigma
Figura 4.29: Rappresentazione del numero di eventi di fondo in funzione dell’ipotesi di massa. Nella legenda vengono descritti i diversi tipi di campione rappresentato: NBkg1_3sigma(2sigma) è il numero di eventi di fondo totale che supera i tagli di selezione; N3gamma1_3sigma(2sigma) invece rappresenta l’andamento del numero di eventi di fondo derivanti sono la e+e−→ γγγ.
M(MeV)
2 4 6 8 10 12 14 16 18 20
2
ε
6
10− 5
10− 4
10−
3sigma
2sigma
Figura 4.30: Rappresentazione del parametro 2 con un livello di confidenza del 84% in funzione dell’ipotesi di massa per le efficienze di segnale e di fondo per eventi interni all’intervallo di 2σ e 3σ.
4.7. LIMITI ATTESI NEL MODELLO IN ASSENZA DEL SEGNALE 85
2 4 6 8 10 12 14 16 18 20
M(MeV)
6
10− 5
10− 4
10−
2 ε σ per gli eventi di campione in 22∈
con eff=0.7 per gli eventi di campione in 2σ
∈2
con eff=0.8 per gli eventi di campione in 2σ
∈2
con eff=0.9 per gli eventi di campione in 2σ
∈2
Figura 4.31: Rappresentazione del parametro 2 con un livello di confidenza del 68% in funzione dell’ipotesi di massa per le efficienze di segnale e di fondo per eventi interni all’intervallo di 2σ con lo studio degli eventi appartenenti ad un range energetico in funzione delle diverse masse. Si possono inoltre osservare il rosa gli eventi che appartengono al suddetto intervallo, metre in nero gli eventi di segnale con un efficienza del 90% rispetto agli eventi che superavano i tagli tradizionali, in blu quelli con = 0.8 e infine in rosso gli eventi per cui = 0.7.
Figura 4.32: Costruzione della zona di confidenza.
4.7. LIMITI ATTESI NEL MODELLO IN ASSENZA DEL SEGNALE 87
Figura 4.33: Limiti dell’esperimento PADME sul parametro di accoppiamento 2 per un livello di confidenza al 95%. In verde si ha la significanza entro 2σ e in giallo quella entro 3σ.
Analisi attraverso le reti neurali
1698
Nel campo dell’apprendimento automatico, una rete neurale artificiale (“neural network”) è un
1699
modello matematico composto da “neuroni” artificiali, che si ispira a una rete composta da
1700
neuroni.
1701
Questi modelli matematici possono essere utilizzati sia per ottenere una comprensione delle
1702
reti neurali biologiche, ma ancor di più per risolvere problemi di intelligenza artificiale come
1703
quelli che si pongono in diversi ambiti tecnologici, come ad esempio in fisica.
1704
La rete neurale è costituita da un gruppo di interconnessioni di informazioni costituite da
1705
neuroni artificiali e processi che utilizzano un approccio di connessionismo di calcolo.
Nel-1706
la maggior parte dei casi una rete neurale artificiale è un sistema adattivo che cambia la sua
1707
struttura basata su informazioni esterne o interne che scorrono attraverso la rete durante la fase
1708
di apprendimento. In termini pratici le reti neurali sono strutture non-lineari di dati statistici
1709
organizzate come strumenti di modellazione. Esse possono essere utilizzate per simulare
rela-1710
zioni complesse tra ingressi e uscite che altre funzioni analitiche non riescono a rappresentare.
1711
Una rete neurale artificiale riceve segnali esterni su uno strato di nodi (unità di elaborazione)
1712
d’ingresso, ciascuno dei quali è collegato con numerosi nodi interni, organizzati in più livelli,
1713
ogni nodo elabora i segnali ricevuti e trasmette il risultato a nodi successivi.
1714
Il segnale nella connessione tra due neuroni artificiali è un numero reale e l’output tra questi
1715
neuroni è calcolato attraverso una funzione non lineare sulla somma degli input. I neuroni
1716
artificiali e le connessioni hanno tipicamente un peso che regola il processo di apprendimento,
1717
questo aumenta o diminuisce la forza del segnale alla connessione. I neuroni possono avere una
1718
soglia che determina quali segnali possono essere considerati segnali da elaborare e inviare allo
1719
strato successivo. Tipicamente questi neuroni sono organizzati in piani e il segnale viaggia dal
1720
primo, in cui si hanno gli input, sino all’ultimo subendo un’elaborazione ad ogni nodo.
1721
Componente fondamentale della rete neurale è perciò il neurone, che, attraverso una
fun-1722
zione di attivazione, riceve l’input dai neuroni precedenti se il segnale di quest’ultimo supera
1723
la soglia che viene impostata dall’utente, elabora l’informazione e attraverso una funzione di
1724
uscita elabora il risultato finale, spesso quest’ultima funzione è semplicemente quella di
identi-1725
tà. Fondamentali sono anche le connessioni,che consentono il trasferimento delle informazioni
1726
da un neurone ad un altro, e il peso che viene assegnato per l’appunto a questo trasferimento.
1727
88
5.1. PREPARAZIONE DEL CAMPIONE DA ANALIZZARE 89
5.1 Preparazione del campione da analizzare
1728
L’analisi attraverso le reti neurali viene applicato in questo caso specifico per far apprendere alla
1729
rete come discriminare gli eventi di segnale rispetto agli eventi di fondo, per capire l’efficienza di
1730
questi nuovi metodi e confrontarla con l’analisi effettuata basata su tagli applicati alle variabili
1731
cinematiche.
1732
La prima considerazione da fare riguarda la N-tupla che si vuole dare in pasto al programma,
1733
in particolare si crea un tree contenente le informazioni che riguardano il calorimetro ECAL e il
1734
veto dei positroni per ogni evento, questo perché nell’analisi tradizionale sono questi i rivelatori
1735
a cui si fa riferimento per la disciminazione fondo/segnale. Si decide inoltre di dare in pasto solo
1736
quegli eventi che superano la soglia di 20MeV, in analogia ad una presa dati in cui si imposta
1737
un’energia di soglia Ethr che funge da trigger. Le variabili inserite sono perciò energia,tempo e
1738
vettore posizione per ogni segnale registrato con E > Ethrin ECAL, numero di segnali registrati
1739
nel calorimetro in totale per ogni evento e quanti cluster si hanno soprasoglia, inoltre si creano
1740
delle variabili che contengano le informazioni del veto per i positroni, in particolare contenenti
1741
il numero di finger che rivela un segnale e il corrispondente tempo. Per studiare la variazione
1742
della risposta della rete in funzione delle variabili si crea un altro set di dati che contiene sono
1743
energia, tempo e coordinate spaziali del cluster leading e le informazioni riguardanti i primi 10
1744
segnali nel calorimetro. 1 Questi file vengono generati per il campione di segnale con pileup,
1745
per il campione di fondo del processo e+e− → γγγ, e infine il campione di segnale per il fondo a
1746
due fotoni e quello di bremmstrahlung. Per ogni tipologia di campione analizzato è necessario
1747
creare una variabile che fornirà il “peso” di ogni evento per tener conto delle sezioni d’urto dei
1748
processi di fondo2 sopratutto quando la rete deve testare il modello costruito, e un’altra che
1749
discrimini il fondo da segnale, il suo valore sarà 1 nel caso di eventi di segnale e 0 nel caso di
1750
eventi di fondo.
1751
Il file da sottoporre alla rete deve però essere unico, per cui i tre file prodotti vengono
1752
unificati e dopo di chè subiscono un processo tale da rendere il campione generico, costituito,
1753
cioè, da eventi di segnale e di fondo miscelati fra loro.
1754