neurali
1 Introduzione alle principali tecniche per l'analisi dei treni
di spike neurali
Gli array di elettrodi corticali sono diventati uno strumento molto utilizzato
nellaricercaneuroscientica perchèrendonopossibilelostudiodell'attività si-
multaneadidiversineuroniinregionidierentidelcervello.E'infattiimportan-
tissimotenereinconsiderazionechesoloattraversolaconoscenzadelleattività
contemporaneediregionidiverseèpossibileindagaresulfunzionamentodiaree
diversedelcervello[1].
Inneurosiologiasiregistra,inrispostaadunostimolo,l'attivitàneuraledi
unaopiùareedelcervellochesicredonoesserecoinvolteconil tipodistimolo
fornito. Questo stimolo può essere di varia natura: sico, come un impulso
luminosooppureunsuono,oastrattoocognitivo,comel'eserciziodellamemoria.
Quello che veramente ha importanza è come caratterizzare quantitativamente
larelazionetralostimoloelarispostadelsingolo neurone,oancoramegliodi
ungruppodineuronidatocheorac'èquestapossibilitàutilizzando diarraydi
elettrodi. Capire come agiscono i neuroni in gruppo puòessere indispensabile
alloscopodidenirelafunzionalitàspecicadiuna certaareacerebrale.
1.1 Lo spike sorting: l'identicazione e la classicazione di
un evento spike
Negli esperimenti di neurosiologia, gli spike individuali non sono registrati
direttamente. Questoavvieneperchèquandovengonoimpiantatimoltielettrodi
ilpotenzialeextracellulareregistratoperciascunelettrodorappresental'attività
elettrica istantanea di un numero a priori sconosciuto di neuroni. Da questi
segnaliènecessarioidenticareivaripotenzialid'azioneedanchelaloroorigine
attraversol'usodialgoritmidiclusterizzazioneedottimizzazione[17].
I passi principali dello spike sorting sono quindi tre: identicazione del-
l'eventospike,identicazionedelnumerodineuronicoinvoltinellaregistrazione
elaconseguenteassociazioneneurone-spike;quellochecisiaspettadi ottenere
treni di spikeneurali: (a) il segnaleregistrato; (b)lo spikesorting; (c-
f) possibili misure di associazione tra i treni di spike usando il cross-
correlogramma (c), il JPSTH (d), un modello di tting parametrico
usandolaverosimiglianza(e), lafunzione dicross-coerenza(f)
n-segnali puliti, ciascuno riferendosi al relativo neurone. Lo spike sorting èil
primopassoperl'analisiditrenidispikemultipli. E'necessariotenerepresente
che l'accuratezza di questa fase di elaborazione inuenza notevolmente tutti i
risultatidelleelaborazionisuccessive.
Inletteraturaèpossibiletrovarenumerosialgoritmiperlospikesorting. Non
esiste almomentounalgoritmomiglioredeglialtrielasceltavienefatta sulla
base deltipodiapplicazione(es.,sortingo-line oin temporeale,supervision-
atoononsupervisionato). Diversialgoritmi,applicatiagli stessidati, possono
infatti dare risultatimolto diversi,mettendo in evidenzacome siacomplesso i
problemidi identicazioneeclassicazionedeglispikes.
Leprincipaliproblematicheetecnichediimplementazionedellospikesorting
verrannoanalizzatedettagliatamentenelparagrafosuccessivo.
1.2 Cross-correlogramma e funzione di cross-intensità
La maggiorparte delle tecniche per l'analisi di treni di spike valutano solo le
associazionitracoppiedi neuroniutilizzandotecnichepossonoesseredivisenel
dominiodel tempoeneldominio dellefrequenze.
Ilmetodopiùcomunementeusato neldominio deltempoeil crosscorrelo-
gramma. Datauna coppiaditrenidispikeedunaspecicalarghezzadi bin,il
cross-correlogramma[2]rappresentalacross-covarianzatra i duesegnali . Con
questatecnicasideveassumerecheitrenidispikesianostazionari,ovveroche
le proprietà stocastiche del segnale non varino con il passare del tempo, ma
talvoltaquestaipotesinonèvericata.
Unamisurarelativadell'associazionetraidueprocessipuntualistazionariè
lafunzione di cross-intensità[3]. Questa funzionestima lafrequenza di scarica
diunneuroneperdiversitempidiritardorispettoall'attivitàdiscaricadelsec-
ondoneurone. Sebbenequestatecnicasiastatasviluppataadhocpermisurare
l'associazionetra due processi puntuali, in realtànonviene usata spesso nelle
applicazionineuroscientiche.
1.3 Istogramma JPST(Joint Peri-Stimulus Time
Histogram)
Il JPSTH si può considerarecome l'estensione del PSTH[4 ]. Mentre ilPSTH
tienecontodel numerodegli spikeperunitàdi tempoad uncertotempo t,il
JPSTHèunistogrammabidimensionalecherappresentalacontadeglispikeper
unità ditempoperunneuroneaduntempoue perl'altroad unaltro tempo
v. Ladiagonaleche divideil quadrante mostrailgracoperucoincidentecon
confrontando l'attività) allo scopo di ovviare alla possibilità che due neuroni
conattivitàindipendentemaconunafrequenzadiscaricamoltosimilevengano
associati. Lasommadellediagonalidin-JPSTHproduceilcross-correlogramma
normalizzato.
1.4 Metodi di classicazione del pattern dello spike
Glialgoritmiingradodidistingueredeipatternprecisiditemporizzazionedegli
spike sono spesso usati come metodo per associare tra loro spike train neu-
rali. Loscopodi queste tecniche èvalutareleinterazionineuralidi alto-livello
nell'attivitàdiuna popolazionedineuroni.
Quellochefannoquestialgoritmièmapparelecoincidenzeevalutarestatis-
ticamente sesonopredicibilisottol'ipotesi nullachegliistantidi tempoin cui
avvienel'eventospikesianoindipendenti,poilaricorrenzadiquestecoincidenze
vienestudiatainrelazioneconciòchesisupponeabbiaportatoadaverequella
registrazione.
1.5 Metodi che sfruttano la funzione di verosimiglianza
Il metodo di massimaverosimiglianza("likelihood method") è uno strumento
fondamentale dell'indagine statistica ed è una misura statistica di quanto un
modello proposto si avvicina ai dati sperimentali del sistema che si cerca di
riprodurre. Iparametrichecaratterizzanoilmodellopossonoesserestimatidai
datisperimentali,attraversounaproceduradistimaformalecomeilmetododei
momentiodellamassimaverosimiglianza.
Questimetodi trovanoetroverannosemprepiùspazionelmondodelleneu-
roscienze computazionali, in quanto possono essere utilizzati per una serie di
problematichepropriedell'analisididati,comeilgoodness-of-t,lacostruzione
di intervallidicondenzaopportunienumerositeststatistici.
Lasdarappresentatanell'utilizzodellaverosimiglianzaneimetodiaproces-
sopuntualenell'analisidi trenidispikeneuralimultiplièdatadallapossibilità
chesihadideniremodellimultivariatidiprocessipuntualichesianoingradodi
rappresentarel'attivitàneuraledigruppidineuroni[5]. Inoltreèpossibileusare
latecnicadellamassimizzazionedel likelihoodanche perottimizzare algoritmi
peril ttingdi modelli[6].
1.6 Metodi nel dominio delle frequenze
L'analisisvoltaneldominiodellefrequenzepuòessereeettuata,conl'ipotesidi
coerenzapercoppiedi trenmi di spike. La coerenzaèinfatti unamisura della
correlazione,dipendente dallafrequenza,didue processi.
Itrenidispikepossonoancheesserenonstazionarimadovutiadunostimolo
esterno, in questi casi il segnale può essere analizzato in una nestra mobile
stimandosemprespettroecoerenza(spettrogrammaediagrammidicoerenza).
Innelewavelet,di cuisi parleràin manieradettagliataneicapitolisuccessivi,
sonounimportantestrumentoperlostudiodiquestacategoriadi segnali.
1.7 Decodica del treno di spike
Glialgoritmididecodicasonotecnichematematicheusateinneuroscienzeper
studiare come i treni di spike di un singolo neurone o di una popolazione di
neuronirappresentinostimoliesterniosegnali biologici.
Questotipodi analisi prevede due fasi: una di codicaa cui segueuna di
decodica[7]. Nellaprima fasevienecaratterizzatal'attivitàdi scaricaneurale
come funzione del segnale biologico, mentre nella seconda parte la relazione
viene invertita ed è quindi il segnale che vienestimato dall'attività di scarica
neurale. Perdecodicarel'attivitàdi unneuronepertuttigliistantidi tempo
è necessario calcolare il vettore popolazione (con questo nome ci si riferisce
alprodottoscalare dell'attivitàrelativaaduna notanestra temporaleconla
funzione di scarica di ciascunneurone). Ilvaloredel segnaleperilqualesi ha
il massimodelvettorepopolazionesaràpoipreso comestimadi decodicadel
segnale.
1.8 Teoria dell'informazione
Anchelateoriadell'informazionevieneusatanelleanalisideitrenidispikeneu-
rali. Attraversolavalutazionedell'entropiaèpossibilequanticarelavariabilità
diuntrenodispikeedattraversolavalutazionedellamutuainformazioneèpos-
sibile misurarel'associazionetra due processi, come ad esempiotra due treni
di spikeotrauntrenodi spikeeduno stimolo. Queste tecnichehannotrovato
numeroseapplicazioniperlostudiodella"quantitàdiinformazione"contenuta
in un treno di spike ed usando metodi basati sull'istogramma è possibile sti-
mareempiricamente la curvadella densitàdi probabilitàdegli eventi: usando
queste informazionidiventa quindipossibilemodellareil sistemanervosocome
tanticanalidicomunicazioniconlalibertàdinonfareassunzionisuiritardidel
sistemachesivaesaminando.
Esisteperòunagrossalimitazionecaratteristicadiquestotipodiapproccio:
in attività: (a)le analisidi encodinge leattività; (b) leanalisiperla
decodica con cui si stimano i campi recettivi, che vengono poi usati
peril calcolo della posizionedel ratto. La posizionepredetta riesccea
ricalcarebenequellaosservata.
notaevaquindistimata,tenendoinconsiderazionecheaumentarequestapreci-
sioneimplicaaumentareesponenzialmenteilnumerodidatidaconsiderare. Per
questo motivosièancoralontanidalpoterestenderequesto tipodi approccio
perstimarelamutuainformazionetratrenidispikemultipliesegnalibiologici.
Unapprocciovoltoadestenderequestepotentitecnicheancheperleanalisi
neuroscienticheèdatodallalorounioneconimetodidiverosimiglianza,iquali
fornisconounmodelloprobabilistico delsistemadastudiarerendonoin questo
modopossibilelastima dellamutua informazione,una volta che siconosce la
distribuzionedi densitàdi probabilitàdeglieventi.
2 Introduzione allo spike sorting
Lapossibilitàdiregistrarel'attivitàneuraledalsistemanervosocentraleèpar-
ticolarmenteinteressanteerappresentaunrequisitofondamentaleperlaricerca
dellecaratteristichefunzionalidelcervello.
Ineuronicomunicanoattraversoscaricheelettrichedi piccolaintensità, che
possonoessereregistrateconmicroelettrodi. Inbasealgoalcheilneurosiologo
desidera raggiungere,sipuòeseguireilsortingdeidatiassegnandodeterminati
spike a determinati neuroni con modalità chiamate in gergo tecnico "soft" e
"hard". Nelprimocasoall'assegnamentovieneassociatounvalorerealedazero
nonlosiaccetta(caso crisp).
Inmolticasi l'attivitàdi unasingolaunità puòessereottenutaconunsin-
golo microelettrodo e con una rilevazione così detta "a soglia", ovvero viene
rivelatol'eventospikequandoilsegnaledelpotenzialesuperaunvalorepresta-
bilito. Tuttaviapuòcapitarechenonsiriescaamisurarel'attivitàdiunsingolo
neurone,echesiadicileaccorgersidelladierenzatraglispikedidiversineu-
roni della stessa areadi registrazione perchè molto simili tra loro in forma e
dimensione. Inoltrepuòsuccederecheapproccisemplicicomeildetectionhard-
wareasogliapossanopolarizzarel'esperimentoversoqueineuronichehannoun
potenzialed'azione piùevidente,rendendoimpossibilelarilevazionedeglialtri
neuronivicini. Unasoluzionevalidaaquestacategoriadiproblemièrappresen-
tatadallaanalisidelsegnalegrezzo,equindidaunfasedidetectioneettuata
viasoftwareenonviahardware.
Unodeimotivipercuiènatolospikesortingèquellodiaiutarelostudioneu-
roscienticodipopolazionidineuroni. Inalcunicasièpossibilemisurarel'attiv-
itàdiunapopolazionedineuroniusandoarraydielettrodiseparatispazialmente
tanto dasupporreche ciascunofunzioni da singolo elettrodo indipendente. Il
vantaggiodel sorting deglispike èche, teoricamente,rendepossibilelo studio
dipopolazionilocalidineuronitroppovicinitraloropergarantirel'isolamento
tra levarie registrazioni e permette di investigare sulla temporizzazione degli
spikedistinguendoduespikedovutianeuronidierenticoincidentinellostesso
istantetemporale.
Inletteraturasiriscontraungrandeinteresseperquestoproblemaneurosci-
entico,infattisono numerosissimeletecniche chesono statesviluppateconil
passaredeltempoperrisolvereilproblemadelsortingdeglispike[8].
2.1 I problemi principali dello spike sorting
Osservandodelleformed'ondaregistrateextracellularièchiarocomesianosem-
prepresentidierentitipidipotenzialid'azione,informaedimensione. Quello
che invece rimane da chiarire è come e perchè: corrispondono ad attività di
neuroni diversioaquelladi unsolo neurone? Sonoartefattiosono datenere
in considerazione? Conquale criterioè consentito decidere quali spike tenere
in considerazione come "buoni" e quali scartare come "cattivi"? E come ri-
conoscerespikecoincidenticomesommadidueopiùelementiconosciutienon
comeunnuovoelementosconosciuto? Questesonoleprincipalidomandeacui
sivuoledareunarispostaconl'applicazionedellemetodologiedispikedetection
espikesorting.
unnonprecisatonumerodineuroni.
rale,diventanecessarioipotizzarecheineuronidiunacertapopolazionegener-
ino potenzialid'azione conuna forma caratteristicae questa ipotesi, anchese
spessoèvalida,nonèsemprevericata. Tuttavia,moltineuronigeneranopoten-
ziali d'azione che hanno una forma variabile anche perchè spesso, durante la
fase di registrazione, l'elettrodo scivola lentamente lungo il tessuto. Questo
fenomeno determina per l'appunto un graduale cambiamento nella forma dei
potenziali d'azione registrati dallo stesso neurone. Quanto ne segue è che il
processo successivo di clustering ne rimane inuenzato, determinando gruppi
con formapoco compatta. Inoltre c'è la dicoltàdata dalla sceltadel valore
di soglia, che èun problema di tipo statistico. Il livellodella soglia determi-
na un trade-o tra la mancata detenzione degli eventi(falsi negativi, FN) ed
ladetenzionedi eventiinesistenti(falsipositivi,FP):idealmente questovalore
dovrebbeesseresceltoperottenereil rapporto
F N
F P desiderato. Solonelcasoin cuiillivellodirumoredifondoèpiccoloparagonatoalvalorediampiezzadegli
spikeèpossibilefareunabuonadistinzionetrasegnaleerumoreconilmetodo
dellasoglia.
Inaggiuntaalrumoredifondo,che,almenoin primaapprossimazione,può
essereconsideratodi naturagaussiana,l'altezzadellospikepuòvariareconsid-
erevolmentesecisonoaltrineuroninellaregionechegenerapotenzialid'azione
che generanoa loro volta potenziali di dimensioni signicativeche vadano in
qualchemodoasommarsitraloro. Unastimadiquantofrequentementecapita
ditrovarelasovrapposizione,ancheparziale,dellecurvedeipotenzialid'azione
didiversineuronipuòesserevalutataconsiderandolafrequenzadiscaricadella
popolazione. Infattisipuòvalutarelapercentualediscarichenonrilevatecome
laprobabilitàcheilsingoloeventocapitiincorrispondenzadellafasenegativadi
unaltroeventocoincidente-oquasi-disottofondo. Considerandorilvaloredi
frequenzadiscaricavalutatainHertzedladuratadellafasenegativavalutata
in millisecondi,siavrà
%spike − non − segnalati = 100 rd
1000
dellafasenegativaèapprossimativamentedi20mssiottienechecircal'1%degli
spike vengano persi. E' importante tenere presente, infatti, che solo quando
la fase negativa del background ha una durata sucientemente lunga questo
fenomenoètaledarappresentareunproblemaperlarilevazionedeglispike. Un
altrapotenziale fontedierrore,sempredovutaallasovrapposizionedeisegnali,
si haquandoduespikedi sottofondosicombinanoassieme. Inquestocaso,se
dueneuroniindipendentihannofrequenzadiscarica
r
1edr
2ilorospikesarannosommatipersuperarelasogliaadunafrequenzadicirca
(r
1r
2)
1000d ,doveperd
siintendelalarghezzadellospikeinmillisecondi. Questosignicachesecisono
due neuronibackgroundchesparanoalla frequenzadi 20Hz esesisupponela
larghezzadiognisingolospikeparia
1
4 dimillisecondo,ènotocheverràgenerato unfalsopositivoconunafrequenzadi
1
10 diHertz. Questometododistimaha
sensosoloperneuroniadiacentichepresentanoattivitàstrettamentecorrelate:
caveat emptor, in quanto la frequenza degli spike non segnalati o comunque
deglieventidi sovrapposizionevienetipicamente sottostimata. Un altropunto
sucuiènecessarioprestareattenzioneèchelastimaèbasatainlineadimassima
sull'assunzionecheleattivitàdeineuronisianoindipendentiechelanaturadella
distribuzionedegliISI(InterSpikeInterval)siadinatura poissoniana: lastima
del numero delle coincidenzeè quindi conservativa epotrebbequindi rivelarsi
maggioreseineuroniavesseroattivitàdi scaricacorrelatetraloro.
2.2 Il clustering dei dati
Per analizzare i segnali neurali bisogna innanzitutto identicare gli istanti di
tempoincuilacellulaneuralegenerailpotenzialed'azione;solosuccessivamente
sarànecessariaunaclassicazionedeglieventichesonostatiidenticati: questa
partedellavorovienechiamataclusteringdeidati.
Il problema del clustering è di carattere generale ed è stato arontato in
tutte oquasi le discipline ingegneristiche. Tuttavia, si tratta di un problema
estremamente complesso anche a livellocomputazionale. Infatti tecniche, en-
trambe validepercasi diversitra loro, potrebbero dare risultatiincompatibili
traloroseapplicateallostessoset didati.
Esisteun processo molto simile a quello di clustering, che viene chiamato
analisidiscriminante: ladierenzatrai duestanelfatto chementrenel primo
casoabbiamounaseriedi elementidi cuinonabbiamoconoscenzasullaprove-
nienza,nel secondoègiànoto unset di clustere lafasedi analisiserve"solo"
perassociareinuovielementiallepreclassi,chegiàsononote.
Sononumerose le tecniche di clustering sviluppate per dierenti problemi
Fig.5: Dati(olorofeature)proiettatinellospaziodilavoro
X
1X
2.
tinguere questetecnichein diversetipologie. Letecnichedi clustering possono
esserequindiraggruppatesecondounaspecicatassonomia.
*Partizionatoogerarchico,
chesiriferisceallanaturadellaclassicazione. Seadesempiosihauninsieme
dielementidatoda{A,B,C,D,E,F,G}distribuitinellospaziocomemostrato
ingura,sesiadottaunalgoritmopartizionatosiotterrannotrecluster,mentre
sesiadottaunalgoritmogerarchicononèdetto,dipendedallozoomconcuisi
vaavalutareilclustering.
Unesempiogracocherendebenel'ideadigerarchiadiunclusteringèinvece
datodalmetododeldendrogramma,chevienemostratoingura.
*Aggiuntivaosottrattiva,
che si riferisce nello specico al tipo di operazione che l'algoritmo fa. Un
algoritmo di tipo aggiuntivo comincia associando a ciascun elemento da clas-
sicare il titolo di cluster, e successivamente fonde i cluster tra loro no al
raggiungimentodiuncertocriterio. Ilmetodosottrattivoinvececominciaasso-
Fig.7: Esempiodidendrogrammaconidatimostratiprecedentemente.
*Hardosoft,
chesiriferiscealtipodilogicadegliinsiemichesidecidediapplicare,ovvero
sela logicacrispolalogicafuzzy rispettivamente. Un clustering di tipohard
assegnaunaspecicalocazioneperognielemento,mentre unclusteringdi tipo
softassegnai gradidi appartenenzadi ognielementoadognicluster. Talvolta
siricorreallaclassicazionefuzzyperottenerneunacrisp,ovverosiassegnaallo
specicoelementolalocazionechegodedelmaggiorgradodiappartenenza.
*Monoteticoopolitetico,
questo aspetto si riferisceall'uso sequenzialeo simultaneo delle caratteris-
tiche degli elementi che si vanno classicando. Infatti, secondo la denizione
di Sokale Sneath, un insieme A si dice monotetico rispettoad un insieme di
proprietàP,seilpossessodell'insiemedelleproprietàPècondizionenecessaria
e suciente per l'appartenenza all'insieme A. L'insieme monotetico è quindi
un insieme compostoda elementi totalmente omogenei rispetto alle proprietà
costituenti P. In pratica unatale omogeneità rispettoad uninsieme sucien-
temente numeroso di proprietà scelte in funzione dell'indagine si verica solo
raramente ed è perciò risultato necessario rendere piùessibili i criteri ed in-
trodurre la nozione di insieme politetico. Un insieme A si dice politetico in
rapportoaP (insieme di proprietà),se ognioggettodi A possiede unnumero
sucientediproprietàdell'insiemeP,seogniproprietàdell'insiemePèattribui-
taadunnumerosucientementegrandedioggettidell'insiemeAese,perqual-
siasiproprietàdell'insiemeP, l'attribuzioneall'oggettodi questaproprietànon
è condizione necessaria per l'appartenenza dell'oggetto all'insieme A. Questa
denizione rendepossibile, dopoaverprecisato che cosasignichi "suciente-
mente grande",stabilireseA, insieme dato,èpolitetico rispettoall'insiemedi
proprietàP.L'insiemepoliteticoèquindiincertosensosucientementeomoge-
neorispettoaduninsiemedatodiproprietà,mamenoomogeneodiuninsieme
monotetico.
*Deterministicoostocastico,
chesiriferisceall'approccioutilizzatoperl'ottimizzazionedellaclassicazione
in atto. Questaottimizzazione sipuòottenere siausandotecnichetradizionali
cheattraversounaeuristicaricercanellospaziodeglistati.
*Incrementaleono,
inquantoquandoilsetdidaticoncuisilavoraègrandeediltempodianalisi
o quantità di memoria dedicata sono fattori vincolanti è necessario ridurre il
numerodiscansionidellevarieclassi. Conimetodideldataminingèpossibile
realizzarealgoritmidiclusteringconquestecaratterisiche.