1.7. C ONSIDERAZIONI CONCLUSIVE
3.3.7. Parametri relativi alle regole
Come nel caso dell’approccio classico si possono definire una serie di paramenti che valutano varie caratteristiche delle regole. Se definiamo l’insieme delle f(x,qi) rq i, f(x,qi)
≺
rq i in S={U,Q,V,f} come For(Q) allora per ogni Φ∈For(Q) si può definirecon ||Φ||S l’insieme di tutti gli x∈U che soddisfano Φ:
⎭ ⎬ ⎫ ⎩ ⎨ ⎧ ∈ = = S i qi S qi i) r x U: f(x,q ) r q f(x, ≺ Φ ≺
Ne consegue quindi che una regola decisionale in U è un’espressione del tipo
Φ→Ψ, (leggasi if Φ then Ψ) dove Φ∈For(C) e Ψ∈For(D) con C e D criteri
condizionali e classi decisionali. Φ e Ψ si riferiscono quindi alle condizioni, o parte condizionale, e rispettivamente decisione, o parte decisionale, di una regola. Indicando sempre con |⋅| la cardinalità, ovvero il numero di oggetti di un insieme, è definito come support (supporto) di una regola in S=(U,C,D) il numero:
(
,) ( )
supp S Φ Ψ = Φ S ∧ Ψ S
Per ogni regola si può definire la probabilità che un insieme soddisfi la parte condizionale e decisionale di una regola. Questo valore è detto anche certainty factor e
vale:
(
,) ( )
p( ) ( ( ) )
cer S S S S S U S S Φ Ψ Φ Φ Ψ Φ Ψ π Ψ Φ = = = ∧Questo coefficiente, chiamato usualmente confidence coefficent o confidence level
nei processi di data mining, è pari ad 1 se e solo se la regola è vera su tutto S. questo
implica che se πS(Ψ|Φ)=1, allora la regola Φ→Ψ è una regola certa; se invece 0< πS(Ψ|Φ)<1, ci si riferisce ad una regola possibile o incerta.
D’altro lato è possibile definire un altro coefficiente detto coverage factor, con
notazione covS(Φ,Ψ) definito come:
(
,) ( ) ( ) ( ( ) )
cov S S S S S S S S Ψ Ψ Φ Ψ Φ π Ψ Φ π Ψ Φ = = = ∧Il certainty factor di una regola può essere interpretato come la frequenza di oggetti
che soddisfano la proprietà Ψ nell’insieme di quelli che soddisfano la proprietà Φ, mentre il coverage factor come la frequenza degli oggetti con la proprietà Φ nell’insieme degli oggetti che hanno proprietà Ψ, all’interno dell’universo S. Infine si può definire il numero:
(
ΦΨ) (
ΦΨ) (
ΦΨ) ( )
π Φ σ S S S S cer , U , supp , = = ⋅chiamato strength della regola decisionale, e rappresenta la frequenza degli oggetti che
soddisfano la regola nella parte condizionale e decisionale sulla totalità degli oggetti dell’universo.
3.4. S
P E C IF I C A Z I O N ED
ELM
O D E L L ONell’iter per la costruzione del modello di scelta, ed in particolare di scelta modale, va affrontata ora l’esplicitazione della tipologia d’approccio, la scelta degli attributi, la quantificazione degli stessi, la procedura per l’ottenimento dei risultati, e tutto quanto concerne il raggiungimento di questi obiettivi. In questa fase, ovvero la specificazione dei modelli, sono fissati tutti i paletti necessari per la realizzazione dello stesso. Trattandosi di un approccio non utilizzato in precedenza per i modelli di scelta modale, l’utilizzo del DRSA richiede varie fasi specifiche, come abbiamo visto nel capitolo precedente, che possono però essere ricondotte alla specificazione generale dei modelli. Essendo poi queste tipologie di approcci che seguono procedimenti particolari non sviluppati per questo tipo di problemi, sarà inoltre necessario effettuare delle assunzioni anche pesanti sulla procedura
Innanzitutto però sarà necessario esplicitare quella che è la decision table, ovvero la
tabella delle decisioni che è utilizzata per il calcolo delle approssimazioni da cui derivano le regole decisionali. In particolare va deciso per la definizione dei criteri che tipo di approccio di scelta utilizzare, se un approccio aggregato come in precedenza oppure disaggregato. Una volta fatto ciò saranno definiti naturalmente i criteri e le classi di scelta. È opportuno ricordare che con il DRSA non è necessaria la discretizzazzione dei modelli e che è possibile operare congiuntamente con attributi continui e discreti. Inoltre gli attributi discreti, anche non numerici, possono non avere una relazione d’ordine con le classi di scelta, permettendo così di operare nello stesso ambito dell’approccio classico.
Per quanto riguarda proprio le classi di scelta, andrà fatta un’assunzione forte proprio per poter applicare il metodo al problema della scelta modale. Infatti, L’approccio tramite criterio di dominanza si fonda sul principio che le classi di scelta devono poter essere ordinabili secondo un criterio di preferenza, per permettere la loro divisione in unioni superiori e inferiori delle classi. Senza tale ordinamento il metodo non può essere direttamente applicato, e questo fatto genera delle complicazioni applicative.
3.4.1. Decision Table
È la raccolta in forma opportuna di tutti i dati rilevati per la scelta di una alternativa. In questo caso è composta da un lato dalle caratteristiche che identificano le alternativa, il decisore o altre caratteristiche oggetto di studio, e che sono le ragioni per le quali si suppone venga effettuata proprio quella scelta. Nel caso specifico della scelta modale ovviamente lato decisionale vi è la scelta del modo di trasporto, lato condizionale tutti gli attributi che governano tale scelta del modo. Come trattato nella parte metodologica, c’è da fare una considerazione molto importante: per l’applicazione del metodo e l’individuazione delle unioni delle classi, è assolutamente necessario che esista una classificazione ordinale fra le classi di scelta, ovvero che le scelte possibili siano ordinate secondo la loro “preferibilità”. Ma questo non è possibile per quanto riguarda le alternative di trasporto, in quanto non si può asserire con certezza e per ogni decisore che un’alternativa sia migliore delle altre.
È necessaria quindi un’assunzione forte relativa alla scelta, e in altre parole che la scelta di un modo di trasporto piuttosto che un altro implichi che venga esercitata dal decisiore, in questo caso l’utente del sistema dei trasporti, la propria volontà scegliendo il modo a lui più congegnale e che automaticamente esprima una “non-scelta” degli altri, reputandoli peggiori. Quindi un attributo che viene rappresentato come un costo nel modelli classici risulterà un criterio con una relazione d’ordine negativa rispetto alla scelta del modo di trasporto cui è riferito, mentre rappresenterà una relazione d’ordine positiva per la “non-scelta” di quel modo; viceversa dicasi per un attributo normalmente considerato come un beneficio. Quindi l’assunzione teorica da farsi è quella di considerare la scelta o la non-scelta di un modo di trasporto come classificazione delle alternative per la scelta modale
Come premesso vi è ancora da operare una decisione dal punti di vista metodologico fondamentale: la scelta del tipo di approccio con cui esplicitare la decision table, ovvero se operare a livello aggregato o disaggregato. Per quanto detto in precedenza
è il decisore che opera la scelta di un modo di trasporto, e quindi la scelta più naturale in questo caso è quella di operare in campo disaggregato. Sarà pertanto opportuno andare alla ricerca dei set di regole decisionali, come sintetizzazione delle scelte dei singoli utenti, e che permetteranno di valutare anche le percentuali di scelta modale.
Vista la disponibilità dei dati e la scelta di questo tipo di approccio, sarà quindi possibile utilizzare anche le caratteristiche soggettive degli utenti, e pertanto confrontare i risultati con quelli ottenuti con i modelli Logit disaggregati. Di seguito vedremo quello che però comporta, in termini computazionali, la scelta di queste assunzioni sia e soprattutto lato decisionale che lato condizionale. È da sottolineare ancora una volta il fatto che queste “forzature logiche” al metodo nascono sempre dal fatto che tale approccio, pur essendo molto versatile dal punto di vista teorico, è stato sviluppato per un’applicazione ad un campo molto diverso da quello trattato, ovvero quello dell’analisi multicriteriale. Quindi tali scelte operative, che saranno descritte in seguito, sono necessarie, volendo applicare questo metodo. Comunque, anche se le procedure non sono quelle solite, quanto supposto e descritto in precedenza è una valida motivazione anche dal punto di vista logico per quanto riguarda le operazioni effettuate in seguito, ed in particolare per la fase di estrazione delle regole e soprattutto di applicazione delle stesse.