• Non ci sono risultati.

Analisi dei Dati ed Estrazione della Conoscenza

N/A
N/A
Protected

Academic year: 2021

Condividi "Analisi dei Dati ed Estrazione della Conoscenza"

Copied!
1
0
0

Testo completo

(1)

Analisi dei Dati ed Estrazione della Conoscenza

Compito d'esame a.a. 2005/2006

Lo studente svolga (a scelta) una delle seguenti prove finali. Le prove possono anche essere svolte in  gruppi di due persone.

Prova finale 1

 1. Implementare in R il metodo di classificazione bayesiana naive per soli attributi categoriali. 

In pratica, si tratta di realizzare due funzioni:

 a) bayes.train(class, data) che calcola un modello di classificazione bayesiano dato  l'insieme di dati (fornito nel parametro data di tipo data frame) e l'indice dell'attributo  classe (fornito nel parametro class di tipo intero o stringa);

 b) bayes.predict(model, newdata) che classifica le nuove istanze fornite in newdata,  utilizzando il modello fornito in model. Il risultato deve comprendere, per ogni istanza,  la distribuzione di probabilità tra le possibili classi. Se in newdata è già presente 

l'attributo classe, utilizzarlo per calcolare il tasso di errore e la perdita quadratica medica.

 2. Testare l'implementazione con l'insieme di dati weather (la versione con attributi  categoriali) e controllare che i risultati siano gli stessi forniti da Weka con il metodo  NaiveBayesSimple.

Prova finale 2

 1. Leggere uno dei seguenti articoli (o combinazioni di articoli) a scelta:

 a) J. R. Quinlan. Learning with continuous classes. Proceedings of  AI'92.

Y. Wang, I. Witten. Inducing Model Trees for Continuous Classes. Proceedings of Poster  Papers, 9 th European Conference on Machine Learning.

 b) D.H. Fisher. Knowledge Acquisition Via Incremental Conceptual Clustering. Machine  Learning 2.

 2. Progettare e realizzare degli esperimenti in Weka (e/o in R)  che mostrino il funzionamento  dell'algoritmo studiato, evidenziandone i punti più importanti. Come minimo, è necessario  ripetere gli esperimenti presentati nell'articolo, discutendo eventuali incongruenze tra questi  e i risultati ottenuti in proprio.

 3. Scrivere una relazione sugli esperimenti compiuti.

Riferimenti

Documenti correlati

 Dunque anche la statistica fornisce basi tecniche al data mining, sia per il processo di costruzione di pattern che per il processo di verifica della validità di quest'ultimi. 

∀X ∈ Transazioni, compra(X, oggetto 1 ) ∧ compra(X, oggetto 2 ) ⇒ compra(X, oggetto 3 ) ; (b) al livello di granularit` a marca-categoria, elenca tutti gli itemset frequenti;?. (c)

Supponete che un data warehouse consista delle quattro dimensioni data, spettatore, luogo e spettacolo e delle due misure contatore e prezzo, dove prezzo ` e l’ammontare che

In quest’ultimo caso va anche consegnato qualunque prodotto atto a dimostrare che non vi siete copiati il risultato dal vicino (output del programma utilizzato, eventuali file che

In quest’ultimo caso va anche consegnato qualunque prodotto atto a dimostrare che non vi siete copiati il risultato dal vicino (output del programma utilizzato, eventuali file che

Supponendo di utilizzare l’algoritmo APriori per calcolare gli itemset frequenti, quali sono gli itemset candidati eliminati dai passi

Supponendo di utilizzare l’algoritmo APriori per calcolare gli itemset frequenti, determinare almeno un 3-itemset candidato eliminato durante il passo PRUNE e un 3-itemset

Come detto in precedenza, l’approssimazione delle trasformate di Fourier con- tinue con le trasformate discrete presenta dei problemi legati alle condizioni di calcolo: la funzione