• Non ci sono risultati.

Data Science e Tecnologie per le Basi di Dati Homework 1

N/A
N/A
Protected

Academic year: 2021

Condividi "Data Science e Tecnologie per le Basi di Dati Homework 1"

Copied!
1
0
0

Testo completo

(1)

Data Science e Tecnologie per le Basi di Dati Homework 1

Una societ`a di produzione televisiva vuole analizzare alcune statistiche riguardanti un famoso programma di musica italiana. Nel corso degli ultimi 30 anni la societ`a ha memorizzato in un database informazioni riguardanti il televoto dei propri telespettatori. Si supponga di utilizzare la base dati per realizzare un data warehouse ed analizzare i trend riguardanti l’attivit`a dei telespettatori negli anni.

L’analisi ha come obiettivo quello di analizzare statistiche separatamente per i partecipanti che concorrono nel pro- gramma. Per ogni partecipante si memorizzano il nome, e la citt`a di residenza (o fondazione per i gruppi). Si consideri il nome del partecipante come univoco nella base dati.

I voti in favore di ogni partecipante vengono conferiti dai telespettatori. Per i telespettatori sono note la fascia di et`a (18-25, 25-30, 30-50, >50), il sesso, la categoria (‘giuria esperti’ oppure ‘pubblico’) ed il luogo di residenza.

Il sistema memorizza la data e l’orario in cui vengono espresse le votazioni. L’orario viene registrato nel formato

‘hh:mm’ (ora, minuti). E’ inoltre nota la modalit`a di voto (Telefono, Facebook, Instagram, Sito Web del programma).

Ogni voto `e associato ad un’edizione del programma (es: ‘2018’, ‘2019’, ...). Il programma si svolge nel mese di Febbraio. Siccome `e possibile votare solo per l’edizione in corso, l’anno in cui viene espresso il voto corrisponde all’anno dell’edizione. Infine per ogni edizione `e noto il nome del conduttore.

Le statistiche verranno e↵ettuate sul numero di voti e↵ettuati, sul voto medio assegnato e sugli incassi ottenuti dalla produzione tramite l’introduzione di pubblicit`a nelle applicazioni usate per il voto. Il valore di un voto `e un numero compreso nell’intervallo 0-5. L’analisi deve essere condotta considerando le seguenti informazioni:

• Nome partecipante, citt´a, provincia, regione

• Fascia et´a, sesso del telespettatore, citt´a, provincia, regione

• Categoria telespettatore

• Data e giorno della settimana in cui ´e stato e↵ettuato il voto

• Orario (es: 22.15), ora del giorno (1-24) in cui ´e stato e↵ettuato il voto

• Modalit´a di voto (Facebook, Instagram, Telefono)

• Edizione (es: ‘2018’, ‘2019’, ...)

• Conduttore edizione Homework tasks

1. Progettare il data warehouse in modo da soddisfare le richieste descritte nelle specifiche del problema. Disegnare lo schema concettuale del datawarehouse e definire lo schema logico (tabelle dei fatti e delle dimensioni).

2. Esprimere le due interrogazioni seguenti utilizzando il linguaggio SQL esteso.

(a) Considerare i voti e↵ettuati mediante la piattaforma ‘Instagram’. Separatamente per edizione e citt´a del telespettatore, calcolare:

i. il totale cumulativo degli incassi ottenuti durante le varie edizioni

ii. la percentuale di incassi apportati da telespettatori di una citt´a rispetto al totale degli incassi iii. l’incasso medio giornaliero

(b) Considerare le edizioni svolte tra il 2000 ed il 2010. Separatamente per edizione eseguire le seguenti analisi:

i. il numero totale di voti

ii. la percentuale del numero di voti di ogni partecipante rispetto al numero di voti totale iii. assegnare un rank ai partecipanti per voto medio (0-5) decrescente

Riferimenti

Documenti correlati

Per ogni edificio, per ogni fascia climatica e per ogni fascia oraria del giorno (mattino, pomeriggio, sera, notte), calcolare il consumo medio orario. Confrontarlo (effettuare

(a) Si deve aggiornare nella tabella TOTALE VENDITE LIBRERIA il numero complessivo di copie del libro vendute presso la libreria e l’importo complessivamente incassato dalla

(a) Per ogni tipologia di servizio e considerando solo il volume d’affari del 2009, visualizzare per ogni filiale e quadrimestre, il volume d’affari totale, il numero totale

(b) Per ogni team e per ogni mese, calcolare in media quante righe di codice sono state aggiunte ad ogni commit, separatamente per ogni combinazione di tipo di commit (bugfix,

(a) Calcolare la percentuale di maschi rispetto al totale delle persone riconosciute (inclusi bambini) e la percentuale di femmine rispetto al totale delle persone riconosciute

• Incassi e numero di chiamate effettuate su base mensile in funzione della provincia e della regione nella quale si trova l'apparecchio del chiamante.. • Incassi e numero

Cambiare l’attributo di classe all’interno tra le “Data set metadata information” da “Service Class” a “Native Country” (altrimenti, rieseguire l’intero processo di

Verificare il funzionamento del trigger inserendo dei record nella tabella TICKETS in modo da far cambiare status a un cliente. • inserire uno o più biglietti per