• Non ci sono risultati.

Le risorse a disposizione

CAPITOLO 2 DEFINIZIONE DEL PROBLEMA DI BUSINESS

2.2 Analisi della situazione

2.2.1 Le risorse a disposizione

Risorse umane

Il personale della CAAF-CISL con il quale siamo stati in contatto durante tutto lo sviluppo del progetto è composto da tre persone:

Chiara Basile: Area Organizzativa CAAF-CISL srl e tutore aziendale del progetto di tesi

Marco Bertoncelli: Area Tecnica CAAF-CISL srl, promotore del progetto di analisi ed esperto del dominio

Giancarlo Montepaone: esperto area informatica CAAF-CISL S.R.L.

I dati

Dato l‟obiettivo del progetto (profilazione nuovi clienti), il soggetto dell‟analisi (modello 730) e la durata temporale su cui basare il nostro studio (ultimi 5 anni), i dati messi inizialmente a disposizione sono stati i tracciati dei cinque database contenenti i dati dei modelli 730 compilati dal 2004 al 2008.

Naturalmente alle spalle di questi cinque documenti risiedono altrettante basi di dati alle quali però non abbiamo avuto accesso completo per ovvi motivi di privacy e sicurezza che saranno descritti in una delle sezioni successive.

Dopo una prima analisi, possiamo dire che i database in esame, sebbene abbiano una struttura leggermente diversa tra di loro, condividono molte caratteristiche in comune. Infatti ognuno di essi:

51

Ha una dimensione molto grande (tra i 15 ed i 25 GB)

Contiene circa 40 tabelle i cui attributi si contano in decine di centinaia Registra nei record delle proprie tabelle i dati di circa 300000 contribuenti

È associato ad una documentazione che indica per ogni tabella la lista dei suoi attributi con una breve descrizione ed il fomato dei dati che contiene.

Per quanto riguarda la tipologia di informazioni presenti nelle tabelle dei singoli database, queste si dividono in tre categorie:

I valori con cui sono stati riempiti i campi del modello 730

I parametri interni per il calcolo di deduzioni e detrazioni d‟imposta

I dati relativi ai documenti allegati al 730 (possono riferirsi a fabbricati, terreni, autocertificazioni ecc.)

Composizione database

La struttura di ogni database è lo specchio della struttura di un modello 730, quindi la composizione delle tabelle e dei loro attributi variano da DB a DB in base alle modifiche che ha subito il modello 730 negli anni.

Tuttavia la maggior parte delle modifiche nei modelli consistono in aggiunte di nuovi campi da compilare: la variazione del contenuto informativo dei database si può quindi vedere come una crescita incrementale negli anni.

Dal punto di vista strutturale, i cambi negli anni riguardano l‟aggiunta di nuove tabelle e il riposizionamento di dati in tabelle diverse da quelle in cui erano registrati in passato.

Mostriamo di seguito le tabelle presenti nei DB dei vari anni partendo da quelle con i dati del 2004. Proseguiremo descrivendo per gli altri DB solo le modifiche che sono state apportate rispetto all‟anno precedente.

Nome Database: CAAF_2004

Nome tabella Descrizione

DSt_431 Dati legge 431 sugli affitti degli immobili

DSt_ana Dati anagrafici dei contribuenti

DSt_aut Dati sulle autocertificazioni allegate ai modelli

DSt_br4 Acconti/eccedenze da dichiarazioni dell'anno precedente

DST_CON Contatore pratiche

DST_CUD Dati relativi ai modelli CUD dei contribuenti

DST_CUS Dettagli del sostituto d'imposta

DSt_dcd dettagli degli oneri per i quali è richiesta una descrizione

DSt_det Dettagli dei campi compilati e oneri CUD

DSt_dic Dati su alcuni campi compilati del modello

DSt_dqe Oneri e spese dei contribuenti (Quadro E)

52

DSt_fab Redditi da fabbricati (Quadro B)

DSt_fam Dati sui familiari a carico

DSt_fo4 Dati pratiche

DSt_fod Fondi dichiarati e non dedotti

DSt_ifa Dati di dettaglio dei fabbricati dichiarati

DSt_ite Dati di dettaglio dei terreni dichiarati

DSt_liq Dati del prospetto di liquidazione

DSt_nog Note sugli immobili

DSt_not Note sulle dichiarazione

DSt_par Parametri di sistema

DSt_pra Dati pratiche emesse dai sostituti d'imposta

DSt_pro Storico pratiche

DSt_quc Redditi da lavoro dipendente e assimilati (Quadro C)

DSt_qud Altri redditi dei contribuenti (Quadro D)

DSt_que Oneri e spese dei contribuenti (Quadro E)

DSt_quf Redditi a tassazione separata

DSt_rgs Numero righi e quadri compilati nelle dichiarazioni

DSt_si4 Dati di dettaglio dei sostituti d'imposta

DSt_sos Dati dei sostituti d'imposta

DSt_Tae Spese per il recupero del patrimonio edilizio

DSt_Tav Tabella di classificazioni interne

DSt_ter Redditi da terreni (Quadro A)

53 Nome Database: CAAF_2005

Tabelle aggiunte rispetto a CAAF_2004

Nome tabella Descrizione

DSt_aep Acconti/Eccedenze Anno precedente Acconti/Eccedenze Anno precedente

Dst_cre Credito utilizzato per la griglia di liquidazione

DSt_cur Dati relativi ai modelli CUD dei contribuenti

DSt_doc Documenti Allegati Documenti allegati alle dichiarazioni

DSt_rec Redditi Esteri dichiarati nel modello CUD

DSt_smc Oneri presentati nel modello CUD

Tabelle eliminate rispetto a CAAF_2004 Nome tabella

DSt_br4 DST_CUS DST_CUD DSt_fo4

Nome Database: CAAF_2006

Tabelle aggiunte rispetto a CAAF_2005

Nome tabella Descrizione

DST_VERIFICHE Contatori pratiche da segnalare

Tabelle eliminate rispetto a CAAF_2005 Nome tabella

54 Nome Database: CAAF_2007

Tabelle aggiunte rispetto a CAAF_2006

Nome tabella Descrizione

DST_Assicurazioni Dettaglio assicurazioni vita ed infortuni

DST_Comunicazioni Comunicazioni varie

DST_Mutui Dettaglio mutui

DST_OneriMutui Spese per mutui

DST_REDDITIESTERI Redditi esteri

DST_Ristrutturazioni Dettagli su ristrutturazioni

DST_TASSAZIONESEPARATA Redditi a tassazione separata

Tabelle eliminate rispetto a CAAF_2006 Nome tabella

DSt_quf

Nome Database: CAAF_2008

Tabelle aggiunte rispetto a CAAF_2007

Nome tabella Descrizione

DST_ContrattiAssicurazioni Dati di dettaglio sulle assicurazioni

DST_FamiliariBF Dati dei familiari per richiesta bonus fiscale

DST_RIGHIAUTOCERTIFICAZIONE Dati di dettaglio sulle autocertificazioni

Tabelle eliminate rispetto a CAAF_2007 Nessuna

55

Risorse software

Gli strumenti software che saranno utilizzati durante lo sviluppo del progetto sono i seguenti:

SQL Server Management Studio: per il caricamento, la consultazione e la creazione dei database: sia quelli messi a disposizione che quelli creati da noi durante il progetto SQL SERVER Integration Service (SSIS): per la fase di preparazione dei dati (ETL) SPSS Clementine 10.1: per il controllo di qualità dei dati e la realizzazione delle analisi di data mining