CAPITOLO 2 DEFINIZIONE DEL PROBLEMA DI BUSINESS
2.2 Analisi della situazione
2.2.1 Le risorse a disposizione
Risorse umane
Il personale della CAAF-CISL con il quale siamo stati in contatto durante tutto lo sviluppo del progetto è composto da tre persone:
Chiara Basile: Area Organizzativa CAAF-CISL srl e tutore aziendale del progetto di tesi
Marco Bertoncelli: Area Tecnica CAAF-CISL srl, promotore del progetto di analisi ed esperto del dominio
Giancarlo Montepaone: esperto area informatica CAAF-CISL S.R.L.
I dati
Dato l‟obiettivo del progetto (profilazione nuovi clienti), il soggetto dell‟analisi (modello 730) e la durata temporale su cui basare il nostro studio (ultimi 5 anni), i dati messi inizialmente a disposizione sono stati i tracciati dei cinque database contenenti i dati dei modelli 730 compilati dal 2004 al 2008.
Naturalmente alle spalle di questi cinque documenti risiedono altrettante basi di dati alle quali però non abbiamo avuto accesso completo per ovvi motivi di privacy e sicurezza che saranno descritti in una delle sezioni successive.
Dopo una prima analisi, possiamo dire che i database in esame, sebbene abbiano una struttura leggermente diversa tra di loro, condividono molte caratteristiche in comune. Infatti ognuno di essi:
51
Ha una dimensione molto grande (tra i 15 ed i 25 GB)
Contiene circa 40 tabelle i cui attributi si contano in decine di centinaia Registra nei record delle proprie tabelle i dati di circa 300000 contribuenti
È associato ad una documentazione che indica per ogni tabella la lista dei suoi attributi con una breve descrizione ed il fomato dei dati che contiene.
Per quanto riguarda la tipologia di informazioni presenti nelle tabelle dei singoli database, queste si dividono in tre categorie:
I valori con cui sono stati riempiti i campi del modello 730
I parametri interni per il calcolo di deduzioni e detrazioni d‟imposta
I dati relativi ai documenti allegati al 730 (possono riferirsi a fabbricati, terreni, autocertificazioni ecc.)
Composizione database
La struttura di ogni database è lo specchio della struttura di un modello 730, quindi la composizione delle tabelle e dei loro attributi variano da DB a DB in base alle modifiche che ha subito il modello 730 negli anni.
Tuttavia la maggior parte delle modifiche nei modelli consistono in aggiunte di nuovi campi da compilare: la variazione del contenuto informativo dei database si può quindi vedere come una crescita incrementale negli anni.
Dal punto di vista strutturale, i cambi negli anni riguardano l‟aggiunta di nuove tabelle e il riposizionamento di dati in tabelle diverse da quelle in cui erano registrati in passato.
Mostriamo di seguito le tabelle presenti nei DB dei vari anni partendo da quelle con i dati del 2004. Proseguiremo descrivendo per gli altri DB solo le modifiche che sono state apportate rispetto all‟anno precedente.
Nome Database: CAAF_2004
Nome tabella Descrizione
DSt_431 Dati legge 431 sugli affitti degli immobili
DSt_ana Dati anagrafici dei contribuenti
DSt_aut Dati sulle autocertificazioni allegate ai modelli
DSt_br4 Acconti/eccedenze da dichiarazioni dell'anno precedente
DST_CON Contatore pratiche
DST_CUD Dati relativi ai modelli CUD dei contribuenti
DST_CUS Dettagli del sostituto d'imposta
DSt_dcd dettagli degli oneri per i quali è richiesta una descrizione
DSt_det Dettagli dei campi compilati e oneri CUD
DSt_dic Dati su alcuni campi compilati del modello
DSt_dqe Oneri e spese dei contribuenti (Quadro E)
52
DSt_fab Redditi da fabbricati (Quadro B)
DSt_fam Dati sui familiari a carico
DSt_fo4 Dati pratiche
DSt_fod Fondi dichiarati e non dedotti
DSt_ifa Dati di dettaglio dei fabbricati dichiarati
DSt_ite Dati di dettaglio dei terreni dichiarati
DSt_liq Dati del prospetto di liquidazione
DSt_nog Note sugli immobili
DSt_not Note sulle dichiarazione
DSt_par Parametri di sistema
DSt_pra Dati pratiche emesse dai sostituti d'imposta
DSt_pro Storico pratiche
DSt_quc Redditi da lavoro dipendente e assimilati (Quadro C)
DSt_qud Altri redditi dei contribuenti (Quadro D)
DSt_que Oneri e spese dei contribuenti (Quadro E)
DSt_quf Redditi a tassazione separata
DSt_rgs Numero righi e quadri compilati nelle dichiarazioni
DSt_si4 Dati di dettaglio dei sostituti d'imposta
DSt_sos Dati dei sostituti d'imposta
DSt_Tae Spese per il recupero del patrimonio edilizio
DSt_Tav Tabella di classificazioni interne
DSt_ter Redditi da terreni (Quadro A)
53 Nome Database: CAAF_2005
Tabelle aggiunte rispetto a CAAF_2004
Nome tabella Descrizione
DSt_aep Acconti/Eccedenze Anno precedente Acconti/Eccedenze Anno precedente
Dst_cre Credito utilizzato per la griglia di liquidazione
DSt_cur Dati relativi ai modelli CUD dei contribuenti
DSt_doc Documenti Allegati Documenti allegati alle dichiarazioni
DSt_rec Redditi Esteri dichiarati nel modello CUD
DSt_smc Oneri presentati nel modello CUD
Tabelle eliminate rispetto a CAAF_2004 Nome tabella
DSt_br4 DST_CUS DST_CUD DSt_fo4
Nome Database: CAAF_2006
Tabelle aggiunte rispetto a CAAF_2005
Nome tabella Descrizione
DST_VERIFICHE Contatori pratiche da segnalare
Tabelle eliminate rispetto a CAAF_2005 Nome tabella
54 Nome Database: CAAF_2007
Tabelle aggiunte rispetto a CAAF_2006
Nome tabella Descrizione
DST_Assicurazioni Dettaglio assicurazioni vita ed infortuni
DST_Comunicazioni Comunicazioni varie
DST_Mutui Dettaglio mutui
DST_OneriMutui Spese per mutui
DST_REDDITIESTERI Redditi esteri
DST_Ristrutturazioni Dettagli su ristrutturazioni
DST_TASSAZIONESEPARATA Redditi a tassazione separata
Tabelle eliminate rispetto a CAAF_2006 Nome tabella
DSt_quf
Nome Database: CAAF_2008
Tabelle aggiunte rispetto a CAAF_2007
Nome tabella Descrizione
DST_ContrattiAssicurazioni Dati di dettaglio sulle assicurazioni
DST_FamiliariBF Dati dei familiari per richiesta bonus fiscale
DST_RIGHIAUTOCERTIFICAZIONE Dati di dettaglio sulle autocertificazioni
Tabelle eliminate rispetto a CAAF_2007 Nessuna
55
Risorse software
Gli strumenti software che saranno utilizzati durante lo sviluppo del progetto sono i seguenti:
SQL Server Management Studio: per il caricamento, la consultazione e la creazione dei database: sia quelli messi a disposizione che quelli creati da noi durante il progetto SQL SERVER Integration Service (SSIS): per la fase di preparazione dei dati (ETL) SPSS Clementine 10.1: per il controllo di qualità dei dati e la realizzazione delle analisi di data mining