Esercitazione di Statistica Descrittiva
ESERCITAZIONE 2
I dati da esaminare (contenuti nel file cereal.txt) sono tratti dalla libreria on-line su http://lib.stat.cmu.edu/datasets/ e riguardano la rilevazione del rating assegnato da un gruppo di consumatori ai 77 tipi di cereali più venduti negli Stati Uniti d’America. Il dataset è completato da altre variabili relative alla composizione e alla tipo di commercializzazione dei diversi prodotti. Una breve descrizione dei dati in inglese, tratta dal sito stesso, è riportata di seguito.
Reference: Data available at many grocery stores Authorization: free use
Description: Data on several variable of different brands of cereal.
A value of -1 for nutrients indicates a missing observation.
Number of cases: 77 Variable Names:
Name: Name of cereal
mfr: Manufacturer of cereal where A = American Home Food Products;
G = General Mills; K = Kelloggs; N = Nabisco; P = Post; Q = Quaker Oats; R = Ralston Purina
type: cold or hot
calories: calories per serving
protein: grams of protein
fat: grams of fat
sodium: milligrams of sodium
fiber: grams of dietary fiber
carbo: grams of complex carbohydrates
sugars: grams of sugars
potass: milligrams of potassium
vitamins: vitamins and minerals - 0, 25, or 100, indicating the typical percentage of FDA recommended
shelf: display shelf (1, 2, or 3, counting from the floor)
weight: weight in ounces of one serving
cups: number of cups in one serving
rating: a rating of the cereals
1. Dopo aver effettuato una analisi descrittiva delle variabili quantitative principali, analizzate la correlazione tra le variabili quantitative. Ci sono correlazioni inattese?
2. Quali sono le componenti (calorie, proteine, …) che caratterizzano maggiormete I prodotti?
3. Quali sono le variabili sono più adatte a spiegare il gradimento del prodotto?