Riepilogo delle principali funzioni Excel utilizzate - Prof. Raffaella Folgieri Email
←
→
Trascrizione del contenuto della pagina
Se il tuo browser non visualizza correttamente la pagina, ti preghiamo di leggere il contenuto della pagina quaggiù
Riepilogo delle principali funzioni Excel utilizzate Prof. Raffaella Folgieri Email folgieri@mtcube.com Prof. Folgieri – aa 2008/09
Come usare questa guida Le funzioni presenti in queste slide sono quelle viste a lezione e utili sia per la risuluzione degli esercizi, sia ai fini della certificazione IT4PS In alto a destra è riportato (riquadro colorato) il riferimento della lezione in cui la funzione è stata trattata per la prima volta) Inizialmente vengono introdotti alcuni argomenti di utilità generale e di base per poter utilizzare al meglio tutte le funzioni avanzate di Escel viste durante il corso. E’ riportato sia il nome della funzione in Italiano sia quello in Inglese, così che ciascuno possa scegliere, a seconda della versione di Excel che utilizza. Prof. Folgieri – aa 2008/09
Argomento generale Formattazione celle Formattazione del testo e dei singoli caratteri (dal menu Formato): Orientamento a 45˚ Allineamento orizzontale al centro Protezione: bloccata o nascosta (per le formule) Controllo testo: testo a capo Prof. Folgieri – aa 2008/09
Argomento generale Formattazione celle Formattazione condizionale (Conditional Formatting) (dal menu Formato): Prof. Folgieri – aa 2008/09
Argomento generale Le formule Le formule iniziano con l’operatore = Possono contenere: 1.Costanti(numeri o stringhe) 2.Riferimenti(indirizzi di celle, es. A1) 3.Funzioni(operazioni predefinite) Vengono aggiornate automaticamente quando le celle cui fanno riferimento vengono modificate Prof. Folgieri – aa 2008/09
Argomento generale I riferimenti relativi Si adeguano in relazione alle celle di partenza quando si copia o si sposta una formula Prof. Folgieri – aa 2008/09
Argomento generale I riferimenti assoluti Non comportano nessun adeguamento durante la copia della formula Rif. assoluto: =$A$1 Rif. misto: =$A4 Rif. misto: =A$7 Copia della formula =A$7 nelle celle adiacenti Prof. Folgieri – aa 2008/09
Argomento generale Le funzioni Sono caratterizzate da un nome,un elenco di argomenti (arg1;arg2;…), restituiscono un valorenella cella ospitante Prof. Folgieri – aa 2008/09
Argomento generale Inserimento di una funzione Manualmente: ogni formula è preceduta dal simbolo = e vengono utilizzati o i nomi di funzione (se noti) oppure i simboli matematici usuali (*,+,/,- ). Vengono utilizzate le parentesi per indicare l’ordine di svolgimento dei calcoli. In modo guidato: dal menu Inserisci/formula, trovando la formula desiderata e seguendo le indicazioni (help) di Excel per inserire gli argomenti necessari. Prof. Folgieri – aa 2008/09
Argomento generale Completamento automatico Se la stessa formula deve essere riportata lungo tutta una colonna (o una riga): Una volta inserita la formula, se selezionate la casella, a lato, in basso a destra, compare un puntino (maniglia) Click e, tenendo premuto il pulsante sinistro del mouse (modalità drag and drop), trascinare la formula sulle caselle desiderate. Excel riporterà la formula aggiornando (vedere riferimenti relativi ed assoluti) tutti i riferimento. Prof. Folgieri – aa 2008/09
Argomento generale Esempi Prof. Folgieri – aa 2008/09
Argomento generale Operatori Simbolo Tipo Esempi +-* 3+2, 6-1, 4*5, 8/2 aritmetici / 20%, 10^2, 10*10 =% > ^ < A1=B1, A1=>B1, confronto =>
Argomento generale Calcoli in forma di matrice La cella C16 contiene la formula in forma di matrice la quale trova le celle nell'intervallo C5:C14 contenenti il testo Europa, quindi calcola la media delle celle corrispondenti nell'intervallo D5:D14. Una Formula in forma di matrice esegue più calcoli su uno o più insiemi di valori e restituisce un unico risultato o più risultati. Le formule in forma di matrice vengono immesse premento CTRL+MAIUSC+INVIO. Prof. Folgieri – aa 2008/09
Argomento generale Riferimento a fogli e cartelle E’ un modo per semplificare modelli complessi in più cartelle di lavoro tra loro dipendenti Per collegare formule in altri fogli di lavoro vengono usate due sintassi: con parantesi [] (aperto) o senza (chiuso) Prof. Folgieri – aa 2008/09
Argomento generale Inserimento di un Grafico (menu Inserisci) Prof. Folgieri – aa 2008/09
Argomento generale Intervallo dei dati Per selezionare le celle che contengono i dati a partire dai quali si intede realizzare il grafico. Nel nostro caso le serie sono i valori rilevati per i vari inquinanti. Quindi i dati relativi alle serie sono qulli compaiono nelle colonne. Prof. Folgieri – aa 2008/09
Argomento generale Per dare il nome alle serie Si seleziona la cella che contiene il nome dell’inquinante a cui la serie corrisponde. Prof. Folgieri – aa 2008/09
Argomento generale Titoli del grafico Prof. Folgieri – aa 2008/09
Argomento generale Posizionare la legenda Prof. Folgieri – aa 2008/09
Argomento generale Posizionare il grafico Il grafico può essere posizionato nello stesso foglio che contiene i dati o in un foglio a parte. Prof. Folgieri – aa 2008/09
Argomento generale Dimensionare e posizionare Prof. Folgieri – aa 2008/09
Argomento generale Dimensionare e posizionare • Spostare: premere il tasto sinistro quando il cursore è sull’area del grafico e, tenedolo premuto, trascinare il grafico. • Dimensionare: – selezionare il grafico; – posizionare il cursore su uno dei quadratini che compaiono sulla cornice; – compare una freccia che indica il verso del dimensionamento; – premere il tasto sinistro e, tenedolo premuto, spostarlo nella direzione in cui si vuole modificare la dimensione. Prof. Folgieri – aa 2008/09
Argomento generale Modificare un grafico Posizionare il cursore sul grafico. Premere il tasto destrodel mouse. Si apre un menù contestuale, che fornisce i comandi per modificare le varie proprietà di un grafico. Prof. Folgieri – aa 2008/09
Argomento generale Aggiornamento in tempo reale • Le formule e i grafici vengono aggiornati in tempo reale. • Se vengono modificati i valori rilevati dalle centraline, vengono aggiornati media, allarmi,… e i grafici. Prof. Folgieri – aa 2008/09
Argomento generale Come creare un modello a partire da un foglio Excel • Se vogliamo conservare un foglio in cui abbiamo posto particolari funzioni per ulteriori usi futuri, ma, ad eempio, considerando dati diversi, possiamo creare un MODELLO. I passi da compiere sono i seguenti • Selezionare la voce SALVA CON NOME (SAVE AS) dal menu FILE Scegliere (nella tendina TIPO DI FILE) la voce MODELLO. Prof. Folgieri – aa 2008/09
Argomento generale Presentazione dei dati • Per presentare i dati (contenuti nel foglio) in un modo più chiaro o per evidenziarne la struttura, selezionare la voe FORMATTAZIONE AUTOMATICA dal menu FORMATO. E’ possibile scegliere tra vari formati predefiniti messi a disposizione da Excel. Prof. Folgieri – aa 2008/09
Argomento generale Analisi e valutazione delle formule Se si desidera analizzare le formule contenute in un foglio Excel, è possibile scegliere Verifica Formule dal menu Strumenti, e selezionare l’opzione MOSTRA BARRA DELLE FORMULE: Per vedere dove sono le formule, selezionare STRUMENTI/OPZIONI e VISUALIZZA-FORMULE Ora, se si seleziona una cella contenente una formula, attraverso il bottone INDIVIDUA PRECEDENTI, si ottiene la visualizzazione di tutte le celle coinvolte nel calcolo. Prof. Folgieri – aa 2008/09
Argomento generale Analisi e valutazione delle formule Allo stesso modo, è possibile individuare le celle dipendenti e chiedere ad Excel di evidenziare le celle contenenti i dati non validi o mostrare una finestra in cui seguire la valutazione passo-passo dei risultati della formula. Prof. Folgieri – aa 2008/09
Argomento generale Import di dati E’ possibile importare in Excel dati provenienti da altre fonti (ad es, database trovati in internet, fogli di testo. Per fare ciò, sono possibili due strade: 1. Aprire il file dei dati dal menu FILE/Open, ma, nonostante Excel possa “aprire” molti tipi di file, non sempre questa operazione è possibile (tipo di file non riconosciuto) o conveniente (non vengono conservate le formattazioni o il tipo di valore contenuto nel campo) 2. Sceglere l’opzione IMPORTA DATI ESTERNI/IMPORTA DATI dal menu DATI. Comparirà la procedura guidata che ci permetterà di indicare il separatore tra i record (spesso il carattere di tabulazione, lo spazio, la virgola o il punto e virgola), fino all’inserimento dei dati nel foglio di lavoro. Prof. Folgieri – aa 2008/09
Argomento generale TABELLA MONOVARIATA • Struttura di una tabella monovariata (che dipende da un solo parametro): Prof. Folgieri – aa 2008/09
Argomento generale TABELLA BIVARIATA • Struttura di una tabella bivariata (che dipende da due parametri, rif. tabella pivot): Prof. Folgieri – aa 2008/09
LEZIONE 1 Sintassi della funzione SE (IF) •La funzione SE prende come argomenti: •Una condizione •Il valore da restituire se la condizione è soddisfatta •Il valore da restituire se la condizione non è soddisfatta •Sintassi:=SE(condizione;valore_SE_si;valore_SE_no) •Il valore restituito dalla funzione può essere un numero oppure testo o un valore di errore (#VALORE!) Per inserire più criteri, si utilizzano gli operatori logici AND, che richiede che le due (o più) condizioni siano soddisfatte (vere) contemporameneamente, oppure OR (almeno una delle due, o più, condizioni deve essere vera) Prof. Folgieri – aa 2008/09
LEZIONE 1 Finestra della formula Nidificazione delle funzioni (max 7 livelli) (Il valore restituito da una funzione deve essere un parametro valido per l’altra) Prof. Folgieri – aa 2008/09
LEZIONE 1 Sintassi della funzione TASSO (RATE) •La funzione TASSO prende come argomenti: •Periodi: numero totale dei periodi di pagamento in un'annualità •Pagam: pagamento effettuato in ciascun periodo. Non può variare nel corso dell'annualità. In genere, pagam include il capitale e gli interessi, ma non altre imposte o spese. Se si omette pagam, sarà necessario includere l'argomento val_futuro. •Val_attuale: il valore attuale o la somma forfettaria che rappresenta il valore attuale di una serie di pagamenti futuri. •Val_futuro: il valore futuro o il saldo in contanti che si desidera raggiungere dopo aver effettuato l'ultimo pagamento. Se val_futuro è omesso, verrà considerato uguale a 0. Il valore futuro di un prestito, ad esempio, sarà uguale a 0. •Tipo: corrisponde a 0 o a 1 e indica le scadenze dei pagamenti Impostare tipo a 0 (oppure omettere) se i pagamenti devono essere effettuati alla fine del periodo. Impostare tipo a 1 se devono essere effettuati all’inizio del periodo. •Ipotesi è l'ipotesi del valore del tasso. Se ipotesi è omesso, verrà considerato uguale a 10%. Se i risultati di TASSO non convergono, provare a utilizzare dei valori differenti per ipotesi. In genere, i risultati di TASSO convergono se ipotesi è compreso tra 0 e 1. Prof. Folgieri – aa 2008/09
LEZIONE 1 Finestra della formula Prof. Folgieri – aa 2008/09
LEZIONE 1 Sintassi della funzione ASS (ABS) •Restituisce il valore assoluto di un valore •La funzione ASS prende come argomenti: •Numero: casella in cui indicare il numero o la cella di cui si vuole conoscere il valore assoluto. Può contenere anche un’operazione di cui si desidera il risultato in valore assoluto. Prof. Folgieri – aa 2008/09
LEZIONE 1 Finestra della formula Prof. Folgieri – aa 2008/09
LEZIONE 1 Sintassi della funzione ASS (ABS) •Restituisce il valore assoluto di un valore •La funzione ASS prende come argomenti: •Numero: casella in cui indicare il numero o la cella di cui si vuole conoscere il valore assoluto. Può contenere anche un’operazione di cui si desidera il risultato in valore assoluto. Prof. Folgieri – aa 2008/09
LEZIONE 1 Finestra della formula Prof. Folgieri – aa 2008/09
LEZIONE 1 Sintassi della funzione MIN (MIN) •Restituisce il valore minimo di un insieme di valori (ignorando I valori logici o testuali) •La funzione ASS prende come argomenti: •L’intervallo di celle in cui si desidera trovare il valore minimo. Prof. Folgieri – aa 2008/09
LEZIONE 1 Finestra della formula Prof. Folgieri – aa 2008/09
LEZIONE 2 Sintassi della funzione SOMMA (SUM) •Restituisce la somma dei valori considerati •I valori si possono sommare direttamente ponendo nella cella di destinazione del risultato il riferimento alle celle, sommate tra loro con il simbolo di somma (+) •In alternativa si usi la funzione di SOMMA AUTOMATICA, selezionabile dal menu dei bottoni (il sigma maiuscolo, ovvero il simbolo di sommatoria) oppure la funzione SOMMA dal menu INSERISCI/FUNZIONE •La funzione ASS prende come argomenti: •L’intervallo di celle di cui si desidera ottenere la somma. Prof. Folgieri – aa 2008/09
LEZIONE 2 Finestra della formula Prof. Folgieri – aa 2008/09
LEZIONE 2 La funzione sum if (somma se) • La funzione SUMIF serve per sommare tra loro i dati solo se soddisfano una certa condizione • Vediamo come si comporta nell’esempio riportato qui sotto: Prof. Folgieri – aa 2008/09
LEZIONE 2 La funzione sum if (somma se) • SOLUZIONE • Dovete scrivere la formula =SOMMA.SE(D5:D11;">100";D5:D11) • (SUMIF se avete excel in Inglese) • La formula fornisce il risultato: Prof. Folgieri – aa 2008/09
LEZIONE 3 TABELLE PIVOT (1) • Sono strumenti flessibili per analizzare grandi quantità di dati • Provate a immaginare di avere i dati riportati nella tabella a fianco, e di dover rispondere a domande del tipo: - Che quantità di A è stata spedita a Febbraio? - Cosa ha ricevuto il cliente Rossi? - Che quantità di C ha ricevuto Bianchi - Che quantità in totale è stata spedita di C? • Bisogna organizzare i dati secondo più dimensioni, utilizzando la TABELLA PIVOT Prof. Folgieri – aa 2008/09
LEZIONE 3 TABELLE PIVOT (2) In Italiano menu DATi, voce RAPPORTO TABELLA PIVOT e GRAFICO PIVOT… Prof. Folgieri – aa 2008/09
LEZIONE 3 TABELLE PIVOT (3) Seguite le indicazioni del wizard… 1. Se la fonte dei dati è lo stesso foglio Excel, è sufficiente cliccare su AVANTI… 2. selezionate tutta l’area dati (comprese le intestazioni delle colonne) 3. Ora occorre definire il layout (tramite il bottone LAYOUT Prof. Folgieri – aa 2008/09
LEZIONE 3 TABELLE PIVOT (4) Prof. Folgieri – aa 2008/09
LEZIONE 3 TABELLE PIVOT (5) Disponiamo le colonne come risulta qui sotto: 4. Date OK 5. poi FINE Prof. Folgieri – aa 2008/09
LEZIONE 3 TABELLE PIVOT (6) Prof. Folgieri – aa 2008/09
LEZIONE 3 TABELLE PIVOT (7) Ecco il risultato nel nostro esempio: Prof. Folgieri – aa 2008/09
LEZIONE 3 TABELLE PIVOT (8) Prof. Folgieri – aa 2008/09
LEZIONE 3 TABELLE PIVOT (9) Prof. Folgieri – aa 2008/09
LEZIONE 3 TABELLE PIVOT (10) FILTRO DI PAGINA: Prof. Folgieri – aa 2008/09
LEZIONE 3 TABELLE PIVOT (tipo di dato rappresentato) Prof. Folgieri – aa 2008/09
LEZIONE 3 TABELLE PIVOT (altre viste) Prof. Folgieri – aa 2008/09
LEZIONE 3 La funzione SINISTRA (LEFT) • Opera su una cella contentente caratteri, date o numeri. Permette di selezionare il numero di caratteri specificato a sinistra della cella. Nell’esempio, la cella originale contiene il testo “si pensa di no” Con la funzione SINISTRA viene richiesta la selezione dei due caratteri più a sinistra del testo, ottenendo SI come risultato Prof. Folgieri – aa 2008/09
LEZIONE 3 La funzione DESTRA (RIGHT) • Opera su una cella contentente caratteri, date o numeri. Permette di selezionare il numero di caratteri specificato a destra della cella. Nell’esempio, la cella originale contiene il testo “si pensa di no” Con la funzione DESTRA viene richiesta la selezione dei due caratteri più a destra del testo, ottenendo NO come risultato Prof. Folgieri – aa 2008/09
LEZIONE 3 La funzione ANNO (YEAR) • Restituisce l’anno relativamente ad una data Prof. Folgieri – aa 2008/09
LEZIONE 3 VLOOKUP (CERCA.VERT) • Supponiamo di avere una tabella organizzata verticalmente e di voler prendere i valori da tale tabella in funzione di un parametro scritto in una cella. Compilate una tabella come nell’esempio qui sotto: • Supponiamo di voler trovare il nome della Facoltà cui corrisponde il codice 3… Prof. Folgieri – aa 2008/09
LEZIONE 3 VLOOKUP (CERCA.VERT) • SOLUZIONE: Prof. Folgieri – aa 2008/09
LEZIONE 3 HLOOKUP (CERCA.ORIZZ) • Chiaramente si avrà una sintassi analoga se consideriamo il cerca orizzontale… • Provate a cercare, con gli stessi dati, messi orizzontalmente (copia, poi incolla speciale-trasponi), sempre la Facoltà cui corrisponde il codice 3: Prof. Folgieri – aa 2008/09
LEZIONE 4 Come calcolare frequenza relativa e frequenza assoluta • Costruiamo una tabella delle frequenze assolute e relative. • Nella prima colonna riportiamo le sette categorie associate alla varibile in esame. • Per calcolare le freq. Ass. utilizziamo la funzione CONTA.SE(intervallo;criteri) dove intervallo=celle in cui sono stati riportati i dati, criterio=uguaglianza con categoria considerata. • Per la frequenza relativa occorre dividere le freq. Assolute per il numero totale di osservazioni (somma di tutte le frequenze assolute). Verifica: la somma di tutte le frequenze relative deve essere uguale a 1 Prof. Folgieri – aa 2008/09
LEZIONE 4 Costruzione della tabella delle frequenze • Modo veloce per costruire la tabelle di distribuzione delle frequenze: - Nella prima colonna indicare gli estremi destri delle classi scelte -Nella seconda colonna calcolare il numero di osservazioni che cadono nella classe corrispondente, utilizzando il comando vettoriale frequenza(dati, classi) -Nella terza colonna calcolare le frequenze relative, dividendo le frequenze assolute per la numerosità del campione - Nella quarta colonna si ripostano le frequenze cumulate, Ovviamente nella prima casella si riporta il valore della frequenza relativa della prima classe e nelle caselle successive si somma al valore della cella immediatamente sopra la frequenza relativa della classe corrispondente - Nella quinta colonna si riportano le densità di probabilità di ogni classe, ottenute dividendo la frequenza relativa per l’ampiezza della classe - Nella sesta colonna si scrivono esplicitamente le classi in cui sono stati ripartiti i valori per poterle poi utilizzare come etichette da riportare nel grafico Prof. Folgieri – aa 2008/09
LEZIONE 4 Tabella delle frequenze e istogramma • Generalmente per mostrare I risultati di una tabella di frequenze, si preferisce il grafico a istogramma, che permette di evidenziare eventuali simmetrie. Prof. Folgieri – aa 2008/09
LEZIONE 4 Dare nomi alle celle E’ possibile assegnare un nome (consigliabilmente evocativo) a un insieme di celle. Per esempio: E’ sufficiente posizionarsi nella casella “casella nome” (in figura) e assegnare il nome desiderato. Prof. Folgieri – aa 2008/09
LEZIONE 5 Variabili qualitative (1) • Si vuole condurre l’analisi dei dati riportati in tabella, che rappresentano il risultato di 60 osservazioni di una variabile che indica il tipo di danno alla salute presentato da 60 soggetti impiegati in un’azienda agricola e per i quali si sospetta l’esposizione a un pestivida. • I possibili valori assunti dalla variabile sono etichettati con le lettere:J>=joint swelling; F=fatigue; B=back pain; M=muscle wakness; C=coughinh; N=nose running/irritation; O=other Prof. Folgieri – aa 2008/09
LEZIONE 5 Indici di posizione: il RANGE • Conduciamo l’analisi dei dati in tabella, che rappresentano la concentrazione di vitamina D in un campione di 26 soggetti (dati da Bland M., 1995). • Calcoliamo i principali indici di posizione e di dispersione, sfruttando le funzioni statistiche di Excel. Supponendo di avere i valori xi delle nostre osservazioni, ad es. nelle celle A4; A29, otteniamo: • Ricordiamo che range =differenza tra valore massimo e valore minimo Prof. Folgieri – aa 2008/09
LEZIONE 5 Funzione MAX Rende possibile determinare il valore massimo in un intervallo di celle: Prof. Folgieri – aa 2008/09
LEZIONE 5 Funzione CONTA.SE (COUNT.IF) Conta il numero di celle, in un intervallo, rispondenti al criterio indicato: Prof. Folgieri – aa 2008/09
LEZIONE 5 Funzione MODA (MODE) Restituisce il valore più ricorrente in un intervallo dati: Prof. Folgieri – aa 2008/09
LEZIONE 5 Funzione MEDIANA (MEDIAN) Restituisce la mediana dell’intervallo considerato: Prof. Folgieri – aa 2008/09
LEZIONE 5 Funzione MEDIA (AVERAGE) Restituisce la media aritmetica dei valori considerati: Prof. Folgieri – aa 2008/09
LEZIONE 5 Altri tipi di medie Es. Media.geometrica: Prof. Folgieri – aa 2008/09
LEZIONE 5 Funzione VAR (VAR) Restituisce la varianza dei valori considerati: Prof. Folgieri – aa 2008/09
LEZIONE 5 Altri tipi di funzioni per il calcolo della varianza VAR.VALORI: Stima la varianza sulla base di un campione. Oltre ai numeri, nel calcolo vengono inclusi anche i valori di testo e logici, quali VERO e FALSO. Sintassi VAR.VALORI(val1;val2;...) Val1,val2,... sono da 1 a 30 argomenti di valori corrispondenti a un campione della popolazione. VAR.POP: Restituisce la varianza sulla base dell'intera popolazione. Sintassi VAR.POP(num1;num2;...) Num1;num2;... sono da 1 a 30 argomenti corrispondenti a una popolazione. VAR.POP.VALORI: Restituisce la varianza sulla base dell'intera popolazione. Oltre ai numeri, nel calcolo vengono inclusi anche i valori di testo e logici, quali VERO e FALSO. Sintassi VAR.POP.VALORI(val1;val2;...) Val1;val2;... sono da 1 a 30 argomenti di valori corrispondenti a una popolazione. Prof. Folgieri – aa 2008/09
LEZIONE 5 Funzione Quartile Restituisce il quartile secondo l’indice indicato (rif. Figura): Prof. Folgieri – aa 2008/09
LEZIONE 5 Per determinare il range interquatile Q3-Q1 Prof. Folgieri – aa 2008/09
LEZIONE 5 ROUND (ARROTONDA) • Ipotizziamo di voler arrotondare i valori contenuti in alcune celle. Provate con il valore riportato nell’esempio, arrotondando a 0,1,2 cifre (con la funzione arrotonda, arrotonda per eccessoe arrotonda per difetto): Prof. Folgieri – aa 2008/09
LEZIONE 5 ROUND (SCHEMA) Prof. Folgieri – aa 2008/09
LEZIONE 5 Arrotondare alla decina o al centinaio • Se si desidera arrotondare i dati alla decina o al centinaio: =ROUND (D3/100;0)*100 =ARROTONDA (D3/199;0)*100 Cioè si procede così: • Si divide il numero per 100 • Poi si arrotonda all’intero più vicino • In tal modo si ottiene il numero di “centinaia” del numero iniziale • Moltiplicando ancora per 100 si ottiene il numero iniziale, arrotondato alla centinaia Prof. Folgieri – aa 2008/09
LEZIONE 5 Test chi-quadrato – spiegazione pratica • Illustreremo due tipi di test statistici che usano la distribuzione chi-quadrato: 1. • Il test della bontà di adattamento, che determina se i dati osservati di un campione provengono da una particolare distribuzione della popolazione 2. • Il test della tabella di contingenza, che esamina l’indipendenza fra due misure categoriche e può essere utilizzato anche per verificare l’uguaglianza delle proporzioni da due o più popolazioni Prof. Folgieri – aa 2008/09
LEZIONE 5 Test chi-quadrato per la normalità (dati) • Un’azienda che produce batterie elettriche, per determinare il periodi di garanzia, ha bisogno di sapere se le durate delle batterie hanno una distribuzione normale. Sono state registrate le durate di 200 batterie e i dati sono stati raggruppati in una distribuzione di frequenze, (celle A6:C13). I valori calcolati della media e della deviazione standard sono, rispettivamente, 164 e 10 ore. • Copiate i dati in figura (comprese le intestazioni (in bold) che ci serviranno per il chi-quadrato). • Nelle formule utilizzeremo i nomi, perciò selezionate e celle A3:C4, aprite il menu Inserisci e scegliete le opzioni Nome>Crea>Riga Superiore. Fate click su OK. • Le ipotesi nulla e alternativa da verificare sono: •H0: la popolazione delle durate delle batterie ha una distribuzione normale •HA: la popolazione delle durate delle batterie non ha una distribuzione normale Prof. Folgieri – aa 2008/09
LEZIONE 5 Test chi-quadrato per la normalità (calcoli - 1) • Ora per determinare le probabilità normali, digitate la formula per il primo intervallo chiuso (D9), copiatela nelle altre celle che contengono le probabilità normali (D8:D12) e modificate per il primo e ultimo intervallo aperto (D8 e D12) • Le formule sono: =DISTRIB.NORM(B8;Media;Dev_Standard;VERO)-0 =DISTRIB.NORM(B9;Media;Dev_Standard;VERO)-DISTRIB.NORM(A9;Media;Dev_Standard;VERO) =DISTRIB.NORM(B10;Media;Dev_Standard;VERO)-DISTRIB.NORM(A10;Media;Dev_Standard;VERO) =DISTRIB.NORM(B11;Media;Dev_Standard;VERO)-DISTRIB.NORM(A11;Media;Dev_Standard;VERO) =1-DISTRIB.NORM(A12;Media;Dev_Standard;VERO) Le formule servono a calcolare la probabilità cumulativa normale della coda sinistra del limite superiore meno la probabilità cumulativa normale della coda sinistra del limite inferiore. Per il primo intervallo il limite inferiore è meno infinito e la probabilità cumulativa della coda sinistra è zero. Per l’ultimo intervallo, il limite superiore dell’intervallo è più infinito e la probabilità cumulativa della coda sinistra è uno. Prof. Folgieri – aa 2008/09
LEZIONE 5 Test chi-quadrato per la normalità (calcoli - 2) • Create ora le formule per le frequenze attese, che sono pari alla probabilità normale dell’intervallo per la dimensione del campione. Scrivete =D8*nnella cella E8 e copiate la formula nelle celle E9:E12 • Create le formule per i singoli termini della statistica chi-quadrato: – Termine chi-quadrato = (Fr_Effettiva – Fr_Attesa)^2/Fr_Attesa, cioè =(C8-E8)^2/E8 nella cella F8 e copiate questa formula nelle celle F9:F12 • Create la formula per sommare i termini di chi-quadrato. Scrivete la formula =SOMMA(F8:F12) nella cella F13. • Scrivete ora l’etichetta chi_quadrato nella cella F14, sotto la cella che contiene il valore della statistica chi-quadrato. Utilizzate questa etichetta per assegnare il nome alla cella F13 (selezionate le celle F13:F14 aprite il menu Inserisci e scegliete le opzioni Nome>Crea>Riga inferiore. Click su OK. Prof. Folgieri – aa 2008/09
LEZIONE 5 Test chi-quadrato per la normalità (gradi di libertà) • I gradi di libertà (GL) per un test della bontà di adattamento dipendono dal numero di categorie o intervalli (nel nostro esempio sono 5) e dal numero di parametri della distribuzione ipotizzata per i dati del campione (due: la media e la deviazione standard): GL=Numero di intervalli – Numero di parametri ipotizzati – 1 Nel nostro caso si ha GL=2 • NOTA: prendiamo il caso in cui l’azienda avesse in mente una distribuzione specifica e parametri specifici prima di analizzare i dati del campione. Per esempio, per determinare se le durate delle batterie hanno una distribuzione normale con una media di 160 ore e una deviazione standard di 8 ore, i dati del campione non devono essere utilizzati per calcolare le frequenze attese, quindi GL=5-0-1=4. Poiché il valore di GL dipende dalla situazione specifica, è l’utente che deve digitare il suo valore nel foglio di lavoro. Prof. Folgieri – aa 2008/09
LEZIONE 5 Test chi-quadrato per la normalità (risultati statistica) • Inserite le etichette che vedete qui a fianco nelle celle A15:A20. • Per utilizzare i nomi nelle successive formule, create i nomi per le celle che contengono GL, Alfae Val_Critico, cioè selezionate le celle A15:B15 tenendo premuto il tasto control anche le celle A18:B19 e poi aprite il menu Inseriscie scegliete le opzioni Nome>Crea>Colonna sinistra. Click su OK. • Ora scrivete le formule per il p-value, cioè =DISTRIB.CHI(chi_quadrato;GL) • Per il valore critico =INV.CHI(Alfa;GL) • Per il risultato della decisione scrivete: =SE(chi_quadrato>Val_critico;”Rifiuta H0”;”Accetta H0”) • Diamo ad Alfa il valore 0,01 • Vedremo comparire, accanto alla casella decisione, il risultato del test • Il valore assunto dal p-value indica che è molto probabile ottenere questi dati del campione da una distribuzione normale. L’ipotesi nulla di una distribuzione normale non può essere rifiutata. Prof. Folgieri – aa 2008/09
LEZIONE 5 Test chi-quadrato: tabella di contingenza • Un’azienda vende quattro tipi di bevande nel Nord America. Per verificare se lo stesso approccio di marketing adottato negli USA può essere applicato anche in Canada e Messico, l’azienda ha fatto analizare la relazione fra preferenze e nazionalità dei consumatori. L’analisi di marketing ha classificato la popolazione dei consumatori di bevande in funzione delle seguenti preferenze: bevanda normale, senza caffeina e zucchero, senza caffeina, senza zucchero. Una seconda classificazione riguarda la nazionalità dei consumatori: americani, canadesi e messicani. L’analista ha intervistato un campione casula di 250 consumatori delle tre nazionalità. Li ha raggruppati in base ai due criteri di classificazione e ha ottenuto le frequenze riportate nella figura seguente (NON copiatele in Excel). • Poiché l’analista verifica l’associazione fra preferenze e nazionalità dei consumatori, l‘ipotesi nulla e l’ipotesi alternativa sono le seguenti: –H0: le due classificazioni sono statisticamente indipendenti –HA: le due classificazioni sono dipendenti Prof. Folgieri – aa 2008/09
LEZIONE 5 Test chi-quadrato tabella di contingenza (Frequenze Effettive) • Costruiamo ora la tabella delle Frequenze Effettive (osservate) • Scrivete i titolo della tabella (Frequenze effettive), le etichette delle categorie di bevande (Normale, ecc...), le etichette delle categorie di consumatori (Americani,ecc..) e le etichette Totale colonna e Totale riga, come si vede in figura, copiando i calori delle frequenze osservate nel corpo della tabella (celle B5:E7) • Per ottenere i totali delle righe, inserite la formula =SOMMA(B5:E5)nella cella F5 e copiate questa formula nelle altre celle (F6:F7 dei totali delle righe • Per ottenere i totali delle colonne, inserite la formula =SOMMA(B5:B7) nella cella B8 e copiate questa formula nella altre celle (C8:F8) dei totali delle colonne. Prof. Folgieri – aa 2008/09
LEZIONE 5 Test chi-quadrato tabella di contingenza (Frequenze Previste) • Per calcolare il p-value della distribuzione chi-quadrato, scrivete l’etichetta p- valuenella cella A17 • Selezionate la cella B17 e fate click sul pulsante incolla funzione oppure selezionate Inserisci>Funzione • Nella finestra di dialogo selezionate la categoria delle funzioni statistiche e scegliete la funzione TEST.CHInel riquadro Nome Funzione. Click su OK. • Mettete i parametri che vedete in figura. • Secondo l’approccio di reporting il p-value trovato (0,00000013) dice che se l’ipotesi nulla è vera e le due classificazioni sono statisticamente indipendenti la probabilità di ottenere le frequenze osservate in un campione casuale di 250 è 0,00000013. Poiché i valori osservati sono così improbabili sotto l’ipotesi nulla, molti rifiuterebbero l’ipotesi nulla e concluderebbero che le due classificazioni sono dipendenti. Ciò vuol dire che i consumatori di diversa nazionalità preferiscono tipi di bevande differenti. Prof. Folgieri – aa 2008/09
LEZIONE 5 Test chi-quadrato tabella di contingenza (Test chi-quadrato) • Costruite una tabella che contiene i singoli termini di chi-quadrato. Poi specificate un livello di significatività (Alfa), utilizzate la funzione INC.CHI di Excel per determinare il valore critico di chi-quadrato per la verifica, confrontate la statistica calcolata con il valore critico e, infine, decidete se accettare o rifiutare l’ipotesi. I risultati finali sono in figura. Vediamo, nella slide successiva, come ottenerli velocemente. Prof. Folgieri – aa 2008/09
LEZIONE 5 Test chi-quadrato tabella di contingenza (Test chi-quadrato) • Selezionate una parte della tabella delle frequenze effettive (A3:E7), escludendo i totali delle righe e delle colonne e copiate il contenuto • Poi incollate in A19 • In A19 scrivete Termini di chi-quadratocome titolo della nuova tabella • Per ottenere i singoli termini di chi-quadrato usate la formula: Termine chi-quadrato = (Fr_Effettiva – Fr_Prevista)^2/Fr_Previstae cioè selezionate la cella B21 e scrivete =(B5-B12)^2/B12 • Copiate la formula nelle celle B22:E23 • Per completare il foglio di lavoro, scrivete le etichette e le formule che vedete in figura. • Per la funzione del valore critico, usate =INV.CHI(probabilità;gradi di libertà)in cui probabilità è la coda destra, che nel nostro caso è il livello di significatività. Il grado di libertà per una tabella di contingenza è dato da Gradi di libertà =(numero di righe – 1) * (numero di colonne – 1)nel nostro caso è 6 Prof. Folgieri – aa 2008/09
LEZIONE 5 Test chi-quadrato tabella di contingenza (commenti) • Secondo l’approccio decisionale, il valore calcolato di chi-quadrato (42,75) misura le differenze fra le frequenze effettive e le frequenze previste sotto l’ipotesi nulla. • E’ maggiore del valore critico di chi-quadrato (16,81) che corrisponde alla regione di rifiuto dell’1% nella coda destra. • Di conseguenza, c’è sufficiente evidenza per rifiutare l’ipotesi nulla al livello dell1% (test dalla coda destra) e concludere che i consumatori di diversa nazionalità preferiscono tipi di bevande differenti. Prof. Folgieri – aa 2008/09
Puoi anche leggere