ELABORAZIONE DEI DATI - QUESTA FASE SERVE AD ESPRIMERE IN

ELABORAZIONE DEI DATI - QUESTA FASE SERVE AD ESPRIMERE IN

ELABORAZIONE DEI DATI  QUESTA FASE SERVE AD ESPRIMERE IN MODO SINTETICO I RISULTATI DELL’INDAGINE SVOLTA CALCOLANDO DEGLI INDICI:  VALORI MEDI  INDICI DI VARIABILITA’

I valori medi Il valore medio è un valore che esprime una tendenza centrale ed è un valore compreso tra il minimo e il massimo. Medie di calcolo : sono quelle che si calcolano tenendo conto di tutti i valori della distribuzione  Media aritmetica e sue proprietà o Media Geometrica o Media quadratica o Media armonica Medie di posizione : sono quelle che si calcolano tenendo conto solo di alcuni valori della distribuzione o Mediana o Moda o valore normale

MEDIA ARITMETICA Questa viene chiamata media ponderata ed è utilizzata quando i valori rilevati hanno frequenze o pesi diversi Questa viene chiamata media semplice ed è utilizzata quando i valori rilevati non sono riportati con le frequenze ∑ ∑ = = ⋅ = + + ⋅ + ⋅ + ⋅ = n 1 i i n 1 i i i n 2 1 n n 2 2 1 1 p p x p ..... p p p x . . p x p x M N x N x . . x x M n 1 i i n 2 1 ∑ = = + + =

PROPRIETA’ DELLA MEDIA ARITMETICA Si definisce scarto della media aritmetica la differenza tra il valore osservato e la media stessa xi – M Si può dimostrare (vedi pag. 32 del libro di testo) che ∑ ( xi – M ) = 0 cioè che la somma degli scarti dalla media aritmetica è uguale a zero.

n x . . x x M n 2 1 + + = n 2 1 x . . x x M n + + = ⋅ n 2 1 volte n x . . x x M . . M M + + = + + +          La media aritmetica semplice rappresenta quel valore che, sostituito a ciascuno dei dati, non ne altera la somma. Infatti da cui si ricava cioè SCARTO

MEDIA GEOMETRICA n n 2 1 g x . . x x M ⋅ ⋅ = p p n p 2 p 1 g n 2 1 x . . x x M ⋅ ⋅ = Se i valori sono tutti positivi e non nulli si può calcolare la media geometrica. Si definisce media geometrica dei valori x1, x2, …, xn, quel numero Mg che sostituito ai valori xi lascia invariato il loro prodotto: che è la media geometrica semplice. Nel caso di valori xi con frequenze o pesi pi, si ha:

USO DELLA MEDIA GEOMETRICA  La media geometrica viene utilizzata quando si vuole analizzare il variare di un fenomeno nel tempo , per esempio il tasso di variazione dei prezzi o i tassi di rendimento di capitali.

 ESEMPIO Un capitale è stato impiegato per 4 anni al tasso del 2%, per altri 3 anni al tasso del 3 % ed in fine per 2 anni al tasso del 5%. Per il calcolo del tasso medio si può impiegare la Media Geometrica Ponderata: 9 2 3 4 05 , 03 , 02 , 0 ⋅ ⋅ = i

MEDIA QUADRATICA n x . . x x M 2 n 2 2 2 1 2 + + + = n 2 1 n 2 n 2 2 2 1 2 1 2 p . . p p p x .... p x p x M + + + ⋅ ⋅ + ⋅ + ⋅ = Media quadratica semplice Media quadratica ponderata, dove i pi sono i pesi La media quadratica è quella con valore maggiore con valore maggiore rispetto alle altre medie e viene usata per mettere in evidenza i valori che si scostano molto dai valori centrali

MEDIA ARMONICA ∑ = = + + + = n 1 i i n 2 1 a x 1 n x 1 ... x 1 x 1 n M n n 2 2 1 1 a x p ... x p x p N M + + + = Media armonica semplice Media armonica ponderata dove, come al solito, i pi sono i pesi

QUANDO USARE LA MEDIA ARMONICA Questa media è utilizzata quando ha significato il calcolo del reciproco di una certa grandezza. Si definisce potere di acquisto di una moneta la quantità di beni acquistabile con una unità di tale moneta. Se, per esempio un prodotto costa 0,85 euro il potere di acquisto riferito a tale bene è: 1/0,85. Ora supponiamo che uno stesso prodotto in 4 città differenti abbia i seguenti prezzi: Milano 0,85 euro Torino 0,90 Roma 0,75 Bari 0,70 70 , 1 75 , 1 90 , 1 85 , 1 4 + + + Potere acquisto medio =

MEDIANA Dati un insieme di valori x1, x2, x3,….

xn ordinati si definisce Mediana il valore che bipartisce la successione, dopo che i termini sono stati posti in ordine crescente. Ovvero :  il valore centrale, se il numero dei termini è dispari  la media aritmetica dei due valori centrali, se il numero dei termini è pari. Esempio: Calcolare la Mediana dei seguenti valori: Il valore 9 è quello che sta in centro ed è pertanto la mediana Esempio: Calcolare la Mediana dei seguenti valori: 55 12 10 9 8 7 4 46 44 41 38 36 33 22 8 La mediana è la media aritmetica dei due valori centrali (36+38)/2 = 37

MEDIANA Se si ha invece una distribuzione di frequenze, occorre calcolare le frequenze cumulate. Indicando con N la somma delle frequenze, la Mediana è il valore corrispondente ….  a N/2 se N è pari  a (N+1)/2 se N è dispari Tot 25 Tot 25 25 1 6 24 1 5 23 1 4 22 4 3 18 7 2 11 8 1 3 3 Frequenze cumulate Frequenze assolute N.Figli N =25 quindi la mediana è il valore corrispondente a (N+1)/2 = (25+1)/2 = 13 cioè il valore 2 Indagine sul numero di figli su un campione di famiglie

MEDIANA   Se i dati sono raggruppati in classi si determina la Se i dati sono raggruppati in classi si determina la classe mediana mediante le frequenze cumulate; quindi si procede con un mediante le frequenze cumulate; quindi si procede con un’ ’interpolazione interpolazione lineare mediante una proporzione.

(vedere il libro di testo pag. lineare mediante una proporzione. (vedere il libro di testo pag. 44 44- -45) 45) 2500 Tot 2500 2500 100 2500-3000 2400 200 2000-2500 2200 305 1600-2000 1895 955 1200-1600 940 840 800-1200 100 100 0-800 F. cum. F.ass. Classi cilindrata(cc) Esempio: è stata condotta una ricerca sulla cilindrata delle auto possedute da un campione di persone (2500): Poiché N è pari N/2 =1250 che corrisponde alla Classe Mediana 1200-1600 Per giungere ad un valore preciso della Mediana si deve impostare una proporzione: 1200 940 x 1250 1600 1895 cioè (x-1200) : (1600-1200) = (1250-940) : (1895 -940) Da cui x=……..

MODA  Si dice Moda o Valore Modale di una distribuzione di frequenze il valore corrispondente alla massima frequenza Esempio 1 10 1 9 2 8 4 7 5 6 7 5 1 4 2 3 F.ass. Voti matematica La Moda è il valore 5 poiché è il valore corrispondente alla frequenza più alta

MODA  Se i valori sono raggruppati in classi si determina la Classe Modale:  Se l’ampiezza delle classi è costante si dirà classe modale quella con frequenza maggiore;  Se l’ampiezza delle classi non è costante si divide ogni frequenza per l’ampiezza della rispettiva classe calcolando così la densità di frequenza; il il valore pi valore più ù alto di densit alto di densità à definisce la classe definisce la classe modale modale N.B.

esistono delle distribuzione di frequenza che presentano più valori della moda( distribuzioni plurimodali)

COME SI SCEGLIE UNA MEDIA ? Si possono solo fare considerazioni a carattere generale:  La media aritmetica è più utilizzata per esprimere un concetto di equidistribuzione  La media geometrica è utilizzata quando i dati si susseguono in progressione geometrica  La media quadratica quando si vuole eliminare l’influenza dei segni e quando si vuole dare importanza a valori piuttosto grandi  La moda si usa quando è importante rilevare il valore che ha maggior probabilità di presentarsi  La mediana è caratterizzata dal fatto di non essere influenzata dalla rilevante differenza tra i dati

RELAZIONI TRA LE MEDIE Con riferimento ad una medesima distribuzione, si trova che tra le medie appena introdotte intercorre la seguente relazione: 2 g a M M M M < < < Le dimostrazioni si trovano a pagina 46 del libro di testo

LA VARIABILITA’  I valori medi sono indici importanti per la descrizione sintetica di un fenomeno statistico, però non forniscono informazioni sulla dispersione dei dati cioè sulla loro variabilità  Esempio  Due gruppi di studenti hanno sostenuto una prova di matematica con i seguenti risultati: 6 7 6 6 5 2° Gruppo 10 8 5 4 3 1°Gruppo La media dei voti per entrambi i gruppi vale 6, ma è evidente che i dati del 1° gruppo sono molto più dispersi

INDICI DI VARIABILITA’  Campo di variazione  Scarto quadratico medio  Varianza  Coefficiente di variazione  Scostamento semplice medio Per stimare la variabilità si ricorre ad alcuni indici:

CAMPO DI VARIAZIONE( RANGE) E’ il più semplice degli indici di variazione e si calcola facendo la differenza tra il dato più grande e il dato più piccolo Campo variazione R = x max – x min Il range è molto semplice da calcolare però è poco significativo poiché tiene conto solo del valore più piccolo e di quello più grande trascurando tutti gli altri valori. Può essere utile ad es. in campo meteorologico quando viene indicata l’escursione termica Il campo di variazione dà informazioni sulla distribuzione dei dati: più R è piccolo più i dati sono concentrati; più R è grande più i dati sono dispersi

SCARTO QUADRATICO MEDIO E VARIANZA Sono gli indici di variabilità più utilizzati, e tengono conto della distribuzione di tutti i dati. ) ( ) n M x n M x . . M x M x n 1 i 2 i 2 n 2 2 2 1 ∑ = = = − − + + − + − σ Scarto quadratico medio (o deviazione standard) Scarto quadratico medio (o deviazione standard) Rappresenta la media quadratica degli scarti dei dati dalla media aritmetica M ∑ ∑ = = ⋅ − = σ n 1 i i n 1 i i 2 i p p ) M x ( semplice ponderata

Varianza E’ definita come il quadrato dello scarto quadratico medio e viene indicata con σ2 2 n 1 i i n 1 i i 2 i 2 2 n 1 i 2 i 2 M p p x M n x − ⋅ = σ − = σ ∑ ∑ ∑ = = = Per il calcolo della varianza e dello scarto quadratico medio si preferisce adottare la seguente formula facilmente dimostrabile (pag.

60) : Se la distribuzione è ponderata Se i dati sono senza frequenze Questa formula importantissima ci dice che la varianza si ottiene facendo la media dei quadrati – il quadrato della media. L’uso di questa formula ci permette di evitare il calcolo degli scarti e dei loro quadrati

OSSERVAZIONI Lo scarto quadratico medio σ  è nullo in caso di variabilità nulla;  è positivo in qualsiasi altro caso  è tanto più grande quanto maggiore è il grado di variabilità, cioè più i dati sono “dispersi”  è tanto più piccolo quanto minore è il grado di variabilità, cioè più i dati sono “concentrati” Lo stesso dicasi per la varianza σ2 .

Esempio: 4 11 2 8 1 4 3 2 frequenza valore 2 n 1 i i n 1 i 2 i 2 M p p x − ⋅ = σ ∑ ∑ = 7 10 4 11 2 8 1 4 3 2 M = ⋅ + ⋅ + ⋅ + ⋅ = 15 7 10 4 11 2 8 1 4 3 2 2 2 2 2 2 = − ⋅ + ⋅ + ⋅ + ⋅ = Calcolare varianza e scarto quadratico medio 87 , 3 15 = = σ Media dei quadrati Quadrato della media

IL COEFFICIENTE DI VARIAZIONE CV  Il CV è una misura relativa di dispersione (le precedenti sono misure assolute) ed è una grandezza adimensionale.  E’ particolarmente utile quando si devono confrontare le distribuzioni di due gruppi con medie molto diverse o con dati espressi in scale differenti (es. confronto tra variazione del peso e variazione dell’altezza). %                         ⋅ ⋅ ⋅ ⋅ = = = = 100 M CV σ σ σ σ

SCOSTAMENTO SEMPLICE MEDIO Un altro modo per calcolare la variabilità dei dati (tenendo conto di tutti i dati) consiste nel calcolare la distanza di tutti i dati dalla media e fare la media aritmetica di tali distanze ∑ ∑ ∑ = = = ⋅ − = − = n 1 i i n 1 i i i M n 1 i i M p p M x S n M x S In alcuni casi in tali formule è possibile sostituire alla Media aritmetica M la Mediana Me Scostamento semplice medio = Distanza media dei dati dalla media Se i dati sono senza frequenze Se i dati sono “pesati”

 Lo scostamento semplice medio dalla media dà informazioni sulla distribuzione dei dati:  più SM è piccolo più i dati sono concentrati;  più SM è grande più i dati sono dispersi