ANALISI STATISTICA - IPS Mario Carrara

Pagina creata da Mattia Simonetti
 
CONTINUA A LEGGERE
ANALISI STATISTICA - IPS Mario Carrara
ANALISI STATISTICA
Generalità
La Statistica è una disciplina che ha come fine lo studio quantitativo e qualitativo di un particolare
fenomeno, o di una sua parte, di cui non si ha la completa conoscenza. Essa applica metodi scientifici
alla raccolta di dati e informazioni per una loro classificazione, elaborazione e rappresentazione
grafica, al fine di poterli meglio interpretare.

La Statistica può essere suddivisa in due tipologie Descrittiva o Induttiva;

   -   La Statistica Descrittiva raccoglie dati di una popolazione o di una parte di essa (campione) e
       ne descrive le caratteristiche mediante grafici o tabelle che sintetizzano attraverso famiglie di
       indici: valori medi, indici di variabilità, scarto quadratico medio, varianza, moda, mediana.
   -   La Statistica Induttiva si propone di fornire metodi che aiutano a imparare dell’esperienza
       giustificando il passaggio dall’osservazione di casi particolari a leggi generali. In questo ramo
       della Statistica è molto forte il legame con il calcolo delle probabilità.
La raccolta di informazioni o dati necessarie alle indagini statistiche si può effettuare mediante
rilevazioni:
      Dirette, in cui i dati sono acquisiti direttamente all’origine o alla fonte mediante osservazione
       pura o con questionari;
      Indirette, in cui il fenomeno viene osservato mediante l’analisi di un parametro ad esso
       collegato (ad esempio per misurare la produzione giornaliere di un macchinario invece di
       contare il numero di pezzi che produce in una giornata, posso parametrizzare il numero di pezzi
       per kilowatt consumati dopo di che vado a rilevare il consumo di energia elettrica nella giornata
       e risalgo alla produzione fatta dal parametro trovato);
      Totale, realizzate mediante l’analisi di tutte le unità statistiche che formano la popolazione in
       esame;
      Parziale (o per campionamento), in cui si considerano solo alcune unità statistiche scelte con
       determinati criteri.

Naturalmente i quattro tipi di raccolte dati non possono essere effettuate contemporaneamente ma a
coppie:

Dirette →Totale        Dirette →Parziale      Indirette →Totale      Indirette →Parziale.

Le fasi attraverso cui si sviluppa un’indagine statistica possono essere cosi sintetizzate:
   1. Individuazione del fenomeno e scelta della caratteristica da analizzare;
   2. Determinazione dell’insieme ed eventualmente formazione del campione;
   3. Effettuazione della rilevazione;
   4. Classificazione dei dati rilevati e loro rappresentazione grafica;
   5. Interpretazione e formazione delle valutazioni e delle previsioni.
ANALISI STATISTICA - IPS Mario Carrara
Distribuzioni statistiche

Le distribuzioni statistiche rappresentano le distribuzioni di frequenza o di probabilità, riferite sia ai
dati di un campione sia a distribuzioni calcolate in base a ipotesi matematiche riguardanti il
comportamento di esperimenti ripetitivi che presentano regolarità statistiche.

La distribuzione statistica può essere considerata come una modalità particolare di rappresentazione
dei dati.

Supponiamo di rilevare i diametri esterni di 110 perni, realizzati con una macchina utensile automatica
(Tabella 1).

                                                Tabella 1

Da una distribuzione del genere non è facile interpretare i dati.
Se gli stessi dati sono divisi per dimensioni (raggruppamento per classi di appartenenza), la
distribuzione apparirà subito più significativa.
Considerando il valore massimo della distribuzione pari a 22,64 mm e il valore minimo 22,35 mm, tale
intervallo può essere suddiviso in un numero adeguato di parti, scegliendo come ampiezza per ogni
parte (classe) 3 centesimi di mm, si ottengono 11 classi. Il numero di perni aventi diametro compreso
nell’intervallo di ciascuna classe viene definito frequenza.
In buona sostanza la tabella precedente è organizzata in maniera tale da avere i diametri delle classi dal
più piccolo al più grande (Tabella 2). Ad esempio:

    La classe 1 formata da tutti i diametri trovati cha hanno dimensione 22,34 – 22,35 – 22,36;
    La classe 2 formata da tutti i diametri trovati che hanno dimensione 22,37 – 22,38 – 22,39;
    La classe 3 formata da tutti i diametri trovati che hanno dimensione 22,40 – 22,41 – 22,42.
    Ecc.
ANALISI STATISTICA - IPS Mario Carrara
Tabella 2

Un modo più immediato per studiare i dati di questa distribuzione statistica è quella di rappresentarla
mediante un grafico detto istogramma. Tale diagramma posiziona sull’asse delle ordinate (y) la
frequenza in cui si ripete quel dato e in ascissa (x) i diametri dei perni suddivisi in classi (Figura 1).

                          Figura 1 – Rappresentazione grafica, mediante istogramma.

Parametri che individuano le distribuzioni statistiche o di frequenza

Con riferimento alla rappresentazione grafica (Figura 1), si osserva che l’isometrica assume una forma
a campana. Questo tipo di distribuzione è detta distribuzione normale, o distribuzione Gaussiana
che contraddistinguono tutti i fenomeni contraddistinti unicamente da fenomeni casuali.
L’equazione di una distribuzione normale è data:

                                                     1          ̅

                                                    √2

In cui:

           indica il valore compreso nell’intervallo considerato;
         ̅ esprime la media dei valori,
           è lo scarto quadratico medio
ANALISI STATISTICA - IPS Mario Carrara
I parametri statistici maggiormente usati sono:

                                                                                     ∑
 Valore medio                   Media aritmetica dei valori rilevati.        ̅

                                Dispersione dei valori rilevati attorno al       ∑           ̅
 Scarto quadratico medio
                                valore medio.

                                Media aritmetica dei quadrati degli scarti       ∑       ̅
 Varianza
                                dal valore medio.

                                È il dato, o la classe, che ha la massima
                                frequenza: una distribuzione nella quale
 Moda
                                vi sia più di un dato che abbia la massima
                                frequenza è detta bimodale o plurimodale

                                In un insieme ordinato di dati statistici
                                (valori), il numero di elementi è dispari,
                                la mediana corrisponde al dato che occupa
 Mediana                        la posizione centrale; se il numero di
                                elementi è pari, la mediana corrisponde
                                alla media aritmetica dei due valori
                                centrali.
Puoi anche leggere