I SONDAGGI DI OPINIONE - La necessità di una teoria dei campioni

Pagina creata da Federico Bosio
 
CONTINUA A LEGGERE
I SONDAGGI DI OPINIONE

La necessità di una teoria dei campioni
1. Le credenziali del campione

 Le molte, a volte                Tuttavia le credenziali di
 moltissime, informazioni         un campione,cioè il modo
 che solitamente                  in cui è stato costruito,
 provengono da una                non solo sono importanti
 indagine campionaria,            per l'interpretazione dei
 anche di piccola                 risultati ma, in via di
 dimensione, inducono             principio, sono le sole
 spesso ad essere poco            informazioni che
 attenti alle caratteristiche o   possiamo assegnargli per
 credenziali del campione         qualificarlo.
 stesso.
L'idea di campionamento

Tutti, nella vita quotidiana, abbiamo familiarità con
  questo concetto:
 al mercato, si campiona a colpo d'occhio la qualità
  della frutta che intende acquistare
 è considerando il comportamento di coloro che
  abbiamo conosciuto in passato, che scegliamo
  quali altre persone preferiamo conoscere.
Il concetto di distorsione

 Assenza di distorsione e presenza di affidabilità
 sono le credenziali che richiediamo ai campioni di
 tutti i giorni e, in termini più specifici, anche al
 campionamento statistico
 Quindi occorre definire le credenziali del
 campione in modo scientifico e per questo ci serve
 una teoria dei campioni
Quando estraiamo un campione

   Il problema sta tutto nel decidere come selezionare
    il campione da una data popolazione.
   se non facciamo attenzione alla scelta del metodo
    di campionamento, non v'è alcuna speranza di
    fare affermazioni sulla popolazione, attraverso i
    risultati del campione, con un reale fondamento
    scientifico.
2. La distorsione campionaria

Se volessi campionare 10 studenti nella mia
  aula, la via più rapida forse consisterebbe
  nello scegliere 10 studenti nella prima fila.

Se, ad esempio, fossi interessato alla loro
  statura media, questo procedimento
  risulterebbe opinabile.
 Conoscendo altre caratteristiche della
  popolazione, potremmo fare tutti in
  necessari confronti per verificare quanto il
  nostro procedimento di estrazione sia
  distorto, ma non potremo mai sapere tutto
  sulla popolazione: in tal caso perché
  campionare?
 Quindi con qualsiasi procedimento di
  estrazione "ragionato" rischiamo di estrarre
  sistematicamente campioni distorti in
  relazione a tutti i caratteri non noti in
  popolazione e, in particolare, per quelli che
  stiamo investigando.
In pratica, non conosciamo quale
distorsione (diretta o recondita) possa
introdursi nella procedura campionaria

Infatti nel campionamento non è mai
sufficiente aver individuato una fonte di
distorsione
Dobbiamo assicurarci che col nostro
metodo non possa sorgere alcuna possibilità
di distorsione o almeno per le variabili di
nostro interesse.
 Inoltre, lo stesso campione non può mai
  dirci se il procedimento che lo ha
  determinato era libero da distorsione: anche
  un metodo distorto potrebbe dare esiti
  corretti.
 Dobbiamo controllare il procedimento di
  selezione se vogliamo eliminare il sospetto
  di una distorsione da selezione.
   Per ,assicurarci di tutto questo impieghiamo un
    meccanismo casuale per selezionare il campione.
   Ogni campione scelto con un meccanismo casuale
    con probabilità note di selezione viene detto un
    campione casuale.
   Le probabilità di selezione non devono essere
    uguali per tutti i campioni, ma devono essere note.
   Per definizione un campione casuale è scevro da
    errore di selezione, cioè dagli errori dovuti ad
    scelta sistematicamente errata del campione di cui
    appunto stiamo ora discutendo.
3. Il campione casuale semplice

 È un campione scelto     Il CCS è privo di
 per mezzo di una         distorsione da
 “lotteria” che assegna   selezione:
 ad ogni unità della
 popolazione la stessa    Non v'è alcuna ragione
 probabilità far parte    in base alla quale un
 del campione.            particolare campione
                          (gli studenti in prima
                          fila) debba venir scelta
                          piuttosto che un altro
3. Il campione casuale semplice
 Quando si delega la scelta ad un meccanismo
 aleatorio, non si sfugge al problema di una scelta
 campionaria senza alcuna distorsione.

 Si fa esattamente quello che occorre, cioè
 assicurare che a nessuna umana inclinazione o
 pregiudizio (conscio o inconscio) venga permesso
 di inquinare la scelta del campione, scelta che
 quindi diventa libera da ogni fonte di interesse e
 distorsione
Il parodosso centrale

Esiste un curioso e apparente paradosso nella
teoria dei campionamento, secondo cui è
impossibile conoscere, dall'esame del campione
stesso, se esso sia o meno un «buon» campione,
nel senso d'essere scevro da distorsioni di
selezione

Allo stesso modo di come non si possono dedurre
le credenziali di un testimone dal suo aspetto
Il paradosso centrale comporta che lo stesso
   campione vada considerato differentemente a
   seconda che sia stato o meno selezionato con un
   procedimento libero da distorsioni

«Ogni campione di 10 studenti ha la stessa
  probabilità di venire estratto come qualsiasi altro
  se selezioniamo sulla base di un procedimento
  casuale. Si selezionino, allora, 10 studenti nella
  prima fila. Non sono un campione tanto
  verosimile quanto qualsiasi altro? Quale possibile
  obiezione si può fare a un simile procedimento?».
Un campione casuale semplice può essere
sospetto solo se il procedimento di
campionamento è sospetto: dopo tutto esso
non è che il semplice prodotto del
procedimento.

Ciascuna caratteristica di distorsione che
possiamo indicare per il campione in realtà
non è altro che una caratteristica del
procedimento che lo ha generato.
La virtù del campionamento casuale

  sta più nella sua promessa
  (di imparzialità fra le unità estratte e quindi fra i campioni)

  e meno nel suo risultato occasionale
  (l'effettivo campione che si produce in una particolare situazione)
4. Un esempio di CCSSR

 La popolazione è composta da 6 individui:
  A, B, C, D, E, F a cui rileviamo la statura
  YA, YB, YC, YD, YE, YF
 Si vuole stimare la statura media con un
  campione di 2 elementi: y1 e y2,

    NB: per quanto poco reali possano apparire questi numeri,
    nessun punto viene a perdere di validità rispetto ad esempi
    con valori reali
 A, B, C, D, E, F
  Y*=1,72; 1,76; 1,78; 1,80; 1,80; 1,82
  Y=Y*-170
 YA=2, YB=6, YC=8, YD=10, YE=10, YF=12

   La loro media, che stiamo cercando di stimare,
    vale esattamente 8 (vale a dire l'altezza media
    nella popolazione è 1,70+8).
Ora, qualunque tipo di          La selezione campionaria
  selezione impiegato, ci         distorta consiste nel
  sono soltanto 15 campioni       favorire, in modo occulto,
  possibili di 2 valori           uno o più di questi
Ogni procedura di selezione       possibili campioni.
  che dà ad ogni possibile
  campione da 1 a 15 la         Ciò nonostante, esiste sempre
  stessa probabilità di venir     la possibilità che anche un
  scelto, come il CCSSR, è        campionamento casuale
  corretta                        produca un campione
                                  estremo.
Vediamo che nell’universo dei     Appurato che il CCSSR non
  15 campioni possibili la          produce una “selezione
  media più frequente è 9,          campionaria”, ovvero non
  non 8. Inoltre esistono           è un sistema di estrazione
  almeno tre campioni con           distorto, è possibile che la
  media assai diversa dalla         statistica “media
  media di popolazione              campionaria” introduca
  (4,11,11 contro 8)                una successiva forma di
La media campionara si              distorsione rispetto al
  definisce “statistica” quella     paramentro “media di
  in popolazione “parametro”        popolazione”?
Definizione di valore atteso
e distorsione dello stimatore
Verifichiamo empiricamente la
  correttezza dello stimatore
  “media campionaria”
Il valore atteso
e affidabilità dello stimatore
Calcoliamo empiricamente la
  varianza della variabile
  aleatoria “media campionaria”
Con il CCSSR ciascuno dei 15 campioni ha la stessa
    probabilità di presentarsi, avremo quindi:
   2 possibilità su 15 (13%) di avere distanza nulla tra la media nel
    campione e la media effettiva (8) in popolazione
   7 su 15 (47%) di avere la distanza 0 oppure 1, cioè entro la distanza 1
   11 su 15 (73%) di essere entro la distanza 2
   14 possibilità su 15 (93%) essere entro la distanza 3
Conclusione

Quanto più chiediamo         Nella stima campionaria
di avvicinarci al vero       precisione e certezza
valore da stimare, tanto     sono antagoniste.
minore diventa la            Quanto più desideriamo
possibilità che questa       essere sicuri delle nostre
richiesta sia soddisfatta,   affermazioni tanto meno
persino con il migliore      dobbiamo chiedere:
piano di
                             siamo sicuri quando
campionamento
                             siamo poco precisi …
possibile
Suggerimento

Ricordate un sondaggio in cui si sia parlato di
precisione e certezza dei risultati?
Puoi anche leggere