I SONDAGGI DI OPINIONE - La necessità di una teoria dei campioni
←
→
Trascrizione del contenuto della pagina
Se il tuo browser non visualizza correttamente la pagina, ti preghiamo di leggere il contenuto della pagina quaggiù
I SONDAGGI DI OPINIONE La necessità di una teoria dei campioni
1. Le credenziali del campione Le molte, a volte Tuttavia le credenziali di moltissime, informazioni un campione,cioè il modo che solitamente in cui è stato costruito, provengono da una non solo sono importanti indagine campionaria, per l'interpretazione dei anche di piccola risultati ma, in via di dimensione, inducono principio, sono le sole spesso ad essere poco informazioni che attenti alle caratteristiche o possiamo assegnargli per credenziali del campione qualificarlo. stesso.
L'idea di campionamento Tutti, nella vita quotidiana, abbiamo familiarità con questo concetto: al mercato, si campiona a colpo d'occhio la qualità della frutta che intende acquistare è considerando il comportamento di coloro che abbiamo conosciuto in passato, che scegliamo quali altre persone preferiamo conoscere.
Il concetto di distorsione Assenza di distorsione e presenza di affidabilità sono le credenziali che richiediamo ai campioni di tutti i giorni e, in termini più specifici, anche al campionamento statistico Quindi occorre definire le credenziali del campione in modo scientifico e per questo ci serve una teoria dei campioni
Quando estraiamo un campione Il problema sta tutto nel decidere come selezionare il campione da una data popolazione. se non facciamo attenzione alla scelta del metodo di campionamento, non v'è alcuna speranza di fare affermazioni sulla popolazione, attraverso i risultati del campione, con un reale fondamento scientifico.
2. La distorsione campionaria Se volessi campionare 10 studenti nella mia aula, la via più rapida forse consisterebbe nello scegliere 10 studenti nella prima fila. Se, ad esempio, fossi interessato alla loro statura media, questo procedimento risulterebbe opinabile.
Conoscendo altre caratteristiche della popolazione, potremmo fare tutti in necessari confronti per verificare quanto il nostro procedimento di estrazione sia distorto, ma non potremo mai sapere tutto sulla popolazione: in tal caso perché campionare? Quindi con qualsiasi procedimento di estrazione "ragionato" rischiamo di estrarre sistematicamente campioni distorti in relazione a tutti i caratteri non noti in popolazione e, in particolare, per quelli che stiamo investigando.
In pratica, non conosciamo quale distorsione (diretta o recondita) possa introdursi nella procedura campionaria Infatti nel campionamento non è mai sufficiente aver individuato una fonte di distorsione Dobbiamo assicurarci che col nostro metodo non possa sorgere alcuna possibilità di distorsione o almeno per le variabili di nostro interesse.
Inoltre, lo stesso campione non può mai dirci se il procedimento che lo ha determinato era libero da distorsione: anche un metodo distorto potrebbe dare esiti corretti. Dobbiamo controllare il procedimento di selezione se vogliamo eliminare il sospetto di una distorsione da selezione.
Per ,assicurarci di tutto questo impieghiamo un meccanismo casuale per selezionare il campione. Ogni campione scelto con un meccanismo casuale con probabilità note di selezione viene detto un campione casuale. Le probabilità di selezione non devono essere uguali per tutti i campioni, ma devono essere note. Per definizione un campione casuale è scevro da errore di selezione, cioè dagli errori dovuti ad scelta sistematicamente errata del campione di cui appunto stiamo ora discutendo.
3. Il campione casuale semplice È un campione scelto Il CCS è privo di per mezzo di una distorsione da “lotteria” che assegna selezione: ad ogni unità della popolazione la stessa Non v'è alcuna ragione probabilità far parte in base alla quale un del campione. particolare campione (gli studenti in prima fila) debba venir scelta piuttosto che un altro
3. Il campione casuale semplice Quando si delega la scelta ad un meccanismo aleatorio, non si sfugge al problema di una scelta campionaria senza alcuna distorsione. Si fa esattamente quello che occorre, cioè assicurare che a nessuna umana inclinazione o pregiudizio (conscio o inconscio) venga permesso di inquinare la scelta del campione, scelta che quindi diventa libera da ogni fonte di interesse e distorsione
Il parodosso centrale Esiste un curioso e apparente paradosso nella teoria dei campionamento, secondo cui è impossibile conoscere, dall'esame del campione stesso, se esso sia o meno un «buon» campione, nel senso d'essere scevro da distorsioni di selezione Allo stesso modo di come non si possono dedurre le credenziali di un testimone dal suo aspetto
Il paradosso centrale comporta che lo stesso campione vada considerato differentemente a seconda che sia stato o meno selezionato con un procedimento libero da distorsioni «Ogni campione di 10 studenti ha la stessa probabilità di venire estratto come qualsiasi altro se selezioniamo sulla base di un procedimento casuale. Si selezionino, allora, 10 studenti nella prima fila. Non sono un campione tanto verosimile quanto qualsiasi altro? Quale possibile obiezione si può fare a un simile procedimento?».
Un campione casuale semplice può essere sospetto solo se il procedimento di campionamento è sospetto: dopo tutto esso non è che il semplice prodotto del procedimento. Ciascuna caratteristica di distorsione che possiamo indicare per il campione in realtà non è altro che una caratteristica del procedimento che lo ha generato.
La virtù del campionamento casuale sta più nella sua promessa (di imparzialità fra le unità estratte e quindi fra i campioni) e meno nel suo risultato occasionale (l'effettivo campione che si produce in una particolare situazione)
4. Un esempio di CCSSR La popolazione è composta da 6 individui: A, B, C, D, E, F a cui rileviamo la statura YA, YB, YC, YD, YE, YF Si vuole stimare la statura media con un campione di 2 elementi: y1 e y2, NB: per quanto poco reali possano apparire questi numeri, nessun punto viene a perdere di validità rispetto ad esempi con valori reali
A, B, C, D, E, F Y*=1,72; 1,76; 1,78; 1,80; 1,80; 1,82 Y=Y*-170 YA=2, YB=6, YC=8, YD=10, YE=10, YF=12 La loro media, che stiamo cercando di stimare, vale esattamente 8 (vale a dire l'altezza media nella popolazione è 1,70+8).
Ora, qualunque tipo di La selezione campionaria selezione impiegato, ci distorta consiste nel sono soltanto 15 campioni favorire, in modo occulto, possibili di 2 valori uno o più di questi Ogni procedura di selezione possibili campioni. che dà ad ogni possibile campione da 1 a 15 la Ciò nonostante, esiste sempre stessa probabilità di venir la possibilità che anche un scelto, come il CCSSR, è campionamento casuale corretta produca un campione estremo.
Vediamo che nell’universo dei Appurato che il CCSSR non 15 campioni possibili la produce una “selezione media più frequente è 9, campionaria”, ovvero non non 8. Inoltre esistono è un sistema di estrazione almeno tre campioni con distorto, è possibile che la media assai diversa dalla statistica “media media di popolazione campionaria” introduca (4,11,11 contro 8) una successiva forma di La media campionara si distorsione rispetto al definisce “statistica” quella paramentro “media di in popolazione “parametro” popolazione”?
Definizione di valore atteso e distorsione dello stimatore
Verifichiamo empiricamente la correttezza dello stimatore “media campionaria”
Il valore atteso e affidabilità dello stimatore
Calcoliamo empiricamente la varianza della variabile aleatoria “media campionaria”
Con il CCSSR ciascuno dei 15 campioni ha la stessa probabilità di presentarsi, avremo quindi: 2 possibilità su 15 (13%) di avere distanza nulla tra la media nel campione e la media effettiva (8) in popolazione 7 su 15 (47%) di avere la distanza 0 oppure 1, cioè entro la distanza 1 11 su 15 (73%) di essere entro la distanza 2 14 possibilità su 15 (93%) essere entro la distanza 3
Conclusione Quanto più chiediamo Nella stima campionaria di avvicinarci al vero precisione e certezza valore da stimare, tanto sono antagoniste. minore diventa la Quanto più desideriamo possibilità che questa essere sicuri delle nostre richiesta sia soddisfatta, affermazioni tanto meno persino con il migliore dobbiamo chiedere: piano di siamo sicuri quando campionamento siamo poco precisi … possibile
Suggerimento Ricordate un sondaggio in cui si sia parlato di precisione e certezza dei risultati?
Puoi anche leggere