Esempi e trucchi di statistica pratica nei sondaggi Come si fa un sondaggio
←
→
Trascrizione del contenuto della pagina
Se il tuo browser non visualizza correttamente la pagina, ti preghiamo di leggere il contenuto della pagina quaggiù
La statistica è facile e ogni tanto utile!! Esempi e trucchi di statistica pratica nei sondaggi Come si fa un sondaggio Una ricerca o un sondaggio seguono un processo di produzione: 1. Determinazione dei bisogni informativi (e budget) 2. Progettazione del disegno di ricerca a) Scelta tra campionamento probabilistico non probabilistico b) Scelta della modalità di raccolta dei dati c) Stesura dello strumento di rilevazione 3. Raccolta dei dati (Field) 4. Analisi ed interpretazione dei dati 5. Presentazione e consegna del rapporto finale
Determinazione dei bisogni informativi Cercare di comprendere cosa vuol saper il cliente Tradurre il concetto, definire il costrutto, infine costruire gli indicatori Tradurre questo bisogno in un processo attuabile . 1. Cosa chiedere (questionario) 2. A chi chiedere (campione, collettivo) 3. Come chiedere (CATI, CAWI, CATI) 4. Quando chiedere e dove Determinazione del concetto, del costrutto, dell’indicatore “Fare a pezzi” tutti gli aspetti del bene, del servizio, del processo di scelta in elementi il più possibile elementari e su . questi elementi minimi realizzare le domande. L’esempio della qualità di un bene e servizio……
Un esempio La qualità per gli uomini Censura Censura Un altro esempio (per par condicio) La qualità le donne Censura Censura
Determinazione dei bisogni informativi Cosa rende un uomo o un donna un riferimento della moda o del cinema? Quali aspetti di “prodotto” fanno di Naomi o di Brad due “eccellenze” nei loro “mercati”. . Un’osservazione, una misurazione degli aspetti che determinano il loro successo possono aiutarci a realizzare un’altra storia di successo TUTTO SI PUO’ CHIEDERE E SAPERE Cosa può fare un sondaggio in politica Cosa rende un candidato-sindaco attraente? Su quali leve deve puntare? La sua immagine è coerente con la percezione che di lui ha l’elettorato? Cosa interessa davvero al cittadino? Cosa vuole la cittadinanza? Su quali set valoriali lavorare?
La progettazione del disegno di ricerca 2a Scelta del tipo di campione Tipi di campioni Campionamenti non Campionamenti probabilistici probabilistici A scelta ragionata Per quote Casuale semplice A grappolo Sistematico Stratificato La determinazione della numerosità campionaria Strumenti e trucchi Le ipotesi 1. La popolazione è normale (in realtà ci occorre la normalità della distribuzione della frequenza relativa da stimare) . 2. Le possibilità di risposta sono 2 3. Abbiamo possibilità di gestire la misura dell’errore
Il campionamento Strumenti e trucchi Le ipotesi 1. La popolazione è normale Per risolvere il problema della normalità della distribuzione si “sfrutta” la regola pratica di Cochran (questo è un trucco!!) npq>9 Per esempio n=40, p=0,3 npq=8,4 quindi occorre adottare n almeno =>43 Il campionamento Strumenti e trucchi Le ipotesi 2. Le modalità di risposta sono due ll problema può essere posto in questi . termini procedendo ad opportune aggregazioni in modo da ricondursi a 2 possibilità (questo è un trucco!!)
Il campionamento Strumenti e trucchi Le ipotesi 3. Abbiamo possibilità di gestire la misura dell’errore . Usiamo il budget a disposizione per determinare la numerosità campionaria il livello di attendibilità e soprattutto l’errore (l’errore è un espediente) Il campionamento Strumenti e “trucchi” Ampiezza del campione per margini di errore massimo numerosità della pari a popolazione 1% 2% 3% 4% 5% 6% 1500 1305 938 638 441 316 235 2000 1667 1112 714 476 333 244 3000 2308 1364 811 517 353 255 4000 2858 1539 870 541 364 260 5000 3334 1667 909 556 370 264 7000 4118 1843 959 574 378 268 . 10000 5001 2001 1000 588 385 271 15000 6001 2143 1034 600 390 273 25000 7143 2273 1064 610 394 275 50000 8334 2381 1087 617 397 277 100000 9091 2439 1099 621 398 277 INFINITA 10000 2500 1111 625 400 278 Nelle ipotesi P=0,955 e p=q=0,5
Il campionamento Strumenti e “trucchi” Variazioni dell'ampiezza del campione al variare dell'errore atteso 10000 9000 8000 7000 La numerosità campionaria è Interviste 6000 5000 fortemente influenzata dalla 4000 misura dell’errore 3000 2000 1000 0 1 2 3 4 5 6 Errore atteso 1500 3000 5000 10000 25000 50000 100000 INFINITA Il caso Confindustria Movimento Giovani • L'indagine statistica, che illustriamo di seguito, è realizzata secondo lo schema di seguito: • L’unità di rilevazione è l’imprenditore (titolare o socio) non personalmente associato ad alcuna associazione 1°wave 2°wave Interviste ad associati al Interviste a non associati al Movimento Giovani Movimento Giovani Imprenditori Confindustria . Interviste ad imprenditori Interviste ad imprenditori con aziende associate ad con aziende non altri movimenti associate • Nella seconda wave, la numerosità campionaria è stabilita in base a metodologie statistiche probabilistiche a priori in 300 unità, e ci attendiamo un campione con un livello di probabilità al 95% ed un errore al 4%.
Scelta (elezione) dell’unità Giovane imprenditore NO under 40? SI Personalmente SI Chiusura associato? NO Intervista con richiesta SI Azienda associata? soddisfazioni NO Intervista priva di richiesta soddisfazioni Alcuni risultati L'associativismo in futuro sara? 60 48,54 50 35,23 36,13 40 31,82 30 23,86 20 9,09 7,30 8,03 10 0 Più importante Più o meno Meno importante Non sa costante Aziende non associate Aziende associate L'associazione deve valorizzare la figura e il ruolo dell'imprenditore? 60 50,00 50 44,93 40 34,42 30 19,20 20 16,30 14,86 8,33 10 4,71 6,16 1,09 0 Molto abbastanza Poco Per nulla Non sa Soddisfazione Importanza
La catena del valore (realizzata con Weka) Soddisfazione troppo difficile da emulare L’elaborazione Strumenti e trucchi E’ il problema minore Ci sono moltissimi software che risolvono il problema alcuni sono free (R), alcuni sono moduli aggiuntivi di Excel (Phstat) . altri sono commerciali Stata (ottimo per biostatistica) Spss (ottimo per ricerche sociali-mktg) Sas (ottimo per tutto ma non friendly)
Un esempio di output Voti medi alla frutta Medie e istogrammi Voto all'appetibilità (presentazione, 5,71 con excel aspetto) delle frutta Voto alla quantità della 5,60 scelta della frutta Voto alla quantità della frutta offerta (intesa 5,67 Medie e porzione intervalli degli errori con Voto al gusto e sapore 5,69 Spss della frutta offerta Il grafico con la retta di regressione con Stata
Un esempio di regressione sempre con stata Anali della varianza Somma dei quadrati della regressione (SQR variabilità spiegata) la parte di variabilità attribuibile alla relazione tra api00e enroll Somma dei quadrati degli errori (SQE variabilità non spiegata F = + o - è il quadrato di t ossia non attribuibile al modello) di enroll =SQR/SQT = Radice quadrata di SQE/n-2 Test significativo perché “abbastanza diverso da 0 Il calcolo dei residui del modello scatter e enroll ed analisi delle condizioni Distribuzione normale degli errori (histogram e, normal) Omoschedasticità = gli errori devono variare di un medesimo ammontare sia in corrispondenza di valori elevati che piccoli di X In questo caso all’aumentare o diminuire non aumentano o diminuiscono gli errori (correlazione? “Correlate”) Gli errori devono essere indipendenti per ciascun valore di X IL MODELLO E’ CORRETTO
Il report e la presentazione Strumenti e trucchi E’ una fase critica Ci sono 3 grosse strategie nel produrre il report e presentare i dati 1. L’esauriente (per il committente o la funzione . aziendale o politica direttamente interessata 2. Il riassunto (meno approfondito che prende in esame la parte centrale dell’indagine ad uso meno ristretto ma interno) 3. L’essenziale (di solito è la cartella stampa che si comunica all’esterno) Il report e la presentazione Strumenti e trucchi Attenzione ci sono diverti tipi di dati: 1. I dati spendibili (funzionali che confermano che si procede nella giusta direzione) . 2. I dati non politicamente spendibili (fanno emergere criticità o errori nelle scelte, si dicono mediando la comunicazione)
Puoi anche leggere