I sondaggi e le inchieste - A.A. 2019/2020 Analisi di Mercato Luca Frigau - Università di ...
←
→
Trascrizione del contenuto della pagina
Se il tuo browser non visualizza correttamente la pagina, ti preghiamo di leggere il contenuto della pagina quaggiù
I sondaggi e le inchieste Analisi di Mercato Luca Frigau Dipartimento di Scienze Economiche ed Aziendali - Università di Cagliari A.A. 2019/2020 Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 1 / 63
Sondaggi Il problema Se foste un manager di una catena di supermercati, optereste per l’apertura notturna dei vostri stores? Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 2 / 63
Sondaggi Il problema Per aggredire una nuova fetta di mercato il nuovo management vuole puntare sull’apertura notturna dei propri punti vendita. Per valutare la bontà dell’idea si dovrebbero analizzare i dati relativi alla tipologia del servizio che si vuole offrire. Purtroppo il management non possiede dati a riguardo. Non avendo una propria esperienza sul nuovo servizio, potremmo basare le nostre analisi sull’esperienza dei concorrenti che già fornisco il servizio. Per una valutazione oggettiva ci servirebbero i loro dati. Ottenerli però è praticamente impossibile!! Che fare? Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 3 / 63
Sondaggi Valutazioni a sentimento. . . Il supermercato sempre aperto: “Anche 400 clienti per notte, la domanda cresce”. (Il Corriere) La spesa ora si può fare anche dopo cena. (Il Tirreno) Supermercati, l’orario no stop non serve a fermare il calo dei consumi. (Il Fatto Quotidiano) Supermercati aperti anche la notte, sindacati in rivolta: “Fermateli”. (La Repubblica) Si tratta di considerazioni di opinion leaders? Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 4 / 63
Sondaggi Il sondaggio Chiediamo il parere direttamente agli interessati attraverso un sondaggio. Un sondaggio rappresenta una particolare indagine campionaria la cui realizzazione avviene secondo le seguenti macrofasi: 1 Progettazione 2 Rilevazione dei dati 3 Memorizzazione ed elaborazione dei dati 4 Analisi dei risultati Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 5 / 63
Sondaggi Indagine campionaria Lo studio dei mercati di consumo richiede il sostegno di informazioni e di misure statistiche generalmente acquisibili mediante indagini sul campo. Indagine campionaria selezione, con un criterio convenientemente prefissato, di un numero limitato di elementi (campione) da una popolazione di interesse allo scopo di ottenere informazioni riguardanti alcune caratteristiche (o parametri) della popolazione stessa. Procedimenti inferenziali comportano necessariamente dei rischi usare grande cautela nell’interpretazione dei risultati non sottovalutare le difficoltà di applicare le severe regole procedurali Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 6 / 63
Sondaggi Indagine campionaria cosa la caratterizza. . . vantaggi svantaggi Flessibilità organizzativa abbiamo delle stime dei Costi contenuti parametri di interesse e non i veri valori Riduzione dei tempi di raccolta ed elaborazione dei dati Concentrazione delle risorse disponibili Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 7 / 63
Progettazione Progettazione di un’indagine le macro fasi... 1 Fissare gli obiettivi dell’indagine e identificare la popolazione di riferimento (target population) 2 Preparare il questionario 3 Stabilire un piano di campionamento e scegliere gli stimatori dei parametri d’interesse 4 Determinare la dimensione del campione 5 Definire i criteri di controllo e di correzione degli errori non campionari 6 Valutare i costi di progettazione e di esecuzione Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 8 / 63
Progettazione Obiettivi dell’indagine e target population Obiettivi dell’indagine cosa è... ... Definire gli obiettivi dell’indagine significa fissare quali siano gli aspetti conoscitivi della popolazione a cui si vuole pervenire e a quale livello di approfondimento. Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 9 / 63
Progettazione Obiettivi dell’indagine e target population Identificare la popolazione di riferimento target population Identificare la popolazione di riferimento significa stabilire quali singole unità ne fanno parte e quali ne sono invece escluse, in base alle caratteristiche rilevanti per l’analisi. È possibile pervenire alla popolazione desiderata attraverso l’utilizzo di determinate liste: Liste elettorali Elenchi telefonici Registro delle Imprese Liste provenienti dal WEB ... Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 10 / 63
Rilevazione dei dati Come si rilevano i dati le fasi... Diversi sono i modi per la rilevazione dei dati. Molti dati, che sono tendenzialmente misurazioni, vengono rilevati direttamente con appositi protocolli di trasferimento e quindi vanno a popolare i database da analizzare. es.: flussi di dati aziendali provenienti sistema informativo aziendale, Scontrini elettronici, tessere fedeltà, etc. dati da telerilevamento (centraline, apparecchi per il rilevamento della velocità, sismografi, etc.) file "log" dei siti e portali web dati che provengono da istituti di diffusione di dati (pubblici e privati) . . . e ancora molto Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 11 / 63
Rilevazione dei dati Raccolta dati Metodi di raccolta dei dati I diversi metodi... Questi sono solo i principali metodi per la rilevazione di dati. Questo elenco non è esaustivo ma abbraccia le principali famiglie di metodi che tendono a rilevare dati quando si effettuano sondaggi o inchieste. Interviste Personali (face-to-face interviews) Interviste Telefoniche (telephone interviews) Sondaggi Postali (mail surveys) Sondaggi Internet (web surveys) Interviste Miste (mixed mode surveys) Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 12 / 63
Rilevazione dei dati Raccolta dati Metodi di raccolta dei dati interviste personali metodologia CAPI (Computer Assisted Personal Interview) l’intervistatore impiega il personal computer portatile per compilare contestualmente il questionario. metodologia PAPI (Paper and Pencil Interview) Compilazione manuale del questionario cartaceo. Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 13 / 63
Rilevazione dei dati Raccolta dati Metodi di raccolta dei dati interviste telefoniche metodologia CATI (Computer Assisted Telephone Interview) L’intervistatore compila il questionario contestualmente la telefonata. Il software controlla passo per passo l’intervista e ne verifica le risposte. Viene aggiornato immediatamente il database. metodologia PAPI (telefonica) Compilazione manuale del questionario cartaceo con intervistato al telefono. Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 14 / 63
Rilevazione dei dati Raccolta dati Metodi di raccolta dei dati sondaggi postali sondaggi postali: vantaggi Ha il vantaggio che l’utente non viene influenzato dalla presenza dell’intervistatore, soprattutto nelle domande a carattere personale. sondaggi postali: svantaggi Ma ha il grosso limite di ricevere poche adesioni e tempi lunghi di risposta. Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 15 / 63
Rilevazione dei dati Raccolta dati Metodi di raccolta dei dati Interviste autosomministrate Metodologia CASI (Computer Assisted Self Interview) Sono questionari autosomministrati (come i sondaggi postali) le fasi. . . 1 L’intervistato compila il questionario con un proprio PC (PDE, Prepared Data Entry). 2 L’intervistato risponde al questionario con un tastiera del telefono (TDE, Touchtone Data Entry). 3 A voce chiamando un numero (VRE, Voice Recognition Entry). Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 16 / 63
Rilevazione dei dati Raccolta dati Metodi di raccolta dei dati Sondaggi via Internet Metodologia CAWI (Computer Assisted Web Interview) Non c’è l’intervento di un intermediario, l’utente partecipa spontaneamente e compila il questionario con il proprio PC. Le risposte vengono immediatamente memorizzate in un database. Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 17 / 63
Rilevazione dei dati Questionario Il questionario una definizione. . . alquanto bizzarra Insieme di domande da sottoporre agli intervistati per ottenere le informazioni desiderate. Nella redazione di un questionario, bisogna considerare: la tipologia di intervista selezionata il contenuto delle domande la terminologia da adottare la modalità ed i tempi di risposta la scala di misurazione delle risposte l’ordine delle domande l’impostazione grafica controllo preliminare Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 18 / 63
Rilevazione dei dati Questionario Il questionario la tipologia di intervista Quando si redige un questionario bisogna sempre tener presente quale sia la popolazione oggetto dell’indagine e quale tipo di contatto avviene tra l’intervistatore e il campione dei rispondenti. Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 19 / 63
Rilevazione dei dati Questionario Il questionario il contenuto delle domande Il contenuto è strettamente legato alla natura delle informazioni da rilevare. Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 20 / 63
Rilevazione dei dati Questionario la terminologia la terminologia La terminologia deve essere: CHIARA COMPRENSIBILE PER TUTTI NON SOGGETTA AD INTERPRETAZIONI Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 21 / 63
Rilevazione dei dati Questionario Modalità di risposta Modalità di risposta Le domande possono essere sottoposte in forma : Aperta Chiusa A risposta singola A risposta multipla A classifica Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 22 / 63
Rilevazione dei dati Questionario La scala di misurazione delle risposte La scala di misurazione delle risposte Per informazione statistica si intendono i dati raccolti attraverso un’indagine sulle unità statistiche di un particolare collettivo (popolazione o campione) rispetto a uno o più fenomeni. L’informazione statistica è codificata dal concetto di carattere, inteso come il fenomeno oggetto di studio, rilevato sulle unità statistiche del collettivo di riferimento e codificato secondo le esigenze dell’analisi statistica. Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 23 / 63
Rilevazione dei dati Questionario La scala di misurazione delle risposte La scala di misurazione delle risposte Il carattere può assumere due nomi: variabile quando le modalità sono espresse da numeri cardinali, ossia per esse è possibile definire un’unità di misura (carattere quantitativo) mutabile quando invece le modalità rappresentano delle qualità dette attributi (carattere qualitativo) Nel linguaggio comune il termine variabile viene usato spesso in maniera indistinta sia per le variabili in senso stretto sia per le mutabili. Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 24 / 63
Rilevazione dei dati Questionario La scala di misurazione delle risposte La scala di misurazione delle risposte Terminologia italiana ←→ Terminologia anglosassone carattere qualitativo sconnesso ←→ scala nominale carattere qualitativo ordinato ←→ scala ordinale scala a intervalli carattere quantitativo ←→ scala a rapporti Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 25 / 63
Rilevazione dei dati Questionario La scala di misurazione delle risposte La scala di misurazione delle risposte Con le domande a risposta CHIUSA, la scala di misurazione può essere: nominale (è possibile affermare soltanto se le modalità sono uguali o diverse) ordinale (è possibile soltanto dare un ordine alle sue modalità) intervallo (la distanza tra attributi ha significato) rapporti (esiste uno zero assoluto che misura l’assenza del fenomeno, quindi i rapporti tra misure hanno senso) A seconda della scala è possibile applicare diverse misure e metodologie statistiche. Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 26 / 63
Rilevazione dei dati Questionario La scala di misurazione delle risposte La scala di misurazione delle risposte Relazioni od operazioni che possono essere poste fra le modalità dei caratteri Scala nominale ordinale a intervalli a rapporti uguaglianza e sì sì sì sì disuguaglianza ordinamento no sì sì sì addizione e no no sì sì sottrazione rapporto no no no sì Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 27 / 63
Rilevazione dei dati Questionario Scala nominale (variabili qualitative) Scala nominale Ad ogni risposta corrisponde una etichetta che verrà poi codificata per essere trattata. Il codice non presenta un ordine particolare. esempio maschio femmina occupato inoccupato Cagliari Provincia di Cagliari Altra Provincia Altra Regione Laurea in Ingegneria Laurea in Medicina Laurea in Economia Non esiste un ordine nelle modalità. Le modalità sono nomi/etichette. Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 28 / 63
Rilevazione dei dati Questionario Scala ordinale (variabili qualitative) Scala ordinale Si risponde secondo un ordine logico, relativo all’informazione desiderata. esempi: Metti in ordine di preferenza le seguenti marche: marca A marca B marca C Titolo di studio: elementare media I° grado media II° grado Laurea Età:
Rilevazione dei dati Questionario Scala a intervallo (variabili quantitative) Scala a intervallo La scala di misurazione dell’intensità non prevede lo zero assoluto. Il valore "0" è un punto di riferimento convenzionale. esempi: Temperature: oggi abbiamo 10 ° Celsius, ieri avevamo 20° Celsius. Possiamo dire che c’è una differenza di 10° Celsius. Non possiamo considerare il rapporto tra valori!!! Dire oggi fa il doppio del caldo di ieri non ha nessun senso!! Il valore "0" nella scala Celsius lo ritroviamo come "32" nella scala Fahrenheit. E’ convenzionale. La scala Kelvin è a intervalli? Nella scala Kelvin la temperatura ha una interpretazione diretta in termini del moto delle molecole; il valore 0 K è il punto in cui tale moto cessa del tutto. Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 30 / 63
Rilevazione dei dati Questionario Scala a intervallo: casi particolari Scala a intervallo: casi particolari Alcune scale a intervalli sono particolarmente usate nelle scienze sociali e nell’analisi di mercato. Scala di Likert E’ una scala che varia da 5 a 10 modalità ed esprime accordo o disaccordo su un’affermazione. Differenziale semantico Coppie di aggettivi o proposizioni (in opposizione tra loro). Di solito è a 5 o 7 modalità. Si assegna un punteggio alle modalità (es -2 -1 0 1 2 se a 5 gradi) Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 31 / 63
Rilevazione dei dati Questionario Scala a rapporti (variabili quantitative) Scala a rapporti Si dà la risposta in base ad una scala numerica che prende in considerazione anche il valore zero. Il valore "0" indica l’assenza del fenomeno. esempi: Età Reddito Quantità venduta Fatturato Ha senso considerare il rapporto tra valori. E’ la scala quantitativa per eccellenza Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 32 / 63
Rilevazione dei dati Questionario L’ordine delle domande L’ordine delle domande Le domande devono susseguirsi in modo che l’intervistato sia sempre coinvolto. Iniziare con le domande più semplici e interessanti Raggruppare quelle che presentano lo stesso argomento o la stessa modalità di risposta Dare un senso di continuità al questionario Impiegare le domande filtro Impiegare le domande di controllo Raccogliere informazioni demografiche all’inizio o alla fine? Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 33 / 63
Rilevazione dei dati Questionario L’impostazione grafica L’impostazione grafica In base al tipo di indagine e alla tecnica di raccolta dei dati, ogni questionario deve avere un’appropriata struttura grafica. La grafica rappresenta uno degli strumenti di comunicazione! Stile1 Stile2 Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 34 / 63
Memorizzazione e elaborazione Particolare attenzione riveste la fase di memorizzazione dei dati (non è solo un problema di spazio fisico!!) Spesso errori di valutazione iniziale possono compromettere l’efficacia delle azioni di elaborazione e diffusione dei risultati, o far lievitare i costi di gestione delle informazioni e diffusione dei risultati (ad esempio processi di acquisizione tramite OCR devono essere testati ex-ante). Anche l’elaborazione, il pre-processing e il controllo degli errori rivestono un ruolo importante. Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 35 / 63
Memorizzazione e elaborazione Memorizzazione dei dati Dove memorizziamo e come elaboriamo le fasi... portabilità e compatibilità: la scelta dei supporti di memorizzazione e il modo di archiviazione dei dati per determinate analisi è un punto molto delicato evitare di memorizzare i dati in ambienti software chiusi scelta del software per elaborare: siamo così sicuri che bisogna sempre e comunque ricorrere solo ai fogli di calcolo??? Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 36 / 63
Memorizzazione e elaborazione Elaborazione Controllo preliminare Controllo preliminare Prima di iniziare il sondaggio, una survey o una semplice rilevazione dati, risulta utile sottoporre il questionario ad un piccolo campione test. Buona norma vuole che si consideri il 5% della numerosità del campione e che possibilmente abbia le stesse caratteristiche del campione di riferimento. Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 37 / 63
Memorizzazione e elaborazione Piano di campionamento Piano di campionamento cosa è... È la fase in cui si determina il procedimento con cui viene formato il campione. È importante considerare la rappresentatività del campione! Il campionamento può essere: non probabilistico casuale o probabilistico Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 38 / 63
Memorizzazione e elaborazione Piano di campionamento Campionamento non probabilistico campioni di comodo Non sono campioni statistici Risentono dell’arbitrarietà dell’intervistatore nello scegliere gli intervistati Sono influenzati da bassa rappresentatività geografica (es.: vengono intervistati per comodità, per contenimento dei costi e dei tempi di rilevazione, solo persone residente in uno stesso quartiere o in un solo ipermercato) Non è possibile (non è metodologicamente corretto) generalizzare i risultati alla popolazione Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 39 / 63
Memorizzazione e elaborazione Piano di campionamento Campioni non probabilistici campioni di comodo: esempi Indagine svolta presso un ipermercato L’indagine può essere condizionata dall’ora scelta, dal giorno, dalla posizione in cui ci si ferma per aspettare i potenziali intervistati Risposte date ad un questionario allegato ad una rivista o un libro Non tutti decidono di rispondere Voto tramite App Non è un vero e proprio campionamento ma un’autoselezione nel rispondere Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 40 / 63
Memorizzazione e elaborazione Piano di campionamento Campioni non probabilistici campione a scelta ragionata Si basano sulla scelta ragionata degli intervistati che possono essere opinion leaders oppure unità statistiche che detengono caratteristiche peculiari per l’indagine Permettono un contenimento serio dei costi di rilevazione esempio Per un’indagine sul turismo si chiedono pareri a manager di grandi strutture residenziali, agli EPT di ogni provincia analizzata e alle compagnia di trasporto Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 41 / 63
Memorizzazione e elaborazione Piano di campionamento Campioni non probabilistici campione per quote Molto vicino al campionamento ragionato ma più rigoroso in quanto prevede che vengano rispettate delle quote carratteristiche presenti nella target population Hanno l’ambizione di esser maggiormente rappresentativi dei precedenti in quanto definendo le quote si vincola l’arbitrio degli intervistatori e allo stesso tempo si garantisce la presenza nel campione di tutte le caratteristiche della popolazione Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 42 / 63
Memorizzazione e elaborazione Piano di campionamento Campioni non probabilistici campionamento a valanga (snowball samplig) Prima si intervistano alcune persone che rispondono a determinate caratteristiche richieste e poi queste persone servono per identificare altri da intervistare in una fase successiva. A loro volta questi forniscono utili informazioni per identificare altri soggetti con le caratteristiche per essere inclusi nel campione, creando così un effetto a valanga. E’ comunque un campionamento a più fasi Non è possibile fare inferenza su questi campioni. Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 43 / 63
Memorizzazione e elaborazione Piano di campionamento Campionamento probabilistico o casuale cosa è... Le unità della popolazione hanno prefissate probabilità di essere incluse nel campione determinate dalla regola di selezione scelta. Semplice Stratificato A grappoli Sistematico Ripetuto e . . . tanto altro attenzione! Affronteremo in modo approfondito questo argomento in alcune lezioni dedicate Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 44 / 63
Memorizzazione e elaborazione Piano di campionamento Scelta dell’ampiezza del campione sarà approfondito in seguito Maggiore è la dimensione del campione, maggiore è la spesa da sostenere per l’esecuzione dell’indagine. La scelta della dimensione si fa considerando due fattori: la precisione delle stime limiti e vincoli della spesa Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 45 / 63
Memorizzazione e elaborazione Piano di campionamento Scelta della metodologia per la stima dei parametri cosa è... Quando il campionamento è di tipo casuale è necessario stabilire quali siano gli stimatori dei parametri di interesse. La scelta si basa sulle proprietà di cui gode lo stimatore. Tali proprietà si riferiscono almeno alla: correttezza o non distorsione efficenza consistenza Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 46 / 63
Memorizzazione e elaborazione Piano di campionamento Scelta della metodologia per la stima dei parametri esempio es.: Parametro popolazione: µ Stimatore: media campionaria T Numerosità: n Correttezza → E( Tn ) = µ Efficenza → MSE( Tn ) = E( Tn − µ)2 Consistenza → limn→∞ P(| Tn − µ| < e) = 1 Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 47 / 63
Memorizzazione e elaborazione Valutazione dei costi Valutazione dei costi i costi La funzione dei costi si compone di 3 parti: COSTI FISSI: indipendenti dalle scelte adottate COSTI DIPENDENTI DAL CAMPIONAMENTO: relativi al tipo di piano di campionamento selezionato, qualora sia casuale COSTI VARIABILI: dipendenti dalla dimensione ed allocazione del campione Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 48 / 63
Memorizzazione e elaborazione Valutazione errori Valutazione degli errori gli errori Abbiamo due macro tipologie di errori: Errori campionari: la dimensione del campione gioca un ruolo fondamentale sulla qualità dell’indagine. Affronteremo questi errori quando analizzeremo il campionamento in dettaglio nelle prossime lezioni. Errori non Campionari: dipendenti dalla tipologia di indagine! Vale tendenzialmente questa relazione minore è l’errore campionario maggiore è l’errore non campionario Gli errori sono tra loro dipendenti Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 49 / 63
Memorizzazione e elaborazione Valutazione errori Profilo dell’errore l’errore complessivo Il contenimento simultaneo dei due tipi di errore è difficile per motivi di tempo e costi. Difficile la misurazione dell’errore complessivo (Total Survey Error o Tse) non essendo noti i parametri della popolazione. Caso del campionamento semplice Ȳ media del carattere della popolazione ȳce media del campione ȳcp media del campione effettivamente realizzato Tse = f (Ȳ − ȳcp ) + f (ȳcp − ȳce ) Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 50 / 63
Memorizzazione e elaborazione Valutazione errori Punto di equilibrio trade-off Il punto di equilibrio tra le risorse investite nell’accuratezza del campione (riduzione errori non campionari) e nell’aumentare la numerosità del campione (riduzione errori campionari) dipende se l’obiettivo di ricerca è descrittivo (i.e. stimare singoli parametri) o relazionale (i.e. analizzare le relazioni tra variabili). Descrittivo → rappresentatività del campione Relazionale → possibile usare anche campioni non perfettamente rappresentativi (sempre che la causa di mancata intervista non sia legata al carattere oggetto di studio!!) Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 51 / 63
Memorizzazione e elaborazione Valutazione errori Errori non campionari Due problemi. . . Variano da indagine ad indagine e non sono controllabili a priori. Vengono classificati in: Problemi di mancata osservazione Problemi di misurazione Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 52 / 63
Memorizzazione e elaborazione Valutazione errori Errori non campionari Problemi di mancata osservazione. . . Vengono classificati in: Errori di mancata copertura: sono errori derivanti dall’incompletezza delle liste Errori di mancata risposta impossibilità di contattare gli intervistati incapacità cognitive delle persone rifiuto a partecipare Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 53 / 63
Memorizzazione e elaborazione Valutazione errori Problemi di mancata osservazione. . . interventi correttivi. . . per gli errori di mancata copertura: Metodo della post-stratificazione per gli errori di mancata risposta PREVENTIVI: dare un preavviso, formare l’intervistatore CONTEMPORANEI: incentivi per la collaborazione SUCCESSIVI: SOSTITUZIONE: si sostituiscono i non rispondenti con le unità di una lista di riserva IMPUTAZIONE: o stocastica o da modello Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 54 / 63
Memorizzazione e elaborazione Valutazione errori Problemi di mancata copertura. . . esempio delle liste incomplete Situazione ottima → corrispondenza biunivoca perfetta tra componenti lista e popolazione obiettivo. Le liste sono spesso incomplete (elenchi telefonici, Registri delle Imprese, etc.). Consideriamo quindi per una lista Nc # unità coperte Ȳc media variabile unità coperte Nnc # unità non coperte Ȳnc media variabile non coperte N = Nc + Nnc Ȳ media popolazione Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 55 / 63
Memorizzazione e elaborazione Valutazione errori Problemi di mancata copertura. . . esempio delle liste incomplete Nc Nnc Nnc Ȳ = Ȳc + Ȳnc ⇒ Ȳc − Ȳ = (Ȳc − Ȳnc ) N N N Ȳc − Ȳ distorsione Nnc N tasso di mancata copertura Ȳc − Ȳnc differenza tra le medie (difficile da valutare, queste informazioni devono essere raccolte usando metodi di raccolta alternativi a quello utilizzato.) Possibilità di correggere le distorsioni mediante procedure di post-stratificazione o di integrazioni di liste. Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 56 / 63
Memorizzazione e elaborazione Valutazione errori Problemi di mancata copertura. . . Post-stratificazione Riclassificare i dati riproporzionandoli, cioè adeguare l’informazione campionaria alla composizione relativa della popolazione rispetto alle modalità di uno o più caratteri. I caratteri di post-stratificazione devono essere connessi sia con quelli di interesse sia con il motivo che ha portato la mancata copertura. sia nota la proporzione dei singoli strati della popolazione gli strati siano omogenei al loro interno ed eterogenei tra loro Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 57 / 63
Memorizzazione e elaborazione Valutazione errori Problemi di mancata copertura. . . Integrazioni di liste Uso simultaneo di una doppia base di campionamento e di una duplice modalità di raccolta dei dati. L’allocazione ottimale del campione è stabilita con un modello di costo e uno di errore. Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 58 / 63
Memorizzazione e elaborazione Valutazione errori Errori non campionari Problemi di misurazione. . . Errori che emergono nella fase della rilevazione errori dovuti alla redazione del questionario. Es.: ambiguità delle domande errori dovuti alle singole risposte. Es.: incomprensione o mancanza di volontà di rispondere con attenzione errori legati alla tecnica di raccolta dati. errori legati al comportamento degli intervistatori. Es: influenza degli intervistatori nella conduzione dell’intervista; inadeguatezza degli intervistatori (non all’altezza del problema specifico). etc. Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 59 / 63
Memorizzazione e elaborazione Valutazione errori Errori non campionari Problemi di misurazione. . . Errori che emergono nelle fasi successive alla rilevazione errori di revisione errori di codifica errori di registrazione errori di elaborazione errori di stampa Si tratta di errori rilevanti che coinvolgono gli operatori. Da prevenire con controlli di natura informatica. Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 60 / 63
Memorizzazione e elaborazione Valutazione errori L’elaborazione Le fasi. . . C’è sempre la possibilità di non affidarsi ad esperti e . . . il tranello è invisibile e dietro l’angolo!!! Prima di procedere all’elaborazione vera e propria (tentazione iniziale di tutti) bisognerebbe almeno. . . Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 61 / 63
Memorizzazione e elaborazione Valutazione errori L’elaborazione Le fasi. . . considerare le fasi di preprocessing e il data cleaning la codifica e ricodifica dei dati passaggio dal data base al data base statistico individuazione delle metodologie statistiche più performanti analisi esplorativa univariata e bivariata dei singoli indicatori analisi esplorativa multivariata definizione di modelli non parametrici suggeriti dai risultati delle fasi precedenti validazione dei risultati ed eventuale rielaborazione Analizzeremo in una fase del corso questi aspetti Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 62 / 63
Analisi dei risultati Come si analizzano i risultati . . . un mondo a se La fase di analisi dei risultati è delicatissima. Richiede alcuni ingredienti. . . competenze tecniche specifiche ampia esperienza in letteratura capacità critica capacità di ascolto capacità di rendere comprensibili i risultati di metodologie complesse Luca Frigau - A.A. 2019/2020 I sondaggi e le inchieste 63 / 63
Puoi anche leggere