I sondaggi e le inchieste - A.A. 2019/2020 Analisi di Mercato Luca Frigau - Università di ...

Pagina creata da Stefania Angelini
 
CONTINUA A LEGGERE
I sondaggi e le inchieste
                               Analisi di Mercato

                                  Luca Frigau

      Dipartimento di Scienze Economiche ed Aziendali - Università di Cagliari

                                A.A. 2019/2020

Luca Frigau - A.A. 2019/2020                 I sondaggi e le inchieste           1 / 63
Sondaggi

Il problema

Se foste un manager di una catena di supermercati, optereste per
l’apertura notturna dei vostri stores?

      Luca Frigau - A.A. 2019/2020              I sondaggi e le inchieste   2 / 63
Sondaggi

Il problema

    Per aggredire una nuova fetta di mercato il nuovo management vuole
    puntare sull’apertura notturna dei propri punti vendita.
    Per valutare la bontà dell’idea si dovrebbero analizzare i dati relativi
    alla tipologia del servizio che si vuole offrire.
    Purtroppo il management non possiede dati a riguardo.
    Non avendo una propria esperienza sul nuovo servizio, potremmo
    basare le nostre analisi sull’esperienza dei concorrenti che già
    fornisco il servizio.
    Per una valutazione oggettiva ci servirebbero i loro dati. Ottenerli però
    è praticamente impossibile!!

                                     Che fare?
      Luca Frigau - A.A. 2019/2020               I sondaggi e le inchieste   3 / 63
Sondaggi

Valutazioni a sentimento. . .

     Il supermercato sempre aperto: “Anche 400 clienti per notte, la
     domanda cresce”. (Il Corriere)

     La spesa ora si può fare anche dopo cena. (Il Tirreno)

     Supermercati, l’orario no stop non serve a fermare il calo dei
     consumi. (Il Fatto Quotidiano)

     Supermercati aperti anche la notte, sindacati in rivolta: “Fermateli”.
     (La Repubblica)

Si tratta di considerazioni di opinion leaders?

       Luca Frigau - A.A. 2019/2020              I sondaggi e le inchieste   4 / 63
Sondaggi

Il sondaggio

Chiediamo il parere direttamente agli interessati attraverso un sondaggio.

Un sondaggio rappresenta una particolare indagine campionaria la cui
realizzazione avviene secondo le seguenti macrofasi:
  1   Progettazione
  2   Rilevazione dei dati
  3   Memorizzazione ed elaborazione dei dati
  4   Analisi dei risultati

        Luca Frigau - A.A. 2019/2020              I sondaggi e le inchieste   5 / 63
Sondaggi

Indagine campionaria

Lo studio dei mercati di consumo richiede il sostegno di informazioni e di
misure statistiche generalmente acquisibili mediante indagini sul campo.

Indagine campionaria selezione, con un criterio convenientemente
            prefissato, di un numero limitato di elementi (campione) da
            una popolazione di interesse allo scopo di ottenere
            informazioni riguardanti alcune caratteristiche (o parametri)
            della popolazione stessa.

Procedimenti inferenziali comportano necessariamente dei rischi
    usare grande cautela nell’interpretazione dei risultati
    non sottovalutare le difficoltà di applicare le severe regole procedurali

       Luca Frigau - A.A. 2019/2020              I sondaggi e le inchieste   6 / 63
Sondaggi

Indagine campionaria
cosa la caratterizza. . .

vantaggi                                            svantaggi
      Flessibilità organizzativa                             abbiamo delle stime dei
      Costi contenuti                                        parametri di interesse e non
                                                             i veri valori
      Riduzione dei tempi di
      raccolta ed elaborazione dei
      dati
      Concentrazione delle risorse
      disponibili

         Luca Frigau - A.A. 2019/2020              I sondaggi e le inchieste    7 / 63
Progettazione

Progettazione di un’indagine
le macro fasi...

   1   Fissare gli obiettivi dell’indagine e identificare la popolazione di
       riferimento (target population)
   2   Preparare il questionario
   3   Stabilire un piano di campionamento e scegliere gli stimatori dei
       parametri d’interesse
   4   Determinare la dimensione del campione
   5   Definire i criteri di controllo e di correzione degli errori non campionari
   6   Valutare i costi di progettazione e di esecuzione

         Luca Frigau - A.A. 2019/2020                   I sondaggi e le inchieste   8 / 63
Progettazione   Obiettivi dell’indagine e target population

Obiettivi dell’indagine
cosa è...

...
Definire gli obiettivi dell’indagine significa fissare quali siano gli aspetti
conoscitivi della popolazione a cui si vuole pervenire e a quale livello di
approfondimento.

            Luca Frigau - A.A. 2019/2020                      I sondaggi e le inchieste                  9 / 63
Progettazione   Obiettivi dell’indagine e target population

Identificare la popolazione di riferimento
target population

Identificare la popolazione di riferimento significa stabilire quali singole
unità ne fanno parte e quali ne sono invece escluse, in base alle
caratteristiche rilevanti per l’analisi.

È possibile pervenire alla popolazione desiderata attraverso l’utilizzo di
determinate liste:
     Liste elettorali
     Elenchi telefonici
     Registro delle Imprese
     Liste provenienti dal WEB
     ...

        Luca Frigau - A.A. 2019/2020                     I sondaggi e le inchieste                   10 / 63
Rilevazione dei dati

Come si rilevano i dati
le fasi...

Diversi sono i modi per la rilevazione dei dati.
Molti dati, che sono tendenzialmente misurazioni, vengono rilevati
direttamente con appositi protocolli di trasferimento e quindi vanno a
popolare i database da analizzare.
es.:
       flussi di dati aziendali provenienti sistema informativo aziendale,
       Scontrini elettronici, tessere fedeltà, etc.
       dati da telerilevamento (centraline, apparecchi per il rilevamento della
       velocità, sismografi, etc.)
       file "log" dei siti e portali web
       dati che provengono da istituti di diffusione di dati (pubblici e privati)
       . . . e ancora molto

             Luca Frigau - A.A. 2019/2020                          I sondaggi e le inchieste   11 / 63
Rilevazione dei dati   Raccolta dati

Metodi di raccolta dei dati
I diversi metodi...

Questi sono solo i principali metodi per la rilevazione di dati. Questo
elenco non è esaustivo ma abbraccia le principali famiglie di metodi che
tendono a rilevare dati quando si effettuano sondaggi o inchieste.

      Interviste Personali                                           (face-to-face interviews)
      Interviste Telefoniche                                         (telephone interviews)
      Sondaggi Postali                                               (mail surveys)
      Sondaggi Internet                                              (web surveys)
      Interviste Miste                                               (mixed mode surveys)

         Luca Frigau - A.A. 2019/2020                            I sondaggi e le inchieste    12 / 63
Rilevazione dei dati   Raccolta dati

Metodi di raccolta dei dati
interviste personali

metodologia CAPI (Computer Assisted Personal Interview)
l’intervistatore impiega il personal computer portatile per compilare
contestualmente il questionario.

metodologia PAPI (Paper and Pencil Interview)
Compilazione manuale del questionario cartaceo.

        Luca Frigau - A.A. 2019/2020                            I sondaggi e le inchieste   13 / 63
Rilevazione dei dati   Raccolta dati

Metodi di raccolta dei dati
interviste telefoniche

metodologia CATI (Computer Assisted Telephone Interview)
L’intervistatore compila il questionario contestualmente la telefonata.
Il software controlla passo per passo l’intervista e ne verifica le risposte.
Viene aggiornato immediatamente il database.

metodologia PAPI (telefonica)
Compilazione manuale del questionario cartaceo con intervistato al
telefono.

        Luca Frigau - A.A. 2019/2020                            I sondaggi e le inchieste   14 / 63
Rilevazione dei dati   Raccolta dati

Metodi di raccolta dei dati
sondaggi postali

sondaggi postali: vantaggi
Ha il vantaggio che l’utente non viene influenzato dalla presenza
dell’intervistatore, soprattutto nelle domande a carattere personale.

sondaggi postali: svantaggi
Ma ha il grosso limite di ricevere poche adesioni e tempi lunghi di risposta.

        Luca Frigau - A.A. 2019/2020                            I sondaggi e le inchieste   15 / 63
Rilevazione dei dati   Raccolta dati

Metodi di raccolta dei dati
Interviste autosomministrate

Metodologia CASI (Computer Assisted Self Interview)
Sono questionari autosomministrati (come i sondaggi postali)

le fasi. . .
   1   L’intervistato compila il questionario con un proprio PC (PDE, Prepared Data Entry).
   2   L’intervistato risponde al questionario con un tastiera del telefono (TDE, Touchtone
       Data Entry).
   3   A voce chiamando un numero (VRE, Voice Recognition Entry).

          Luca Frigau - A.A. 2019/2020                            I sondaggi e le inchieste   16 / 63
Rilevazione dei dati   Raccolta dati

Metodi di raccolta dei dati
Sondaggi via Internet

Metodologia CAWI (Computer Assisted Web Interview)
Non c’è l’intervento di un intermediario, l’utente partecipa spontaneamente
e compila il questionario con il proprio PC.

Le risposte vengono immediatamente memorizzate in un database.

        Luca Frigau - A.A. 2019/2020                            I sondaggi e le inchieste   17 / 63
Rilevazione dei dati   Questionario

Il questionario
una definizione. . . alquanto bizzarra

Insieme di domande da sottoporre agli intervistati per ottenere le
informazioni desiderate.

Nella redazione di un questionario, bisogna considerare:
      la tipologia di intervista selezionata
      il contenuto delle domande
      la terminologia da adottare
      la modalità ed i tempi di risposta
      la scala di misurazione delle risposte
      l’ordine delle domande
      l’impostazione grafica
      controllo preliminare

         Luca Frigau - A.A. 2019/2020                            I sondaggi e le inchieste   18 / 63
Rilevazione dei dati   Questionario

Il questionario
la tipologia di intervista

Quando si redige un questionario bisogna sempre tener presente quale
sia la popolazione oggetto dell’indagine e quale tipo di contatto avviene tra
l’intervistatore e il campione dei rispondenti.

         Luca Frigau - A.A. 2019/2020                            I sondaggi e le inchieste   19 / 63
Rilevazione dei dati   Questionario

Il questionario
il contenuto delle domande

Il contenuto è strettamente legato alla natura delle informazioni da rilevare.

        Luca Frigau - A.A. 2019/2020                            I sondaggi e le inchieste   20 / 63
Rilevazione dei dati   Questionario

la terminologia
la terminologia

La terminologia deve essere:

     CHIARA
     COMPRENSIBILE PER TUTTI
     NON SOGGETTA AD INTERPRETAZIONI

        Luca Frigau - A.A. 2019/2020                            I sondaggi e le inchieste   21 / 63
Rilevazione dei dati   Questionario

Modalità di risposta
Modalità di risposta

Le domande possono essere sottoposte in forma :

     Aperta
     Chiusa
            A risposta singola
            A risposta multipla
            A classifica

        Luca Frigau - A.A. 2019/2020                            I sondaggi e le inchieste   22 / 63
Rilevazione dei dati   Questionario

La scala di misurazione delle risposte
La scala di misurazione delle risposte

Per informazione statistica si intendono i dati raccolti attraverso
un’indagine sulle unità statistiche di un particolare collettivo (popolazione o
campione) rispetto a uno o più fenomeni.

L’informazione statistica è codificata dal concetto di carattere, inteso come
il fenomeno oggetto di studio, rilevato sulle unità statistiche del collettivo di
riferimento e codificato secondo le esigenze dell’analisi statistica.

        Luca Frigau - A.A. 2019/2020                            I sondaggi e le inchieste   23 / 63
Rilevazione dei dati   Questionario

La scala di misurazione delle risposte
La scala di misurazione delle risposte

Il carattere può assumere due nomi:
     variabile quando le modalità sono espresse da numeri cardinali, ossia
     per esse è possibile definire un’unità di misura (carattere quantitativo)
     mutabile quando invece le modalità rappresentano delle qualità dette
     attributi (carattere qualitativo)
Nel linguaggio comune il termine variabile viene usato spesso in maniera
indistinta sia per le variabili in senso stretto sia per le mutabili.

        Luca Frigau - A.A. 2019/2020                            I sondaggi e le inchieste   24 / 63
Rilevazione dei dati   Questionario

La scala di misurazione delle risposte
La scala di misurazione delle risposte

 Terminologia italiana                                   ←→         Terminologia anglosassone
 carattere qualitativo sconnesso                         ←→         scala nominale
 carattere qualitativo ordinato                          ←→         scala ordinale
                                                                    scala a intervalli
 carattere quantitativo                                  ←→
                                                                    scala a rapporti

        Luca Frigau - A.A. 2019/2020                            I sondaggi e le inchieste   25 / 63
Rilevazione dei dati   Questionario

La scala di misurazione delle risposte
La scala di misurazione delle risposte

Con le domande a risposta CHIUSA, la scala di misurazione può essere:
     nominale (è possibile affermare soltanto se le modalità sono uguali o
     diverse)
     ordinale (è possibile soltanto dare un ordine alle sue modalità)
     intervallo (la distanza tra attributi ha significato)
     rapporti (esiste uno zero assoluto che misura l’assenza del fenomeno,
     quindi i rapporti tra misure hanno senso)
A seconda della scala è possibile applicare diverse misure e metodologie
statistiche.

        Luca Frigau - A.A. 2019/2020                            I sondaggi e le inchieste   26 / 63
Rilevazione dei dati   Questionario

La scala di misurazione delle risposte
La scala di misurazione delle risposte

Relazioni od operazioni che possono essere poste fra le modalità dei
caratteri
                                                          Scala
                            nominale              ordinale a intervalli                      a rapporti
 uguaglianza e
                                   sì                   sì                    sì                 sì
 disuguaglianza
 ordinamento                      no                    sì                    sì                 sì
 addizione e
                                  no                   no                     sì                 sì
 sottrazione
 rapporto                         no                   no                 no                     sì

        Luca Frigau - A.A. 2019/2020                             I sondaggi e le inchieste                27 / 63
Rilevazione dei dati   Questionario

Scala nominale (variabili qualitative)
Scala nominale

Ad ogni risposta corrisponde una etichetta che verrà poi codificata per
essere trattata. Il codice non presenta un ordine particolare.

esempio
     maschio       femmina
     occupato       inoccupato
     Cagliari    Provincia di Cagliari        Altra Provincia      Altra Regione
     Laurea in Ingegneria         Laurea in Medicina          Laurea in Economia

Non esiste un ordine nelle modalità.
Le modalità sono nomi/etichette.

        Luca Frigau - A.A. 2019/2020                            I sondaggi e le inchieste   28 / 63
Rilevazione dei dati   Questionario

Scala ordinale (variabili qualitative)
Scala ordinale

Si risponde secondo un ordine logico, relativo all’informazione desiderata.

esempi:
     Metti in ordine di preferenza le seguenti marche:              marca A          marca B    marca C
     Titolo di studio:     elementare          media I° grado         media II° grado       Laurea
     Età:
Rilevazione dei dati   Questionario

Scala a intervallo (variabili quantitative)
Scala a intervallo

La scala di misurazione dell’intensità non prevede lo zero assoluto. Il
valore "0" è un punto di riferimento convenzionale.

esempi:
      Temperature: oggi abbiamo 10 ° Celsius, ieri avevamo 20° Celsius. Possiamo dire che c’è una
      differenza di 10° Celsius.
      Non possiamo considerare il rapporto tra valori!!! Dire oggi fa il doppio del caldo di ieri non ha
      nessun senso!!
      Il valore "0" nella scala Celsius lo ritroviamo come "32" nella scala Fahrenheit. E’ convenzionale.

La scala Kelvin è a intervalli? Nella scala Kelvin la temperatura ha una
interpretazione diretta in termini del moto delle molecole;
il valore 0 K è il punto in cui tale moto cessa del tutto.

         Luca Frigau - A.A. 2019/2020                            I sondaggi e le inchieste   30 / 63
Rilevazione dei dati   Questionario

Scala a intervallo: casi particolari
Scala a intervallo: casi particolari

Alcune scale a intervalli sono particolarmente usate nelle scienze sociali e
nell’analisi di mercato.

Scala di Likert
      E’ una scala che varia da 5 a 10 modalità ed esprime accordo o
      disaccordo su un’affermazione.

Differenziale semantico
      Coppie di aggettivi o proposizioni (in opposizione tra loro).
      Di solito è a 5 o 7 modalità.
      Si assegna un punteggio alle modalità (es -2 -1 0 1 2 se a 5 gradi)

         Luca Frigau - A.A. 2019/2020                            I sondaggi e le inchieste   31 / 63
Rilevazione dei dati   Questionario

Scala a rapporti (variabili quantitative)
Scala a rapporti

Si dà la risposta in base ad una scala numerica che prende in
considerazione anche il valore zero.
Il valore "0" indica l’assenza del fenomeno.

esempi:
     Età
     Reddito
     Quantità venduta
     Fatturato

Ha senso considerare il rapporto tra valori.
E’ la scala quantitativa per eccellenza

        Luca Frigau - A.A. 2019/2020                            I sondaggi e le inchieste   32 / 63
Rilevazione dei dati   Questionario

L’ordine delle domande
L’ordine delle domande

Le domande devono susseguirsi in modo che l’intervistato sia sempre
coinvolto.

     Iniziare con le domande più semplici e interessanti
     Raggruppare quelle che presentano lo stesso argomento o la stessa
     modalità di risposta
     Dare un senso di continuità al questionario
     Impiegare le domande filtro
     Impiegare le domande di controllo
     Raccogliere informazioni demografiche all’inizio o alla fine?

        Luca Frigau - A.A. 2019/2020                            I sondaggi e le inchieste   33 / 63
Rilevazione dei dati   Questionario

L’impostazione grafica
L’impostazione grafica

In base al tipo di indagine e alla tecnica di raccolta dei dati, ogni
questionario deve avere un’appropriata struttura grafica.

La grafica rappresenta uno degli strumenti di comunicazione!
  Stile1     Stile2

           Luca Frigau - A.A. 2019/2020                            I sondaggi e le inchieste   34 / 63
Memorizzazione e elaborazione

Particolare attenzione riveste la fase di memorizzazione dei dati (non è
solo un problema di spazio fisico!!)

Spesso errori di valutazione iniziale possono compromettere l’efficacia
delle azioni di elaborazione e diffusione dei risultati, o far lievitare i costi di
gestione delle informazioni e diffusione dei risultati (ad esempio processi
di acquisizione tramite OCR devono essere testati ex-ante).

Anche l’elaborazione, il pre-processing e il controllo degli errori rivestono
un ruolo importante.

       Luca Frigau - A.A. 2019/2020                       I sondaggi e le inchieste   35 / 63
Memorizzazione e elaborazione   Memorizzazione dei dati

Dove memorizziamo e come elaboriamo
le fasi...

       portabilità e compatibilità: la scelta dei supporti di memorizzazione e il
       modo di archiviazione dei dati per determinate analisi è un punto
       molto delicato
       evitare di memorizzare i dati in ambienti software chiusi
       scelta del software per elaborare:
       siamo così sicuri che bisogna sempre e comunque ricorrere solo ai
       fogli di calcolo???

             Luca Frigau - A.A. 2019/2020                         I sondaggi e le inchieste   36 / 63
Memorizzazione e elaborazione   Elaborazione

Controllo preliminare
Controllo preliminare

Prima di iniziare il sondaggio, una survey o una semplice rilevazione dati,
risulta utile sottoporre il questionario ad un piccolo campione test.

Buona norma vuole che si consideri il 5% della numerosità del campione e
che possibilmente abbia le stesse caratteristiche del campione di
riferimento.

        Luca Frigau - A.A. 2019/2020                         I sondaggi e le inchieste   37 / 63
Memorizzazione e elaborazione   Piano di campionamento

Piano di campionamento
cosa è...

È la fase in cui si determina il procedimento con cui viene formato il
campione. È importante considerare la rappresentatività del campione!

Il campionamento può essere:
      non probabilistico
      casuale o probabilistico

            Luca Frigau - A.A. 2019/2020                         I sondaggi e le inchieste   38 / 63
Memorizzazione e elaborazione   Piano di campionamento

Campionamento non probabilistico
campioni di comodo

     Non sono campioni statistici
     Risentono dell’arbitrarietà dell’intervistatore nello scegliere gli
     intervistati
     Sono influenzati da bassa rappresentatività geografica (es.: vengono
     intervistati per comodità, per contenimento dei costi e dei tempi di
     rilevazione, solo persone residente in uno stesso quartiere o in un
     solo ipermercato)
     Non è possibile (non è metodologicamente corretto) generalizzare i
     risultati alla popolazione

       Luca Frigau - A.A. 2019/2020                         I sondaggi e le inchieste   39 / 63
Memorizzazione e elaborazione   Piano di campionamento

Campioni non probabilistici
campioni di comodo: esempi

Indagine svolta presso un ipermercato
L’indagine può essere condizionata dall’ora scelta, dal giorno, dalla
posizione in cui ci si ferma per aspettare i potenziali intervistati

Risposte date ad un questionario allegato ad una rivista o un libro
Non tutti decidono di rispondere

Voto tramite App
Non è un vero e proprio campionamento ma un’autoselezione nel
rispondere

       Luca Frigau - A.A. 2019/2020                         I sondaggi e le inchieste   40 / 63
Memorizzazione e elaborazione   Piano di campionamento

Campioni non probabilistici
campione a scelta ragionata

     Si basano sulla scelta ragionata degli intervistati che possono essere
     opinion leaders oppure unità statistiche che detengono caratteristiche
     peculiari per l’indagine
     Permettono un contenimento serio dei costi di rilevazione

esempio
Per un’indagine sul turismo si chiedono pareri a manager di grandi
strutture residenziali, agli EPT di ogni provincia analizzata e alle
compagnia di trasporto

        Luca Frigau - A.A. 2019/2020                         I sondaggi e le inchieste   41 / 63
Memorizzazione e elaborazione   Piano di campionamento

Campioni non probabilistici
campione per quote

     Molto vicino al campionamento ragionato ma più rigoroso in quanto
     prevede che vengano rispettate delle quote carratteristiche presenti
     nella target population
     Hanno l’ambizione di esser maggiormente rappresentativi dei
     precedenti in quanto definendo le quote si vincola l’arbitrio degli
     intervistatori e allo stesso tempo si garantisce la presenza nel
     campione di tutte le caratteristiche della popolazione

       Luca Frigau - A.A. 2019/2020                         I sondaggi e le inchieste   42 / 63
Memorizzazione e elaborazione   Piano di campionamento

Campioni non probabilistici
campionamento a valanga (snowball samplig)

     Prima si intervistano alcune persone che rispondono a determinate
     caratteristiche richieste e poi queste persone servono per identificare
     altri da intervistare in una fase successiva.
     A loro volta questi forniscono utili informazioni per identificare altri
     soggetti con le caratteristiche per essere inclusi nel campione,
     creando così un effetto a valanga.
     E’ comunque un campionamento a più fasi
     Non è possibile fare inferenza su questi campioni.

       Luca Frigau - A.A. 2019/2020                         I sondaggi e le inchieste   43 / 63
Memorizzazione e elaborazione   Piano di campionamento

Campionamento probabilistico o casuale
cosa è...

Le unità della popolazione hanno prefissate probabilità di essere incluse
nel campione determinate dalla regola di selezione scelta.

      Semplice
      Stratificato
      A grappoli
      Sistematico
      Ripetuto
      e . . . tanto altro

attenzione!
Affronteremo in modo approfondito questo argomento in alcune lezioni
dedicate
            Luca Frigau - A.A. 2019/2020                         I sondaggi e le inchieste   44 / 63
Memorizzazione e elaborazione   Piano di campionamento

Scelta dell’ampiezza del campione
sarà approfondito in seguito

Maggiore è la dimensione del campione, maggiore è la spesa da
sostenere per l’esecuzione dell’indagine.

La scelta della dimensione si fa considerando due fattori:
     la precisione delle stime
     limiti e vincoli della spesa

        Luca Frigau - A.A. 2019/2020                         I sondaggi e le inchieste   45 / 63
Memorizzazione e elaborazione   Piano di campionamento

Scelta della metodologia per la stima dei parametri
cosa è...

Quando il campionamento è di tipo casuale è necessario stabilire quali
siano gli stimatori dei parametri di interesse.

La scelta si basa sulle proprietà di cui gode lo stimatore.

Tali proprietà si riferiscono almeno alla:
      correttezza o non distorsione
      efficenza
      consistenza

            Luca Frigau - A.A. 2019/2020                         I sondaggi e le inchieste   46 / 63
Memorizzazione e elaborazione   Piano di campionamento

Scelta della metodologia per la stima dei parametri
esempio

es.:
Parametro popolazione: µ
Stimatore: media campionaria T
Numerosità: n

Correttezza → E( Tn ) = µ
Efficenza → MSE( Tn ) = E( Tn − µ)2
Consistenza → limn→∞ P(| Tn − µ| < e) = 1

       Luca Frigau - A.A. 2019/2020                         I sondaggi e le inchieste   47 / 63
Memorizzazione e elaborazione   Valutazione dei costi

Valutazione dei costi
i costi

La funzione dei costi si compone di 3 parti:

      COSTI FISSI: indipendenti dalle scelte adottate
      COSTI DIPENDENTI DAL CAMPIONAMENTO: relativi al tipo di piano
      di campionamento selezionato, qualora sia casuale
      COSTI VARIABILI: dipendenti dalla dimensione ed allocazione del
      campione

          Luca Frigau - A.A. 2019/2020                         I sondaggi e le inchieste   48 / 63
Memorizzazione e elaborazione   Valutazione errori

Valutazione degli errori
gli errori

Abbiamo due macro tipologie di errori:

      Errori campionari: la dimensione del campione gioca un ruolo
      fondamentale sulla qualità dell’indagine.

      Affronteremo questi errori quando analizzeremo il campionamento in
      dettaglio nelle prossime lezioni.

      Errori non Campionari: dipendenti dalla tipologia di indagine!

Vale tendenzialmente questa relazione
minore è l’errore campionario maggiore è l’errore non campionario

Gli errori sono tra loro dipendenti

         Luca Frigau - A.A. 2019/2020                         I sondaggi e le inchieste   49 / 63
Memorizzazione e elaborazione   Valutazione errori

Profilo dell’errore
l’errore complessivo

Il contenimento simultaneo dei due tipi di errore è difficile per motivi di
tempo e costi.
Difficile la misurazione dell’errore complessivo (Total Survey Error o Tse)
non essendo noti i parametri della popolazione.

Caso del campionamento semplice
Ȳ media del carattere della popolazione
ȳce media del campione
ȳcp media del campione effettivamente realizzato

                                Tse = f (Ȳ − ȳcp ) + f (ȳcp − ȳce )

        Luca Frigau - A.A. 2019/2020                         I sondaggi e le inchieste   50 / 63
Memorizzazione e elaborazione   Valutazione errori

Punto di equilibrio
trade-off

Il punto di equilibrio tra le risorse investite nell’accuratezza del campione
(riduzione errori non campionari) e nell’aumentare la numerosità del
campione (riduzione errori campionari) dipende se l’obiettivo di ricerca è
descrittivo (i.e. stimare singoli parametri) o relazionale (i.e. analizzare le
relazioni tra variabili).
  Descrittivo → rappresentatività del campione
 Relazionale → possibile usare anche campioni non perfettamente
             rappresentativi (sempre che la causa di mancata intervista
             non sia legata al carattere oggetto di studio!!)

        Luca Frigau - A.A. 2019/2020                         I sondaggi e le inchieste   51 / 63
Memorizzazione e elaborazione   Valutazione errori

Errori non campionari
Due problemi. . .

Variano da indagine ad indagine e non sono controllabili a priori.

Vengono classificati in:

      Problemi di mancata osservazione
      Problemi di misurazione

         Luca Frigau - A.A. 2019/2020                         I sondaggi e le inchieste   52 / 63
Memorizzazione e elaborazione   Valutazione errori

Errori non campionari
Problemi di mancata osservazione. . .

Vengono classificati in:

     Errori di mancata copertura: sono errori derivanti dall’incompletezza
     delle liste
     Errori di mancata risposta
            impossibilità di contattare gli intervistati
            incapacità cognitive delle persone
            rifiuto a partecipare

        Luca Frigau - A.A. 2019/2020                         I sondaggi e le inchieste   53 / 63
Memorizzazione e elaborazione   Valutazione errori

Problemi di mancata osservazione. . .
interventi correttivi. . .

       per gli errori di mancata copertura: Metodo della post-stratificazione
       per gli errori di mancata risposta
              PREVENTIVI: dare un preavviso, formare l’intervistatore
              CONTEMPORANEI: incentivi per la collaborazione
              SUCCESSIVI:
                      SOSTITUZIONE: si sostituiscono i non rispondenti con le unità di una
                      lista di riserva
                      IMPUTAZIONE: o stocastica o da modello

          Luca Frigau - A.A. 2019/2020                         I sondaggi e le inchieste   54 / 63
Memorizzazione e elaborazione   Valutazione errori

Problemi di mancata copertura. . .
esempio delle liste incomplete

Situazione ottima → corrispondenza biunivoca perfetta tra componenti
lista e popolazione obiettivo.
Le liste sono spesso incomplete (elenchi telefonici, Registri delle Imprese,
etc.).

Consideriamo quindi per una lista

     Nc # unità coperte                                    Ȳc media variabile unità coperte
     Nnc # unità non coperte                               Ȳnc media variabile non coperte
     N = Nc + Nnc                                          Ȳ media popolazione

        Luca Frigau - A.A. 2019/2020                         I sondaggi e le inchieste   55 / 63
Memorizzazione e elaborazione   Valutazione errori

Problemi di mancata copertura. . .
esempio delle liste incomplete

                   Nc       Nnc                                                    Nnc
            Ȳ =      Ȳc +     Ȳnc                ⇒           Ȳc − Ȳ =             (Ȳc − Ȳnc )
                   N        N                                                      N

     Ȳc − Ȳ distorsione
      Nnc
      N     tasso di mancata copertura
     Ȳc − Ȳnc differenza tra le medie (difficile da valutare, queste
     informazioni devono essere raccolte usando metodi di raccolta
     alternativi a quello utilizzato.)

Possibilità di correggere le distorsioni mediante procedure di
post-stratificazione o di integrazioni di liste.

        Luca Frigau - A.A. 2019/2020                         I sondaggi e le inchieste            56 / 63
Memorizzazione e elaborazione   Valutazione errori

Problemi di mancata copertura. . .
Post-stratificazione

Riclassificare i dati riproporzionandoli, cioè adeguare l’informazione
campionaria alla composizione relativa della popolazione rispetto alle
modalità di uno o più caratteri.

      I caratteri di post-stratificazione devono essere connessi sia con quelli
      di interesse sia con il motivo che ha portato la mancata copertura.
      sia nota la proporzione dei singoli strati della popolazione
      gli strati siano omogenei al loro interno ed eterogenei tra loro

        Luca Frigau - A.A. 2019/2020                         I sondaggi e le inchieste   57 / 63
Memorizzazione e elaborazione   Valutazione errori

Problemi di mancata copertura. . .
Integrazioni di liste

Uso simultaneo di una doppia base di campionamento e di una duplice
modalità di raccolta dei dati.

L’allocazione ottimale del campione è stabilita con un modello di costo e
uno di errore.

         Luca Frigau - A.A. 2019/2020                         I sondaggi e le inchieste   58 / 63
Memorizzazione e elaborazione   Valutazione errori

Errori non campionari
Problemi di misurazione. . .

Errori che emergono nella fase della rilevazione
      errori dovuti alla redazione del questionario.
      Es.: ambiguità delle domande
      errori dovuti alle singole risposte.
      Es.: incomprensione o mancanza di volontà di rispondere con
      attenzione
      errori legati alla tecnica di raccolta dati.
      errori legati al comportamento degli intervistatori.
      Es: influenza degli intervistatori nella conduzione dell’intervista;
      inadeguatezza degli intervistatori (non all’altezza del problema
      specifico). etc.

        Luca Frigau - A.A. 2019/2020                         I sondaggi e le inchieste   59 / 63
Memorizzazione e elaborazione   Valutazione errori

Errori non campionari
Problemi di misurazione. . .

Errori che emergono nelle fasi successive alla rilevazione
      errori di revisione
      errori di codifica
      errori di registrazione
      errori di elaborazione
      errori di stampa
Si tratta di errori rilevanti che coinvolgono gli operatori.
Da prevenire con controlli di natura informatica.

        Luca Frigau - A.A. 2019/2020                         I sondaggi e le inchieste   60 / 63
Memorizzazione e elaborazione   Valutazione errori

L’elaborazione
Le fasi. . .

C’è sempre la possibilità di non affidarsi ad esperti e . . .
il tranello è invisibile e dietro l’angolo!!!

Prima di procedere all’elaborazione vera e propria
(tentazione iniziale di tutti)

bisognerebbe almeno. . .

           Luca Frigau - A.A. 2019/2020                         I sondaggi e le inchieste   61 / 63
Memorizzazione e elaborazione   Valutazione errori

L’elaborazione
Le fasi. . .

       considerare le fasi di preprocessing e il data cleaning
       la codifica e ricodifica dei dati
       passaggio dal data base al data base statistico
       individuazione delle metodologie statistiche più performanti
               analisi esplorativa univariata e bivariata dei singoli indicatori
               analisi esplorativa multivariata
               definizione di modelli non parametrici suggeriti dai risultati delle fasi
               precedenti
               validazione dei risultati ed eventuale rielaborazione
       Analizzeremo in una fase del corso questi aspetti

           Luca Frigau - A.A. 2019/2020                         I sondaggi e le inchieste   62 / 63
Analisi dei risultati

Come si analizzano i risultati
. . . un mondo a se

La fase di analisi dei risultati è delicatissima.
Richiede alcuni ingredienti. . .
      competenze tecniche specifiche
      ampia esperienza in letteratura
      capacità critica
      capacità di ascolto
      capacità di rendere comprensibili i risultati di metodologie complesse

         Luca Frigau - A.A. 2019/2020                           I sondaggi e le inchieste   63 / 63
Puoi anche leggere