Esempi e trucchi di statistica pratica nei sondaggi Come si fa un sondaggio

Pagina creata da Fabio Grieco
 
CONTINUA A LEGGERE
Esempi e trucchi di statistica pratica nei sondaggi Come si fa un sondaggio
La statistica è
                        facile e ogni
                         tanto utile!!

   Esempi e trucchi di statistica
      pratica nei sondaggi

     Come si fa un sondaggio
Una ricerca o un sondaggio seguono un processo
   di produzione:
1. Determinazione dei bisogni informativi (e
   budget)
2. Progettazione del disegno di ricerca
     a) Scelta tra campionamento probabilistico non probabilistico
     b) Scelta della modalità di raccolta dei dati
     c) Stesura dello strumento di rilevazione
3. Raccolta dei dati (Field)
4. Analisi ed interpretazione dei dati
5. Presentazione e consegna del rapporto finale
Esempi e trucchi di statistica pratica nei sondaggi Come si fa un sondaggio
Determinazione dei bisogni
               informativi
    Cercare di comprendere cosa vuol saper il cliente
    Tradurre il concetto, definire il costrutto, infine
       costruire gli indicatori
    Tradurre questo bisogno in un processo attuabile
.
    1. Cosa chiedere (questionario)
    2. A chi chiedere (campione, collettivo)
    3. Come chiedere (CATI, CAWI, CATI)
    4. Quando chiedere e dove

       Determinazione del concetto,
        del costrutto, dell’indicatore
    “Fare a pezzi” tutti gli aspetti del bene, del
       servizio, del processo di scelta in
       elementi il più possibile elementari e su
.      questi elementi minimi realizzare le
       domande.

    L’esempio della qualità di un bene e
       servizio……
Esempi e trucchi di statistica pratica nei sondaggi Come si fa un sondaggio
Un esempio
La qualità per gli uomini

          Censura

          Censura

Un altro esempio
      (per par condicio)
  La qualità le donne

          Censura

          Censura
Determinazione dei bisogni
               informativi
    Cosa rende un uomo o un donna un riferimento
       della moda o del cinema?
    Quali aspetti di “prodotto” fanno di Naomi o di Brad
       due “eccellenze” nei loro “mercati”.
.   Un’osservazione, una misurazione degli aspetti
       che determinano il loro successo possono
       aiutarci a realizzare un’altra storia di successo

    TUTTO SI PUO’ CHIEDERE E SAPERE

        Cosa può fare un sondaggio in
                   politica
    Cosa rende un candidato-sindaco attraente?
    Su quali leve deve puntare?
    La sua immagine è coerente con la percezione che
        di lui ha l’elettorato?
    Cosa interessa davvero al cittadino?
    Cosa vuole la cittadinanza?
    Su quali set valoriali lavorare?
La progettazione del disegno di ricerca
                         2a Scelta del tipo di campione

                            Tipi di campioni

          Campionamenti non                         Campionamenti
             probabilistici                          probabilistici

    A scelta ragionata   Per quote        Casuale semplice       A grappolo

                                            Sistematico          Stratificato

              La determinazione della numerosità
                         campionaria
                           Strumenti e trucchi
     Le ipotesi
     1. La popolazione è normale (in realtà ci occorre
        la normalità della distribuzione della frequenza
        relativa da stimare)
.
     2. Le possibilità di risposta sono 2
     3. Abbiamo possibilità di gestire la misura
        dell’errore
Il campionamento
                       Strumenti e trucchi
    Le ipotesi
    1. La popolazione è normale
        Per risolvere il problema della normalità
        della distribuzione si “sfrutta” la regola
        pratica di Cochran (questo è un trucco!!)
                     npq>9
       Per esempio n=40, p=0,3 npq=8,4 quindi occorre adottare n
       almeno =>43

                 Il campionamento
                       Strumenti e trucchi
    Le ipotesi
    2. Le modalità di risposta sono due
        ll problema può essere posto in questi
.
        termini procedendo ad opportune
        aggregazioni in modo da ricondursi a 2
        possibilità (questo è un trucco!!)
Il campionamento
                             Strumenti e trucchi
    Le ipotesi
    3. Abbiamo possibilità di gestire la misura
        dell’errore
.
      Usiamo il budget a disposizione per
         determinare la numerosità campionaria il
         livello di attendibilità e soprattutto l’errore
        (l’errore è un espediente)

                 Il campionamento
                         Strumenti e “trucchi”

                             Ampiezza del campione per margini di errore massimo
         numerosità della                          pari a
           popolazione           1%       2%       3%       4%         5%       6%
                      1500     1305      938      638      441        316      235
                      2000     1667     1112      714      476        333      244
                      3000     2308     1364      811      517        353      255
                      4000     2858     1539      870      541        364      260
                      5000     3334     1667      909      556        370      264
                      7000     4118     1843      959      574        378      268
.
                     10000     5001     2001     1000      588        385      271
                     15000     6001     2143     1034      600        390      273
                     25000     7143     2273     1064      610        394      275
                     50000     8334     2381     1087      617        397      277
                    100000     9091     2439     1099      621        398      277
                 INFINITA     10000     2500     1111      625        400      278

                              Nelle ipotesi P=0,955 e p=q=0,5
Il campionamento
                                                     Strumenti e “trucchi”
                         Variazioni dell'ampiezza del campione al variare dell'errore atteso

                     10000

                      9000

                      8000

                      7000

                                                                                                             La numerosità campionaria è
        Interviste

                      6000

                      5000
                                                                                                             fortemente influenzata dalla
                      4000
                                                                                                             misura dell’errore
                      3000

                      2000

                      1000

                         0
                                     1                 2                 3                   4                  5            6

                                                                      Errore atteso
                             1500          3000        5000         10000           25000          50000            100000   INFINITA

        Il caso Confindustria Movimento Giovani
    •        L'indagine statistica, che illustriamo di seguito, è realizzata secondo lo
             schema di seguito:
    •        L’unità di rilevazione è l’imprenditore (titolare o socio) non
             personalmente associato ad alcuna associazione

                                1°wave                                            2°wave
                        Interviste ad associati al                    Interviste a non associati al
                           Movimento Giovani                              Movimento Giovani
                               Imprenditori                                   Confindustria

.
                                                     Interviste ad imprenditori            Interviste ad imprenditori
                                                     con aziende associate ad                  con aziende non
                                                           altri movimenti                          associate

    •       Nella seconda wave, la numerosità campionaria è stabilita in base a
            metodologie statistiche probabilistiche a priori in 300 unità, e ci
            attendiamo un campione con un livello di probabilità al 95% ed un errore
            al 4%.
Scelta (elezione) dell’unità
                                                                 Giovane imprenditore                       NO
                                                                      under 40?

                                                                      SI

                                                                    Personalmente                      SI            Chiusura
                                                                      associato?

                                                                                     NO

                     Intervista con richiesta        SI          Azienda associata?
                          soddisfazioni

                                                                                     NO

                                                                    Intervista priva di
                                                                 richiesta soddisfazioni

                                                   Alcuni risultati
                     L'associativismo in futuro sara?

60
             48,54
50
     35,23                      36,13
40
                           31,82
30
                                                                 23,86
20
                                             9,09 7,30                   8,03
10
 0
     Più importante        Più o meno    Meno importante            Non sa
                            costante

                     Aziende non associate      Aziende associate               L'associazione deve valorizzare la figura e il ruolo
                                                                                               dell'imprenditore?

                                                            60
                                                                                           50,00
                                                            50               44,93

                                                            40                                     34,42

                                                            30
                                                                                                                                                 19,20
                                                            20                                               16,30                                       14,86
                                                                      8,33
                                                            10                                                       4,71          6,16
                                                                                                                                          1,09
                                                             0
                                                                         Molto            abbastanza             Poco             Per nulla      Non sa

                                                                                                     Soddisfazione          Importanza
La catena del valore
                    (realizzata con Weka)

                               Soddisfazione troppo difficile da emulare

                L’elaborazione
                  Strumenti e trucchi
    E’ il problema minore
    Ci sono moltissimi software che risolvono il
        problema alcuni sono free (R), alcuni
        sono moduli aggiuntivi di Excel (Phstat)
.
        altri sono commerciali
           Stata (ottimo per biostatistica)
           Spss (ottimo per ricerche sociali-mktg)
           Sas (ottimo per tutto ma non friendly)
Un esempio di output
                              Voti medi alla frutta
                                                                            Medie e
                                                                            istogrammi
      Voto all'appetibilità
       (presentazione,                                              5,71    con excel
     aspetto) delle frutta

  Voto alla quantità della
                                             5,60
    scelta della frutta

  Voto alla quantità della
   frutta offerta (intesa                             5,67                 Medie e
          porzione                                                         intervalli degli
                                                                           errori con
  Voto al gusto e sapore
                                                             5,69          Spss
    della frutta offerta

Il grafico con la retta di regressione
              con Stata
Un esempio di regressione sempre con stata

    Anali della varianza
    Somma dei quadrati della regressione (SQR variabilità spiegata)
    la parte di variabilità attribuibile alla relazione tra api00e enroll
    Somma dei quadrati degli errori (SQE variabilità non spiegata             F = + o - è il quadrato di t
    ossia non attribuibile al modello)                                        di enroll

                                                                                         =SQR/SQT

                                                                                      = Radice quadrata
                                                                                      di SQE/n-2

                                                          Test significativo perché
                                                          “abbastanza diverso da 0

      Il calcolo dei residui del modello
 scatter e enroll ed analisi delle condizioni
                                                   Distribuzione normale degli errori
                                                       (histogram e, normal)

                                                   Omoschedasticità = gli errori devono
                                                     variare di un medesimo ammontare
                                                     sia in corrispondenza di valori
                                                     elevati che piccoli di X

                                                   In questo caso all’aumentare o
                                                       diminuire non aumentano o
                                                       diminuiscono gli errori
                                                       (correlazione? “Correlate”)
                                                   Gli errori devono essere indipendenti
                                                       per ciascun valore di X

                                                   IL MODELLO E’ CORRETTO
Il report e la presentazione
                    Strumenti e trucchi
    E’ una fase critica
    Ci sono 3 grosse strategie nel produrre il report e
        presentare i dati
    1. L’esauriente (per il committente o la funzione
.
        aziendale o politica direttamente interessata
    2. Il riassunto (meno approfondito che prende in
        esame la parte centrale dell’indagine ad uso
        meno ristretto ma interno)
    3. L’essenziale (di solito è la cartella stampa che
        si comunica all’esterno)

        Il report e la presentazione
                    Strumenti e trucchi
    Attenzione ci sono diverti tipi di dati:
    1. I dati spendibili (funzionali che
        confermano che si procede nella giusta
        direzione)
.

    2. I dati non politicamente spendibili (fanno
        emergere criticità o errori nelle scelte, si
        dicono mediando la comunicazione)
Puoi anche leggere