Introduzione - Moodle@Units
←
→
Trascrizione del contenuto della pagina
Se il tuo browser non visualizza correttamente la pagina, ti preghiamo di leggere il contenuto della pagina quaggiù
Introduzione Domenico De Stefano a.a. 2020/2021 Domenico De Stefano Statistica a.a. 2020/2021 1 / 28
Dettagli Indice 1 Dettagli sul corso 2 La statistica 3 Esempi Domenico De Stefano Statistica a.a. 2020/2021 2 / 28
Dettagli Orario Lezione lunedı̀ 15-18 (teoria) Lezione mercoledı̀ 17-20 (teoria e pratica) Lezione venerdi 11-13 (pratica) Le esercitazioni inizieranno indicativamente la seconda metà di marzo (verrà data comunicazione in merito su moodle) Domenico De Stefano Statistica a.a. 2020/2021 3 / 28
Dettagli Esercitazioni Esercitazioni collettive: metà lezione del mercoledı̀ (cioè 18:30-20) e quando previsto il venerdi Esercitazioni da svolgere a casa individualmente e da consegnare via moodle (su base circa settimanale) Quiz Moodle alla fine di ogni argomento Esercitazioni (anche in gruppo) sulla base del questionario sull’aula (dettagli nelle prossime lezioni) Domenico De Stefano Statistica a.a. 2020/2021 4 / 28
Dettagli Programma del corso Due grandi capitoli: statistica descrittiva e inferenza 1 Statistica descrittiva I Descrizione e sintesi dei dati. I dati. Popolazione e unità statistiche. Scale di misura delle variabili. Distribuzioni di frequenza. Rappresentazione grafiche. Tendenza centrale e di variabilità. I Analisi delle relazioni fra due variabili Distribuzioni di frequenza congiunta. Analisi descrittiva bivariata. Diagrammi di dispersione, covarianza e correlazione. 2 Inferenza statistica I Cenni su calcolo delle probabilità. Definizione e proprietà. Teorema di Bayes. Variabili aleatorie (binomiale, poisson, normale, ecc). Approssimazioni e teorema del limite centrale I Inferenza statistica. Campionamento. Il concetto di inferenza. Stima per intervalli. Verifica di ipotesi. Inferenza per le relazioni tra variabili. Tabelle di contingenza e test di indipendenza. Regressione, interpretazione di un modello di regressione e dell’inferenza per i coefficienti. Domenico De Stefano Statistica a.a. 2020/2021 5 / 28
Dettagli Libri di testo e riferimento Agresti A., Finlay B. Statistica per le scienze sociali. Pearson Italia (va bene anche la nuova edizione dal titolo Metodi statistici di base e avanzati) Appunti dalle lezioni e materiale didattico integrativo fornito dal docente. → moodle2 (moodle2.units.it) Manuale addizionale per approfondimenti: D. M. Levine - Kathryn A. Szabat - David F. Stephan, Statistica (7a Edizione). Pearson Italia Per una introduzione: Diamond I., Jefferies J. Introduzione alla statistica per le scienze sociali. McGraw-Hill Domenico De Stefano Statistica a.a. 2020/2021 6 / 28
Dettagli Esame L’esame consiste in una prova scritta La prova scritta riguarda la soluzione di alcuni esercizi che dovrete risolvere, illustrando il procedimento adottato. Nel caso di mancato superamento, è sconsigliato sostenere l’esame nell’appello immediatamente successivo di una stessa sessione d’esame. Per sostenere l’esame è obbligatorio effettuare l’iscrizione on-line. Le liste saranno chiuse tre (3!) giorni prima della data dell’esame. Domenico De Stefano Statistica a.a. 2020/2021 7 / 28
Dettagli Il questionario sull’aula Visto che il corso parlerà di dati li produrremo. Il questionario sarà attivo fra qualche giorno e ne sarà data notizia via messaggistica di moodle Domenico De Stefano Statistica a.a. 2020/2021 8 / 28
Dettagli Il questionario sull’aula Visto che il corso parlerà di dati li produrremo. Sulla pagina moodle del corso trovate la voce Questionario. Il questionario sarà attivo fra qualche giorno e ne sarà data notizia via messaggistica di moodle Domenico De Stefano Statistica a.a. 2020/2021 8 / 28
Dettagli Il questionario sull’aula Visto che il corso parlerà di dati li produrremo. Sulla pagina moodle del corso trovate la voce Questionario. Cliccando, vi porterà a una pagina di descrizione. Il questionario sarà attivo fra qualche giorno e ne sarà data notizia via messaggistica di moodle Domenico De Stefano Statistica a.a. 2020/2021 8 / 28
Dettagli Il questionario sull’aula Visto che il corso parlerà di dati li produrremo. Sulla pagina moodle del corso trovate la voce Questionario. Cliccando, vi porterà a una pagina di descrizione. Da lı̀, cliccando su Continua, iniziate il questionario vero e proprio. Il questionario sarà attivo fra qualche giorno e ne sarà data notizia via messaggistica di moodle Domenico De Stefano Statistica a.a. 2020/2021 8 / 28
Dettagli Il questionario sull’aula Visto che il corso parlerà di dati li produrremo. Sulla pagina moodle del corso trovate la voce Questionario. Cliccando, vi porterà a una pagina di descrizione. Da lı̀, cliccando su Continua, iniziate il questionario vero e proprio. Il questionario si compone di 23 domande, suddivise in 8 schermate. Il questionario sarà attivo fra qualche giorno e ne sarà data notizia via messaggistica di moodle Domenico De Stefano Statistica a.a. 2020/2021 8 / 28
La statistica Indice 1 Dettagli sul corso 2 La statistica 3 Esempi Domenico De Stefano Statistica a.a. 2020/2021 9 / 28
La statistica Cos’è la statistica? La statistica è la scienza che si occupa di raccogliere dati e trarre da essi informazioni/conoscenza. • I dati possono aiutare a capire i fenomeni, occorre però raccogliere i dati che servono, e farlo bene; i dati vanno poi esaminati in modo da isolare e evidenziare le informazioni che si cercano. • La statistica si occupa, a partire da una domanda su un fenomeno, di stabilire quali dati possano essere usati per rispondere a quella domanda, e, se i dati non sono già disponibili, come debbano essere raccolti. Segue poi la fase in cui si analizzano i dati per estrarre le informazioni cercate. Domenico De Stefano Statistica a.a. 2020/2021 10 / 28
La statistica Cos’è la statistica? (2) Schematicamente le fasi di un’analisi statistica sono formulare una domanda, tradurre un’esigenza conoscitiva in modo che sia suscettibile di una risposta in termini statistici; individuare o raccogliere i dati, è un ambito vasto, che va sotto il nome di disegno sperimentale e campionamento; i fondamenti poggiano sul calcolo delle probabilità; organizzare e guardare i dati, dalla massa di dati cosı̀ com’è non è immediato estrarre le informazioni che servono, si possono però sintetizzare opportunamente e/o rappresentarli graficamente, in funzione delle informazioni cercate; Domenico De Stefano Statistica a.a. 2020/2021 11 / 28
La statistica Cos’è la statistica? (3) modellare si formula (specifica) un modello probabilistico che possa spiegare i dati osservati in base alle ipotesi fatte sul fenomeno, si stima il modello usando i dati. Il modello potrà essere usato per confermare o smentire delle ipotesi fatte sul fenomeno e/o per previsioni su future istanze. Domenico De Stefano Statistica a.a. 2020/2021 12 / 28
Esempi Indice 1 Dettagli sul corso 2 La statistica 3 Esempi Popolazione e mortalità Politica ed economia Statistica e guerre Altri tipi di dati Domenico De Stefano Statistica a.a. 2020/2021 13 / 28
Esempi Demografia Indice 1 Dettagli sul corso 2 La statistica 3 Esempi Popolazione e mortalità Politica ed economia Statistica e guerre Altri tipi di dati Domenico De Stefano Statistica a.a. 2020/2021 14 / 28
Esempi Demografia I primi dati I dati sulla popolazione e la mortalità sono forse tra i primi a essere raccolti. È con esse che i primi “statistici” (in realtà sono personaggi che hanno varie occupazioni, alcuni, ma non tutti, sono scienziati) si cimentano. A Londra per esempio nel 1600 si compilano e pubblicano settimanalmente i Bills of mortality, che riportano il numero di decessi per varie cause. Domenico De Stefano Statistica a.a. 2020/2021 15 / 28
Esempi Demografia I primi dati I dati sulla popolazione e la mortalità sono forse tra i primi a essere raccolti. È con esse che i primi “statistici” (in realtà sono personaggi che hanno varie occupazioni, alcuni, ma non tutti, sono scienziati) si cimentano. A Londra per esempio nel 1600 si compilano e pubblicano settimanalmente i Bills of mortality, che riportano il numero di decessi per varie cause. Domenico De Stefano Statistica a.a. 2020/2021 15 / 28
Esempi Demografia I primi dati Domenico De Stefano Statistica a.a. 2020/2021 15 / 28
Esempi Demografia Previsione di epidemie: John Graunt e la peste Tra i primi troviamo John Graunt (1620-1674), di professione negoziante a Londra. Studia i bills of mortality con l’obiettivo, piuttosto moderno, di rilevare l’inizio di epidemie di peste in città. Sarebbe (stato) utile, ad esempio per decidere la quarantena. Sebbene non riesca nell’intento, il suo lavoro è comunque rilevante come studio della popolazione. Domenico De Stefano Statistica a.a. 2020/2021 16 / 28
Esempi Politica ed economia Indice 1 Dettagli sul corso 2 La statistica 3 Esempi Popolazione e mortalità Politica ed economia Statistica e guerre Altri tipi di dati Domenico De Stefano Statistica a.a. 2020/2021 17 / 28
Esempi Politica ed economia Dati economici L’altro argomento “caldo” dopo la morte sono i soldi, e in effetti c’è una lunga tradizione anche nella raccolta di dati economici e sociali. Questi esempi di rappresentazione di dati economici si devono a William Playfair (1759-1823), ingegnere e economista politico scozzese. che inventò diversi tipi di grafici:nel 1786 il grafico a linee e il grafico a barreDomenico e nel De1801 Stefanoil grafico a torta. Statistica a.a. 2020/2021 18 / 28
Esempi Politica ed economia Ricchezza e salute Monaco Japan GAPMINDER WORLD 2012 Israel Italy France San Marino Iceland Hong Kong Andorra Switzerland Australia Mapping the Wealth and Health of Nations Spain South Korea Sweden Canada Norway Singapore Liechtenstein Ireland Netherlands New Zealand 80 Cuba Costa Rica Chile Portugal Greece Cyprus UK Austria Germany Luxembourg Healthy Malta Slovenia Finland Belgium Mexico Puerto Rico Taiwan Denmark USA Qatar Brunei Maldives Albania Uruguay Barbados Czech Rep. Bosnia and H. Poland Syria Belize Grenada Serbia DominicaCroatia United Arab Emirates Vietnam 75 Poor Rich Cape Ecuador Sri Lanka Thailand Macedonia Panama Montenegro St.Lucia ArgentinaAntigua St. Kitts Slovak Rep. &Barbuda Bahamas Bahrain Palestine Libya Venezuela Estonia Verde Tunisia & Nevis Kuwait Nicaragua Armenia Egypt Peru Romania Malaysia Hungary Seychelles Dom.R. map layout by Paolo Fausone Georgia Mauritius Honduras Jordan Colombia Turkey Latvia Saudi Paraguay Samoa Jamaica Iran Arabia Oman Morocco Algeria Palau Brazil Bulgaria Lebanon Lithuania Sick China Micronesia Tonga El Salvador St.Vincent life expectancy in years and G. Vanuatu Guatemala Suriname 70 Life Expectancy of the World Bangladesh Guyana Iraq Kosovo Azerbaijan Belarus Trinidad and Tobago North Korea Moldova Indonesia Nepal Solomon Islands Uzbekistan Fiji Mongolia Ukraine Russia Colour by region Laos Philippines Tajikistan Kyrgyzstan Bhutan Kazakhstan Madagascar Pakistan Bolivia Nauru Yemen 65 Myanmar Tuvalu Turkmenistan India Sao Tome Ghana and Principe Cambodia Kiribati Size by population Papua New Guinea Timor-Leste Gabon Namibia Haiti Eritrea Sudan 1000 Income per Person of the World Comoros 100 3 or 10 millions 60 Ethiopia South Sudan less Senegal Tanzania Gambia Mauritania 2011 data for all 193 UN Members and for Djibouti Hong Kong, Kosovo, Palestine, Puerto Congo, Rep. Rico and Taiwan. Liberia Togo Kenya Burkina Benin Documentation and Rwanda Faso Cote d'Ivoire pdf version for print at: 55 Niger gapminder.org/downloads/world-pdf Malawi Guinea Uganda Free to copy, share and Botswana remix, but attribute to South Africa Mali Gapminder Foundation. Zimbabwe Somalia Cameroon Nigeria Angola Equatorial Guinea If you want to see more data visit: Burundi 50 Mozambique www.gapminder.org Zambia Chad Central African Rep. Swaziland Dem. Rep. Congo Lesotho Version 11 September 2012 Guinea-Bissau Afghanistan Sierra Leone 500 1 000 2 000 5 000 10 000 20 000 50 000 income per person in US Dollars (GDP/capita, PPP$ inflation adjusted, log scale) Domenico De Stefano Statistica a.a. 2020/2021 19 / 28
Esempi Statistica e guerre Indice 1 Dettagli sul corso 2 La statistica 3 Esempi Popolazione e mortalità Politica ed economia Statistica e guerre Altri tipi di dati Domenico De Stefano Statistica a.a. 2020/2021 20 / 28
Esempi Statistica e guerre Le forze del nemico Siamo nel 1942, in piena II guerra mondiale. Uno degli elementi più importanti della strategia militare nella IIGM è costituito dai carri armati. Ovviamente, sapere di quanti carri armati disponesse il nemico, e quanti ne producesse, era considerato di primaria importanza. Domenico De Stefano Statistica a.a. 2020/2021 21 / 28
Esempi Statistica e guerre Quanti carri armati? Mettiamoci nei panni degli alleati. Vorremmo stabilire quanti carri armati hanno a disposizione i tedeschi e quanti ne producono. Come? I ricorrendo alle spie (ad esempio, qualcuno con accesso agli archivi del ministero degli armamenti tedesco); I ricorrendo a informazioni prebelliche sulle capacità dell’industria tedesca; C’è però anche un’opzione ‘statistica’, ci si basa sui numeri di serie dei carri catturati. Domenico De Stefano Statistica a.a. 2020/2021 22 / 28
Esempi Statistica e guerre Com’è andata? Dopo la fine della guerra, si sono potute confrontare le varie previsioni con i dati sulla produzione Domenico De Stefano Statistica a.a. 2020/2021 23 / 28
Esempi Altri tipi di dati Indice 1 Dettagli sul corso 2 La statistica 3 Esempi Popolazione e mortalità Politica ed economia Statistica e guerre Altri tipi di dati Domenico De Stefano Statistica a.a. 2020/2021 24 / 28
Esempi Altri tipi di dati Analisi delle reti sociali Per reti sociali qui si intende l’insieme di relazioni in essere tra un gruppo di persone. (Le reti di amicizia in un social network come può essere Facebook ne sono ovviamente un esempio.) Vediamo qui la rappresentazione di un paio di reti di fantasia. Domenico De Stefano Statistica a.a. 2020/2021 25 / 28
Esempi Altri tipi di dati Grey’s Anatomy: rete delle relazioni amorose Nel grafico i cerchi rappresentano i personaggi, rosa le donne, blu i maschi; due cerchi sono uniti da un segmento se i due personaggi hanno avuto una relazione amorosa. Domenico De Stefano Statistica a.a. 2020/2021 26 / 28
Esempi Altri tipi di dati Modelli statistici e videogames Il videogioco plague inc. applica (in maniera deterministica) il modello SIR. La popolazione è divisa in tre gruuppi subscetibles-infected-recovered e alcuni parametri del modello determinano il ritmo del gioco e l’andamento dell’infezione. Domenico De Stefano Statistica a.a. 2020/2021 27 / 28
Puoi anche leggere