Analisi delle serie storiche . Analisi grafiche, numeriche e pattern tipici
←
→
Trascrizione del contenuto della pagina
Se il tuo browser non visualizza correttamente la pagina, ti preghiamo di leggere il contenuto della pagina quaggiù
Capitolo 2 Analisi delle serie storiche . Analisi grafiche, numeriche e pattern tipici 1
Una precisazione: dati cross section e serie storiche Dati cross section (trasversali): tutte le osservazioni si riferiscono al medesimo periodo/istante di tempo prezzo ($US), miglia per gallone, nazione di origine di 45 auto Serie storiche: dati ordinati rispetto al tempo produzione mensile di birra in Australia da gennaio 1990 a dicembre 1994 2
Dati cross-section: esempi di dati su 45 auto Ma rca Na zione mpg Prezzo Chevrolet Caprice USA 18 14525 Chevrolet Lumina USA 18 13995 Dodge Gran Caravan USA 18 15395 Ford Aerostar USA 18 12267 mpg: Ford Mustang Mazda MPV USA JAP 18 19 12164 14944 miglia per Nissan Van Chevrolet Camaro JAP USA 19 19 14799 11545 gallone Acura Legend Ford LTD Crown Victoria JAP USA 20 20 24760 17257 Mitsubishi Wagon JAP 20 14929 Nissan Axxess JAP 20 13949 Mitsubishi Sigma JAP 21 17879 Nissan Stanza JAP 21 11650 Buick Century USA 21 13150 Mazda 929 JAP 21 23300 Oldsmobile Cutkas Ciera USA 21 13150 Oldsmobile Cutlass Supreme USA 21 14495 Chrysler Le Baron Coupé USA 22 12495 Chrysler New Yorker USA 22 16342 Eagle Premier USA 22 15350 Ford Taurus USA 22 13195 Nissan Maxima JAP 22 17899 Buick Skylark USA 23 10565 Oldsmobile Calais USA 23 9995 Ford Thunderbird USA 23 14980 Toyota Cressida JAP 23 21498 Buick Le Sabre USA 23 16145 Nissan 240SX JAP 24 13249 Ford Tempo USA 24 9483 Subaru Loyale JAP 25 9599 Chrysler Le Baron USA 25 10945 Mitsubishi Galant JAP 25 10989 Plymouth Laser USA 26 10855 Chevrolet Beretta USA 26 10320 Dodge Daytona USA 27 9745 Honda Prelude JAP 27 13975 Subaru XT JAP 28 13071 Ford Probe USA 30 11470 MazdaProtege JAP 32 6599 Eagle Summit USA 33 8895 Ford Escort 4 USA 33 7402 Honda Civic CRX JAP 33 9410 Subaru Justy JAP 34 5866 3 Toyota Tercel JAP 35 6488
Dati cross-section: Miglia/gallone e prezzo ($US) Scatterplot 25000 Prezzo 15000 5000 20 25 30 35 mpg 4
Dati cross-section: Miglia/gallone, prezzo ($US), nazione Scatterplot con distinzione del gruppo (nazione) 25000 JAP USA Prezzo 15000 5000 20 25 30 35 mpg 5
Serie storiche: vendite di birra in Australia Anno Mese Quantità Anno Mese Quantità 1991 Gennaio 164.000 1993 Gennaio 139.000 Febbraio 148.000 Febbraio 143.000 Marzo 152.000 Marzo 150.000 Aprile 144.000 Aprile 154.000 Migliaia di litri Maggio 155.000 Maggio 137.000 Giugno 125.000 Giugno 129.000 Luglio 153.000 Luglio 128.000 Agosto 146.000 Agosto 140.000 Settembre 138.000 Settembre 143.000 Ottobre 190.000 Ottobre 151.000 Novembre 192.000 Novembre 177.000 Dicembre 192.000 Dicembre 184.000 1992 Gennaio 147.000 1994 Gennaio 151.000 Febbraio 133.000 Febbraio 134.000 Marzo 163.000 Marzo 164.000 Aprile 150.000 Aprile 126.000 Maggio 129.000 Maggio 131.000 Giugno 131.000 Giugno 125.000 Luglio 145.000 Luglio 127.000 Agosto 137.000 Agosto 143.000 Settembre 138.000 Settembre 143.000 Ottobre 168.000 Ottobre 160.000 Novembre 176.000 Novembre 180.000 Dicembre 188.000 Dicembre 182.000 6
Serie storiche: vendite di birra in Australia Timeplot: serve per evidenziare andamenti sistematici rispetto al tempo 200.000 190.000 180.000 Migliaia di litri 170.000 160.000 150.000 140.000 130.000 120.000 1991 1992 1993 1994 7
Tipi di serie storica Continua: il fenomeno è rilevato per intervalli infinitesimi di tempo Discreta: il fenomeno è rilevato solo ad intervalli di tempo Stock (di livelli): grandezza riferita ad un istante di tempo (es, popolazione residente al 31.12.2001) che cambia consistenza per una serie di flussi. Flusso: grandezza riferita ad un intervallo di tempo (es. numero di nati in un mese) 8
Sintesi numeriche di una serie storica Alcune statistiche univariate Indici di posizione Media Mediana Percentili Indici di dispersione o variabilità MAD: mean absolute deviation MSD: mean squared deviation S2 : varianza S : standard deviation 9
Sintesi numeriche: indici di variabilità n ( ∑ i ) n ∑y −y − 2 i y y MAD= i =1 S2 = i =1 n n −1 n n ∑( yi − y) ( ∑ i − ) 2 2 y y MSD= i =1 S= i =1 = S2 n n −1 Quale unità di misura hanno questi indici ? 10
Stazionarietà e tipi di pattern sistematici di una serie Pattern orizzontale: il livello della serie non cambia e non sono presenti andamenti sistematici (es. stagionalità, ciclo) Pattern stagionale: componente periodica che si ritrova uguale o quasi uguale a distanza fissa nel tempo (a distanza di 12 periodi per le serie mensili, a distanza di 4 periodi per le serie trimestrali, a distanza di 7 per le serie giornaliere, ecc.). Pattern tendenziale (trend) : componente che varia lentamente nel tempo Pattern ciclico: la serie presenta aumenti e diminuzioni che non sono di periodo fisso e che di norma superano il periodo annuale 11
Stazionarietà: definizione intuitiva Stazionarietà in media Il livello della serie è costante (media costante nel tempo) Stazionarietà in varianza Il range di oscillazione della serie intorno ad una linea che approssima l’evoluzione temporale della serie è costante (varianza costante nel tempo) 12
Pattern orizzontale Pattern orizzontale. In questo caso la serie oscilla intorno ad un valore costante (media della serie) senza andamenti sistematici. Tale serie è detta stazionaria in media. Tipica situazione di dati relativi al monitoraggio di processo produttivo quando il processo è sotto controllo. 10 Sample Mean 5 Mean=3.633 0 0 10 20 30 Sample Number Æ Questa serie ha stazionarietà in media e varianza 13
Pattern orizzontale 12 11 10 9 8 7 6 5 4 3 2 1 0 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 Æ Questa serie è stazionaria in media ma non in varianza 14
Stagionalità Temperatura al castello di Nottingham: questa serie non è stazionaria in media in quanto si può vedere che in corrispondenza di mesi estivi si amo a livelli alti, in corrispondenza di mesi invernali siamo a livelli bassi ecc. Quindi c’è una ‘regola’ che guida il livello della serie: non stazionarietà in media. E’ stazionaria in varianza perché il range di oscillazione non cambia 15
Trend o pattern tendenziale (serie annuale) Trend o tendenza di fondo. E’ caratterizzato da un andamento crescente o decrescente di lungo periodo. La serie della popolazione residente in Italia (all’inizio dell’anno) è un esempio di andamento tendenziale o trend di tipo crescente. 58 56 54 52 50 48 46 44 42 40 gen-48 gen-50 gen-52 gen-54 gen-56 gen-58 gen-60 gen-62 gen-64 gen-66 gen-68 gen-70 gen-72 gen-74 gen-76 gen-78 gen-80 16
Trend lineare (serie annuale) 58 56 54 52 50 48 46 44 42 40 gen-48 gen-50 gen-52 gen-54 gen-56 gen-58 gen-60 gen-62 gen-64 gen-66 gen-68 gen-70 gen-72 gen-74 gen-76 gen-78 gen-80 E’ non stazionaria in media in quanto prendendo periodi diversi (es. decenni diversi) il livello della serie cambia E’ stazionaria in varianza in quanto prendendo periodi diversi (es. decenni diversi) il range non cambia Æ andamento lineare rispetto al tempo 17
Trend non lineare (serie annuale) E’ non stazionaria in media in quanto prendendo periodi diversi (es. decenni diversi) il livello della serie cambia E’ non stazionaria in varianza in quanto prendendo periodi diversi (es. decenni diversi) il range cambia Æ andamento non lineare rispetto al tempo 18
Pattern stagionale e trend (stazionarietà in varianza ma non in media) E’ non stazionaria in media perché ha oscillazioni strettamente periodiche e trend (v. linee rosse in crescita) E’ stazionaria in varianza perché il range non cambia nel tempo (v. distanza fra le linee rosse) 19
Pattern stagionale e trend (non stazionarietà in media e in varianza) E’ non stazionaria in media perché ha oscillazioni strettamente periodiche e trend (v. linee rosse in crescita) E’ non stazionaria in varianza perché il range cambia nel tempo (v. distanza fra le linee rosse) 20
Pattern ciclico Pattern ciclico. Questo tipo di andamento è presente quando la serie presenta aumenti e diminuzioni che non sono di periodo fisso e che di norma superano il periodo annuale. Questa è la principale differenza fra le fluttuazioni cicliche e quelle stagionali. Nelle serie economiche il pattern ciclico è determinato dalle espansioni e contrazioni dell’economia dovuti a fenomeni congiunturali. 21
Valore aggiunto ai prezzi di mercato dell’industria in senso stretto in Italia (dati annuali, a prezzi 95) Milioni di eurolire 280.000 260.000 240.000 220.000 200.000 180.000 160.000 140.000 120.000 100.000 70 73 76 79 82 85 88 91 94 97 00 03 19 19 19 19 19 19 19 19 19 19 20 20 Oscillazione intorno al trend (retta rossa): ciclo economico 22
Grafici che aiutano a individuare le componenti 255 205 Time plot Serie trimestrale 155 (15 anni) 105 55 5 1 5 9 13 17 21 25 29 33 37 41 45 49 53 57 250 1 Seasonal plot 2 3 200 4 5 6 150 7 8 y 9 10 100 11 12 13 50 14 15 0 1 2 3 4 23 Trimestre trim e
Grafici che aiutano a individuare le componenti Grafico serie su anni Ordinata: yt Ascissa: anno 250 Serie trimestrale 200 (15 anni) 150 y 100 50 Anno 0 0 5 10 15 Year 24
Serie storiche: autocovarianza e autocorrelazione Autocovarianza e autocorrelazione sono le corrispondenti della varianza e della correlazione, per una serie storica univariata Servono per controllare la memoria della serie misurando quanto i valori al tempo t dipendono linearmente da quelli al tempo t-k (k è detto lag) n ∑ (y t − y )( yt − k − y ) Autocovarianza di periodo k ck = t = k +1 n n ∑ (y t − y )( yt − k − y ) Autocorrelazione di periodo k rk = t = k +1 n ∑ (y − y) 2 t t =1 25
Serie storiche: funzione di autocorrelazione (rk versus k) Autocorrelation Function for Mlitri Autocorrelation 1.0 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 2 7 12 17 Lag Corr T LBQ Lag Corr T LBQ Lag Corr T LBQ 1 0.47 3.21 10.99 8 -0.14 -0.62 38.86 15 -0.08 -0.30 77.55 2 0.08 0.45 11.31 9 -0.10 -0.42 39.42 16 -0.14 -0.50 78.97 3 -0.08 -0.44 11.63 10 -0.03 -0.13 39.48 17 -0.17 -0.62 81.24 4 -0.18 -1.04 13.44 11 0.34 1.49 46.90 18 -0.32 -1.14 89.37 5 -0.31 -1.70 18.59 12 0.58 2.41 68.74 6 -0.48 -2.49 31.35 13 0.35 1.29 76.81 7 -0.33 -1.55 37.72 14 0.06 0.21 77.05 Questo grafico è detto correlogramma 26
AutocorrelazioneÆ memoria della serie (serve per identificare i pattern) -presenza di trend: forte autocorrelazione positiva per numerosi lag (es. AirPassengers: passeggeri delle linee aerre USA) e negativa per altri; - presenza di stagionalità: autocorrelazione positiva in corrispondenza del ciclo stagionale e cioè: lag 12 con dati mensili, lag 4 con dati trimestrali, ecc. ; autocorrelazione negativa in corrispondenza a lag che individuano punte alte e punte basse stagionali della serie (es. nottem: temperatura al castello di Nottingham); la stagionalità determina l’andamento ad ‘onde’ del correlogramma della serie AirPassengers. 27
Autocorrelazione Time plot N.B. Il grafico parte dal lag 0: correlazione fra yt e yt che è 28
Temperatura al castello di Nottingham Time plot Autocorrelazione 29
Serie puramente accidentale Time plot Autocorrelazione 30
Puoi anche leggere