Analisi delle serie storiche . Analisi grafiche, numeriche e pattern tipici

Pagina creata da Nicolo' Alfano
 
CONTINUA A LEGGERE
Capitolo 2
        Analisi delle serie storiche .
Analisi grafiche, numeriche e pattern tipici

                                           1
Una precisazione: dati cross section e serie storiche

Dati cross section (trasversali): tutte le osservazioni si riferiscono al
medesimo periodo/istante di tempo
ƒ prezzo ($US), miglia per gallone, nazione di origine di 45 auto

Serie storiche: dati ordinati rispetto al tempo
ƒ produzione mensile di birra in Australia da gennaio 1990 a dicembre
1994

                                                                      2
Dati cross-section: esempi di dati su 45 auto
                 Ma rca                       Na zione   mpg        Prezzo
                 Chevrolet Caprice            USA              18     14525
                 Chevrolet Lumina             USA              18     13995
                 Dodge Gran Caravan           USA              18     15395
                 Ford Aerostar                USA              18     12267
mpg:             Ford Mustang
                 Mazda MPV
                                              USA
                                              JAP
                                                               18
                                                               19
                                                                      12164
                                                                      14944
miglia per       Nissan Van
                 Chevrolet Camaro
                                              JAP
                                              USA
                                                               19
                                                               19
                                                                      14799
                                                                      11545

gallone          Acura Legend
                 Ford LTD Crown Victoria
                                              JAP
                                              USA
                                                               20
                                                               20
                                                                      24760
                                                                      17257
                 Mitsubishi Wagon             JAP              20     14929
                 Nissan Axxess                JAP              20     13949
                 Mitsubishi Sigma             JAP              21     17879
                 Nissan Stanza                JAP              21     11650
                 Buick Century                USA              21     13150
                 Mazda 929                    JAP              21     23300
                 Oldsmobile Cutkas Ciera      USA              21     13150
                 Oldsmobile Cutlass Supreme   USA              21     14495
                 Chrysler Le Baron Coupé      USA              22     12495
                 Chrysler New Yorker          USA              22     16342
                 Eagle Premier                USA              22     15350
                 Ford Taurus                  USA              22     13195
                 Nissan Maxima                JAP              22     17899
                 Buick Skylark                USA              23     10565
                 Oldsmobile Calais            USA              23      9995
                 Ford Thunderbird             USA              23     14980
                 Toyota Cressida              JAP              23     21498
                 Buick Le Sabre               USA              23     16145
                 Nissan 240SX                 JAP              24     13249
                 Ford Tempo                   USA              24      9483
                 Subaru Loyale                JAP              25      9599
                 Chrysler Le Baron            USA              25     10945
                 Mitsubishi Galant            JAP              25     10989
                 Plymouth Laser               USA              26     10855
                 Chevrolet Beretta            USA              26     10320
                 Dodge Daytona                USA              27      9745
                 Honda Prelude                JAP              27     13975
                 Subaru XT                    JAP              28     13071
                 Ford Probe                   USA              30     11470
                 MazdaProtege                 JAP              32      6599
                 Eagle Summit                 USA              33      8895
                 Ford Escort 4                USA              33      7402
                 Honda Civic CRX              JAP              33      9410
                 Subaru Justy                 JAP              34      5866   3
                 Toyota Tercel                JAP              35      6488
Dati cross-section: Miglia/gallone e prezzo ($US)

                 Scatterplot

         25000
Prezzo

         15000

         5000
                     20        25         30    35
                                    mpg

                                                              4
Dati cross-section: Miglia/gallone, prezzo ($US), nazione

          Scatterplot con distinzione del gruppo (nazione)

         25000                                               JAP
                                                             USA
Prezzo

         15000

         5000
                    20         25         30         35
                                    mpg

                                                                   5
Serie storiche: vendite di birra in Australia
Anno      Mese     Quantità   Anno      Mese     Quantità
1991   Gennaio      164.000   1993   Gennaio      139.000
       Febbraio     148.000          Febbraio     143.000
       Marzo        152.000          Marzo        150.000
       Aprile       144.000          Aprile       154.000   Migliaia di litri
       Maggio       155.000          Maggio       137.000
       Giugno       125.000          Giugno       129.000
       Luglio       153.000          Luglio       128.000
       Agosto       146.000          Agosto       140.000
       Settembre    138.000          Settembre    143.000
       Ottobre      190.000          Ottobre      151.000
       Novembre     192.000          Novembre     177.000
       Dicembre     192.000          Dicembre     184.000
1992   Gennaio      147.000   1994   Gennaio      151.000
       Febbraio     133.000          Febbraio     134.000
       Marzo        163.000          Marzo        164.000
       Aprile       150.000          Aprile       126.000
       Maggio       129.000          Maggio       131.000
       Giugno       131.000          Giugno       125.000
       Luglio       145.000          Luglio       127.000
       Agosto       137.000          Agosto       143.000
       Settembre    138.000          Settembre    143.000
       Ottobre      168.000          Ottobre      160.000
       Novembre     176.000          Novembre     180.000
       Dicembre     188.000          Dicembre     182.000
                                                                                6
Serie storiche: vendite di birra in Australia

                    Timeplot: serve per evidenziare andamenti sistematici rispetto al
                    tempo
                     200.000
                     190.000
                     180.000
Migliaia di litri

                     170.000
                     160.000
                     150.000
                     140.000
                     130.000
                     120.000
                               1991      1992          1993         1994

                                                                                        7
Tipi di serie storica

ƒ Continua: il fenomeno è rilevato per intervalli infinitesimi di
tempo
ƒ Discreta: il fenomeno è rilevato solo ad intervalli di tempo

ƒ Stock (di livelli): grandezza riferita ad un istante di tempo (es,
popolazione residente al 31.12.2001) che cambia consistenza
per una serie di flussi.
ƒ Flusso: grandezza riferita ad un intervallo di tempo (es.
numero di nati in un mese)

                                                                       8
Sintesi numeriche di una serie storica
Alcune statistiche univariate

Indici di posizione
ƒ Media
ƒ Mediana
ƒ Percentili

Indici di dispersione o variabilità
ƒ   MAD: mean absolute deviation
ƒ   MSD: mean squared deviation
ƒ   S2 : varianza
ƒ   S : standard deviation
                                                        9
Sintesi numeriche: indici di variabilità
                                       n
                                       (
                                      ∑ i      )
          n

        ∑y −y                              −
                                                2
                i
                                         y   y
MAD=     i =1                  S2 =   i =1

                n                             n −1
         n                              n

        ∑( yi − y)                     (
                                      ∑ i  −   )
                    2                           2
                                         y   y
MSD=    i =1
                               S=      i =1
                                                     = S2
                n                             n −1

Quale unità di misura hanno questi indici ?

                                                            10
Stazionarietà e tipi di pattern sistematici di una serie

ƒ Pattern orizzontale: il livello della serie non cambia e non
sono presenti andamenti sistematici (es. stagionalità, ciclo)
ƒ Pattern stagionale: componente periodica che si ritrova
uguale o quasi uguale a distanza fissa nel tempo (a distanza di
12 periodi per le serie mensili, a distanza di 4 periodi per le serie
trimestrali, a distanza di 7 per le serie giornaliere, ecc.).
ƒ Pattern tendenziale (trend) : componente che varia lentamente
nel tempo
ƒPattern ciclico: la serie presenta aumenti e diminuzioni che
non sono di periodo fisso e che di norma superano il periodo
annuale

                                                                        11
Stazionarietà: definizione intuitiva

Stazionarietà in media
Il livello della serie è costante (media costante nel tempo)
Stazionarietà in varianza
Il range di oscillazione della serie intorno ad una linea che
approssima l’evoluzione temporale della serie è costante
(varianza costante nel tempo)

                                                           12
Pattern orizzontale

Pattern orizzontale. In questo caso la serie oscilla intorno ad un valore
    costante (media della serie) senza andamenti sistematici. Tale serie è
    detta stazionaria in media.
Tipica situazione di dati relativi al monitoraggio di processo produttivo
     quando il processo è sotto controllo.
                       10
         Sample Mean

                        5
                                                             Mean=3.633

                        0

                            0     10       20           30
                                 Sample Number
         Æ Questa serie ha stazionarietà in media e varianza                 13
Pattern orizzontale
12
11
10
 9
 8
 7
 6
 5
 4
 3
 2
 1
 0
     1

         3

             5

                 7

                     9

                         11

                              13

                                   15

                                        17

                                             19

                                                  21

                                                       23

                                                            25

                                                                 27

                                                                      29
Æ Questa serie è stazionaria in media ma non in varianza

                                                                           14
Stagionalità

Temperatura al castello di Nottingham: questa serie non è stazionaria in
media in quanto si può vedere che in corrispondenza di mesi estivi si amo a
livelli alti, in corrispondenza di mesi invernali siamo a livelli bassi ecc.
Quindi c’è una ‘regola’ che guida il livello della serie: non stazionarietà in media.
E’ stazionaria in varianza perché il range di oscillazione non cambia

                                                                                 15
Trend o pattern tendenziale (serie annuale)

Trend o tendenza di fondo.
E’ caratterizzato da un andamento crescente o decrescente di lungo periodo.
La serie della popolazione residente in Italia (all’inizio dell’anno) è un esempio
di andamento tendenziale o trend di tipo crescente.

       58
       56
       54
       52
       50
       48
       46
       44
       42
       40
            gen-48

                     gen-50

                              gen-52

                                       gen-54

                                                gen-56

                                                         gen-58

                                                                  gen-60

                                                                           gen-62

                                                                                    gen-64

                                                                                             gen-66

                                                                                                      gen-68

                                                                                                               gen-70

                                                                                                                        gen-72

                                                                                                                                 gen-74

                                                                                                                                          gen-76

                                                                                                                                                   gen-78

                                                                                                                                                            gen-80
                                                                                                                                                                     16
Trend lineare (serie annuale)
     58
     56
     54
     52
     50
     48
     46
     44
     42
     40
          gen-48

                   gen-50

                            gen-52

                                     gen-54

                                              gen-56

                                                       gen-58

                                                                gen-60

                                                                         gen-62

                                                                                  gen-64

                                                                                           gen-66

                                                                                                    gen-68

                                                                                                             gen-70

                                                                                                                      gen-72

                                                                                                                               gen-74

                                                                                                                                        gen-76

                                                                                                                                                 gen-78

                                                                                                                                                          gen-80
E’ non stazionaria in media in quanto prendendo periodi diversi
(es. decenni diversi) il livello della serie cambia
E’ stazionaria in varianza in quanto prendendo periodi diversi
(es. decenni diversi) il range non cambia Æ andamento lineare
rispetto al tempo
                                                                                                                                                                   17
Trend non lineare (serie annuale)

E’ non stazionaria in media in quanto prendendo periodi diversi (es.
decenni diversi) il livello della serie cambia
E’ non stazionaria in varianza in quanto prendendo periodi diversi (es.
decenni diversi) il range cambia Æ andamento non lineare rispetto al tempo
                                                                        18
Pattern stagionale e trend (stazionarietà in varianza ma non in media)

  E’ non stazionaria in media perché ha oscillazioni strettamente
  periodiche e trend (v. linee rosse in crescita)
  E’ stazionaria in varianza perché il range non cambia nel tempo (v.
  distanza fra le linee rosse)
                                                                        19
Pattern stagionale e trend (non stazionarietà in media e in varianza)

 E’ non stazionaria in media perché ha oscillazioni strettamente
 periodiche e trend (v. linee rosse in crescita)
 E’ non stazionaria in varianza perché il range cambia nel tempo (v.
 distanza fra le linee rosse)
                                                                       20
Pattern ciclico

Pattern ciclico.

Questo tipo di andamento è presente quando la serie presenta
aumenti e diminuzioni che non sono di periodo fisso e che di
norma superano il periodo annuale.

Questa è la principale differenza fra le fluttuazioni cicliche e
quelle stagionali.

Nelle serie economiche il pattern ciclico è determinato dalle
espansioni e contrazioni dell’economia dovuti a fenomeni
congiunturali.

                                                               21
Valore aggiunto ai prezzi di mercato
 dell’industria in senso stretto in Italia (dati annuali, a prezzi 95)
                         Milioni di eurolire

     280.000
     260.000
     240.000
     220.000
     200.000
     180.000
     160.000
     140.000
     120.000
     100.000
           70

           73

           76

           79

           82

           85

           88

           91

           94

           97

           00

           03
         19

         19

         19

         19

         19

         19

         19

         19

         19

         19

         20

         20
Oscillazione intorno al trend (retta rossa): ciclo economico

                                                                         22
Grafici che aiutano a individuare le componenti
      255

      205          Time plot                                                                    Serie trimestrale
      155
                                                                                                (15 anni)
      105

          55

          5
               1       5   9   13   17   21    25   29   33   37   41   45   49   53   57

    250
                                                                                                  1

                                              Seasonal plot                                       2
                                                                                                  3
    200                                                                                           4
                                                                                                  5
                                                                                                  6
    150                                                                                           7
                                                                                                  8
y

                                                                                                  9
                                                                                                  10
    100
                                                                                                  11
                                                                                                  12
                                                                                                  13
     50                                                                                           14
                                                                                                  15

      0
                   1                           2                         3                  4                  23
                                                         Trimestre
                                                          trim e
Grafici che aiutano a individuare le componenti

Grafico serie su anni
Ordinata: yt
Ascissa: anno

           250
                                               Serie trimestrale
           200                                 (15 anni)

           150
       y

           100

            50

                            Anno
            0
                 0      5           10    15
                             Year
                                                         24
Serie storiche: autocovarianza e autocorrelazione

Autocovarianza e autocorrelazione sono le corrispondenti della
varianza e della correlazione, per una serie storica univariata

Servono per controllare la memoria della serie misurando quanto i
valori al tempo t dipendono linearmente da quelli al tempo t-k (k è
detto lag)
                  n

                ∑ (y           t   − y )( yt − k − y )   Autocovarianza di periodo k
        ck =   t = k +1
                                       n
                  n

                ∑ (y        t      − y )( yt − k − y )
                                                         Autocorrelazione di periodo k
        rk =   t = k +1
                           n

                          ∑ (y            − y)
                                              2
                                      t
                          t =1
                                                                                   25
Serie storiche: funzione di autocorrelazione (rk versus k)
                                      Autocorrelation Function for Mlitri
Autocorrelation    1.0
                   0.8
                   0.6
                   0.4
                   0.2
                   0.0
                  -0.2
                  -0.4
                  -0.6
                  -0.8
                  -1.0

                               2                           7                             12                      17

                         Lag Corr        T     LBQ    Lag Corr        T     LBQ    Lag Corr         T    LBQ

                          1    0.47    3.21   10.99    8   -0.14   -0.62   38.86    15   -0.08   -0.30   77.55
                          2    0.08    0.45   11.31    9   -0.10   -0.42   39.42    16   -0.14   -0.50   78.97
                          3   -0.08   -0.44   11.63   10   -0.03   -0.13   39.48    17   -0.17   -0.62   81.24
                          4   -0.18   -1.04   13.44   11    0.34    1.49   46.90    18   -0.32   -1.14   89.37
                          5   -0.31   -1.70   18.59   12    0.58    2.41   68.74
                          6   -0.48   -2.49   31.35   13    0.35    1.29   76.81
                          7   -0.33   -1.55   37.72   14    0.06    0.21   77.05

                                   Questo grafico è detto correlogramma
                                                                                                                      26
AutocorrelazioneÆ memoria della serie (serve per
identificare i pattern)
-presenza di trend: forte autocorrelazione positiva
per numerosi lag (es. AirPassengers: passeggeri delle
linee aerre USA) e negativa per altri;
- presenza di stagionalità: autocorrelazione positiva
in corrispondenza del ciclo stagionale e cioè: lag 12
con dati mensili, lag 4 con dati trimestrali, ecc. ;
autocorrelazione negativa in corrispondenza a lag
che individuano punte alte e punte basse stagionali
della serie (es. nottem: temperatura al castello di
Nottingham); la stagionalità determina l’andamento ad
‘onde’ del correlogramma della serie AirPassengers.
                                                        27
Autocorrelazione
   Time plot

N.B. Il grafico parte dal lag 0: correlazione fra yt e yt che è

                                                                  28
Temperatura al castello di Nottingham

Time plot               Autocorrelazione

                                           29
Serie puramente accidentale

Time plot                   Autocorrelazione

                                               30
Puoi anche leggere