Introduzione alla Business Intelligence

Pagina creata da Antonio Berardi
 
CONTINUA A LEGGERE
Introduzione alla Business Intelligence
E-mail: infobusiness@zucchetti.it

Introduzione
alla Business Intelligence
E-mail: infobusiness@zucchetti.it

                   Introduzione alla
                 Business Intelligence
Introduzione

 Definizione di Business Intelligence:

insieme di processi per raccogliere e analizzare le informazioni sul business
aziendale.

Le parole chiave di questa definizione permettono di andare più in dettaglio:

   -   processi  si tratta di un particolare insieme di processi aziendali, quindi
       come altri processi aziendali (la produzione, le gestione contabile, …)
       comporta il coinvolgimento di strumenti, tecnologie, figure professionali.

   -   raccogliere (informazioni)  una parte di questi processi ha l’obiettivo di
       reperire le informazioni che riguardano il business e che sono “sparse” in
       sistemi informativi diversi e difformi come struttura e tecnologia (si pensi
       al software gestionale aziendale, ad altri dati raccolti in file excel, ad altri
       gestionali “verticali” presenti in azienda).

   -   analizzare (informazioni)  un’altra parte dei processi di BI ha l’obiettivo
       di permettere l’analisi delle informazioni raccolte con strumenti dedicati.

   -   informazioni  nella definizione si parla già di informazioni aziendali, e
       non di dati. La differenza nell’utilizzo dei due termini in realtà è meno
       sottile di quanto possa sembrare: l’informazione è qualcosa che è subito
       fruibile per il ragionamento, il dato ha invece bisogno di essere inserito in
       un contesto, completato, trasformato, ecc.
       Si pensi a un’unica fattura cliente: isolata dal contesto non porta ad
       alcun ragionamento, ed è un dato. Lo stesso dato, inserito nel contesto
       delle altre fatture del cliente e nel tempo, può già produrre ragionamenti
       di confronto o valutazione.

                                           2
E-mail: infobusiness@zucchetti.it

Quindi nei processi di Business Intelligence si possono distinguere:

   -   parte   tecnologica
          o    processo di raccolta dei dati
          o    processo di trasformazione dei dati in informazioni
          o    strumenti software di trasferimento e trasformazione dei dati, di
               analisi, reportistica, distribuzione…

   -   parte informativa
          o report e cruscotti informativi sintetici, ovvero informazioni fruibili
             per
                 l’analisi
                 la reportistica
                 la distribuzione automatica

 Finalità della Business Intelligence:

supporto alle decisioni e controllo delle prestazioni aziendali.

Quindi si parla anche di sistemi di Business Intelligence come di Decision
Support Systems (DSS) oppure di Business Performance Measurement
Systems.

Andando in dettaglio, le soluzioni di Business Intelligence hanno lo scopo di:

   -   rendere fruibili le informazioni ai diversi decisori aziendali in modo
       efficiente, dinamico e profilato

   -   fornire strumenti di estrazione dati che non prevedano un’elevata cultura
       informatica

   -   fornire strumenti di analisi potenti e dinamici: devono permettere di
       creare facilmente elaborazioni (filtri e formule) e di “navigare nei dati”
       seguendo il ragionamento analitico

   -   automatizzare la produzione e distribuzione di reportistica aziendale
       periodica e profilata per i diversi destinatari

                                          3
E-mail: infobusiness@zucchetti.it

 Destinatari delle Business Intelligence

sono tutte le figure aziendali che possono essere coadiuvate dall’analisi dei dati
nel prendere decisioni o nel controllo di fattori chiave del loro operare
quotidiano.

La “genericità” delle finalità delle Business Intelligence permette di allargare il
bacino d’utenza in modo trasversale per tipologia di business, figura
professionale o dimensione aziendale.

Si potrebbe semplificare dicendo che la BI si rivolge a tutti, ma non
indistintamente.
O meglio, i diversi attori delle decisioni aziendali svolgono compiti diversi,
prendono decisioni diverse, oppure verificano performance diverse.
Ciò significa che ognuno di essi ha la necessità di analizzare dati diversi e in
modo differente.
Questo avviene ogni giorno in tutte le attività, quindi potenzialmente la BI è in
grado di coadiuvare ognuna di queste figure; certo è che lo dovrà fare in modo
diverso, con applicazioni diverse, benefici e costi diversi in ogni caso.

Un risvolto molto importante delle soluzione di Business Intelligence è quindi la
distribuzione intelligente delle informazioni, che dovrà essere automatica e
differenziata come:

   -   contenuti distribuiti
   -   frequenza di distribuzione
   -   possibilità di interazione con le informazioni

L’implementazione efficiente di una soluzione distributiva di questo tipo porta a
quella che viene definita “la democratizzazione dell’informazione aziendale”,
che in realtà consiste nel mettere le informazioni necessarie a disposizione di
coloro che possono operare in maniera più oculata, consapevole ed efficiente
grazie alla disponibilità di informazioni.

Nel fare ciò la BI deve però garantire di non cadere nell’estremo opposto,
quindi nell’anarchia informativa, ovvero tutte le informazioni a disposizione di
tutti in modo indistinto e non standardizzato.

                                          4
E-mail: infobusiness@zucchetti.it

                          Basso Valore                              Ok!
                            Aggiunto

 Standardizzazione
  dell’informazione

                                                      Confusione

                              Diffusione dell’informazione

Quindi l’ottimo sfruttamento di una soluzione di BI si ottiene quando
l’informazione distribuita è anche fortemente standardizzata.
Il che non deve significare poca libertà di interazione con le informazioni, ma
piuttosto massima libertà su informazioni certificate.

                                         5
E-mail: infobusiness@zucchetti.it

Glossario

  -   DataBase:
        Insieme di dati riguardanti lo stesso argomento o argomenti correlati.
        Insieme strutturato in modo tale che i dati possano essere utilizzati da
        applicazioni software.
        Oltre ai dati, il database contiene informazioni sulla loro
        rappresentazione e sulle relazioni tra i dati stessi.

         o DataBase Management Systems (DBMS):
             Letteralmente sistemi di gestione dei database, quindi
             applicazioni software in grado di gestire il database e i dati in
             esso contenuti.

         o DataBase Relazionali:
             DataBase strutturati secondo il modello relazionale di
             organizzazione logica dei dati.
             Il modello è basato sui concetti di tabella e relazione: i dati sono
             immagazzinati nel database sotto la forma logica di tabelle
             legate tra loro da relazioni logiche.

  -   Data Warehouse:
        Raccolta di dati (è un database) che provengono da altri database
        utilizzati da applicazioni.
        In particolare le caratteristiche che distinguono un Data Warehouse
        dal DataBase di un’applicazione sono le seguenti:
        o Integrato: contiene dati riguardanti argomenti diversi ma correlati
            (metodi di codifica uniformi, omogeneità semantica,…)
        o Subject Oriented: orientato secondo temi specifici di analisi,
            oppure alle diverse attività di Business, ma non alle applicazioni
        o Time Variant: l’orizzonte temporale dei dati nel DWH è in genere
            più esteso o diverso dell’orizzonte dei dati gestiti dal gestionale, e
            anche gli aggiornamenti / inserimenti sono gestiti in modo
            differente
        o Non volatile: i dati in un DWH, una volta caricati, non sono
            modificabili

  -   SQL:
        (Structured Query Language) è un linguaggio per l’accesso ai dati
        memorizzati in un database.

  -   Query:
        interrogazione a un DataBase in modo da ottenere una parte dei dati
        in esso contenuti. Una query relazionale deve essere formulata in
        linguaggio SQL.

                                        6
E-mail: infobusiness@zucchetti.it

-   ETL:
      (Extraction, Transformation, Loading) è un processo strettamente
      legato al caricamento di dati in un Data Warehouse.
      Nel dettaglio i dati vengono Estratti da database relazionali dedicati ad
      applicazioni, file, altre fonti dati; vengono Trasformati per realizzarne
      l‘integrazione e per renderli pronti per le analisi; infine vengono
      Caricati nel Data Warehouse.

-   OLTP:
      (On Line Transaction Processing): insieme di tecniche software
      finalizzate all’analisi dei dati.
      Le analisi con tecniche OLTP vengono condotte direttamente sui dati
      in “produzione”.
      Ciò permette di non costruire “repliche” dei dati e di disporre sempre
      dei dati aggiornati, ma proprio a causa dell’utilizzo diretto dei dati in
      “produzione” si hanno forti limitazioni nella tipologia e potenza delle
      analisi e prestazioni non soddisfacenti.

-   OLAP:
      (On Line Analytical Processing): insieme di tecniche software
      finalizzate all’analisi complessa e veloce di grandi quantità di dati.
      E’ una componente tecnologica fondamentale dell’analisi dei dati di un
      Data Warehouse.

-   Data Mining:
      Letteralmente “estrazione da una miniera di dati”, si compone di
      applicativi e tecniche software in grado di estrarre delle “regolarità” in
      modo automatico da ingenti quantità di dati.
      Tali regolarità vengono ricercate dagli applicativi software in base a
      regole di elaborazione introdotte dagli utenti.
      Tipico esempio di applicazione lo si ritrova nelle grandi catene di
      distribuzione, che utilizzano le tessere fedeltà per raccogliere dati
      sulle abitudini di acquisto dei clienti (grande quantità di dati) da
      mettere in relazione con le caratteristiche del cliente (sesso, età,
      nucleo famigliare, …), allo scopo di indirizzare con tecniche di
      marketing le abitudini d’acquisto.

-   Analisi multi-dimensionale dei dati:
      permette di estrarre dati da un Data Warehouse senza avere
      conoscenza di linguaggi di interrogazione (SQL), o della struttura
      relazionale del DataBase.
      Permette di formulare la richiesta ai sistemi informativi in un
      linguaggio che è molto vicino al corrente modo di formulare
      interrogativi dell’uomo.

                                      7
E-mail: infobusiness@zucchetti.it

          I concetti base dell’analisi multi-dimensionale sono:
          o Fatti: i concetti sui quali centrare l’analisi
          o Dimensioni: prospettive lungo le quali aggregare i concetti da
             analizzare
          o Misure: unità quantificabili dei concetti da analizzare (fatti)

          Ciò significa che un’ipotetica domanda simile a questa:

          “fatturato in quantità e valore, diviso per mese, agente e categoria
          prodotto”

          viene semplicemente tradotta in una selezione di fatti e dimensioni:

          fatti = fatturato valore, fatturato quantità
          dimensioni = mese, agente, categoria prodotto

          Senza un sistema di analisi multi-dimensionale dei dati, la domanda
          dell’esempio avrebbe dovuto essere formulata con una frase di
          linguaggio SQL.

   -   Query multi-dimensionale:
         selezione di fatti e dimensioni.

Termini propri dell’analisi multi-dimensionale:

   -   Drill-Down – Roll-Up:
          scendere (o salire) in profondità di dettaglio d’analisi.
          Es.:
          Drill-Down: dalla visualizzazione di dati di vendita per agente passare
          a una visualizzazione che comprenda anche il dettaglio dei dati di
          vendita al cliente, suddivisi per agente.

   -   Filtro:
           nell’analisi multi-dimensionale dei dati è possibile definire filtri su tutte
           le entità (dimensioni e fatti) coinvolte nella Query allo scopo di
           concentrare l’analisi solo una parte dei dati.
           Agisce in fase di estrazione dati dal Data Warehouse.

   -   Slice & Dice:
           scegliendo uno o più valori di una o più dimensioni, si focalizza
           l’analisi sui fatti che sono inerenti a tali valori, nascondendo di fatto
           alla visualizzazione tutto ciò che non interessa.
           E’ una sorta di filtro che agisce solo in visualizzazione, non in
           estrazione dati dal Data Warehouse.

                                            8
E-mail: infobusiness@zucchetti.it

-   Formula:
       è un fatto generato tramite un calcolo (più o meno complesso) a
       partire da altri fatti.

                                 9
E-mail: infobusiness@zucchetti.it

Data Warehouse e Data Mart

  -     Data Warehouse:
          magazzino di dati a livello di impresa
                è unico
                contiene informazioni integrate e coerenti, fruibili da parte di
                  strumenti di analisi

  -     Data Mart:
          magazzino di dati a livello dipartimentale
                 è un segmento del Data Warehouse
                 è identico al DWH come concezione (può esserne una parte)
                   ma ha finalità più “ristrette”
                 i dati del Data Mart coprono solo alcune aree aziendali
N.B.:

  •     Il Data Warehouse è un progetto vasto, complesso e costoso; garantisce
        d’altra parte vera coerenza, completezza e disponibilità dei dati aziendali.

  •     Dal Data Warehouse si possono ricavare velocemente i Data Mart
        (approccio Top-Down)

  •     E’ possibile costruire incrementalmente un Data Warehouse a partire da
        più Data Mart (approccio Bottom-Up)

  •     Il Data Mart ha minori costi di analisi e realizzazione, poiché copre
        problematiche di una sola area aziendale: è meno complesso.

  •     Realizzare un Data Mart quindi porta a risultati ottenibili in tempi più
        brevi rispetto alla realizzazione di un Data Warehouse completo.

  •     L’approccio Bottom-Up per la realizzazione di un Data Warehouse
        consente:

            risultati (parziali) ottenibili in tempi brevi: la realizzazione di singoli
             Data Mart sarà più veloce e porterà alla soddisfazione immediata
             delle esigenze all’interno delle singole aree aziendali.

            di diffondere la cultura sull’analisi dei dati e sull’utilizzo di
             strumenti di Business Intelligence in maniera graduale

            di ottenere in ogni passo successivo di analisi un miglioramento e
             “affinamento” delle caratteristiche dei diversi Data Mart che si
             andranno a realizzare.

            di poter giungere alla realizzazione del Data Warehouse per gradi.

                                           10
E-mail: infobusiness@zucchetti.it
Metodo di analisi per la definizione di un Data Warehouse

Il percorso di analisi per la realizzazione di un Data Warehouse deve seguire un
metodo ben definito, in grado di garantire che tutto il progetto possa portare
realmente i vantaggi derivanti dall’utilizzo di soluzioni di Business Intelligence.

Questo metodo, per quanto semplice nei suoi passi, e forse proprio per questo
molto efficiente e sicuro, può portare alla realizzazione incrementale di Data
Warehouse anche molto complessi.
Inoltre coniugando approccio Top-Down e approccio Bottom-Up, consente di
definire un progetto che come obiettivo finale avrà un Data Warehouse
completo, quindi coerente nei diversi temi d’analisi e in grado di garantire
risposte anche alle esigenze di quei decisori che hanno una visione solo globale
dell’impresa; ma nello stesso tempo il progetto sarà in grado di fornire anche
prima della sua conclusione, risposte alle esigenze delle singole aree aziendali,
grazie alla realizzazione dei diversi Data Mart che andranno a comporre il
progetto completo.

Passo 1: definire gli obiettivi di Business (approccio Top-Down)

   -   definire il core Business dell’impresa o le diverse attività che fanno parte
       dell’attività imprenditoriale

   -   nel caso in cui siano presenti più attività distinte e poco (o per nulla)
       correlate nella stessa impresa è necessario definire l’oggetto di ognuna e
       procedere, secondo priorità, all’analisi dei passi successivi in modo
       distinto per ogni attività

   -   definire quali sono i decisori che prendono parte all’attività di Business,
       definendone nel dettaglio attività, ruoli e interazione tra essi
       (imprenditore, responsabile di produzione, responsabile commerciale,
       agenti…).

   -   definizione dei fatti di rilievo per ogni singolo decisore.
       Importante in questa fase è descrivere esattamente come il singolo
       decisore “vede” l’impresa, poiché nonostante l’impresa sia unica è giusto
       e coerente che ogni singolo attore decisionale abbia i propri fattori di
       decisione, le proprie necessità in tema di dati da analizzare, ecc…
       Ad esempio anche il semplice dato di vendita può essere utilizzato in
       molti modi da decisori diversi: il responsabile commerciale probabilmente
       focalizzerà le sue analisi su fatti come il Venduto Valore, o il Prezzo
       medio di vendita, mentre il responsabile di produzione avrà a cuore il
       Venduto Quantità, o meglio l’Ordinato Quantità…

                                        11
E-mail: infobusiness@zucchetti.it

Passo 2: raccogliere le informazioni (inizio dell’approccio Bottom-Up)

    Dopo avere descritto l’impresa a livello globale, aver definito le diverse
     aree aziendali, gli attori in gioco, e il dettaglio dei fatti rilevanti di ogni
     decisore, si ottiene una visione di quello che dovrà essere il progetto
     globale del Data Warehouse, e di quanti e quali saranno i singoli Data
     Mart che andranno a comporlo.

    Sulla base delle esigenze di analisi delle diverse aree aziendali (coperte
     ognuna da uno o più Data Mart) è necessario stabilire delle priorità per
     l’analisi e la realizzazione dei diversi Data Mart.

    Una volta stabilite le priorità si procede nell’analisi di un singolo Data
     Mart con i passi successivi.

   − dettagliare cosa il decisore vuole avere a disposizione per condurre le
     proprie analisi

   − raccogliere e analizzare tutti i report esistenti e di comune utilizzo da
     parte del decisore (fogli excel, report di stampa dai gestionali,
     esportazioni create ad hoc, ecc…)

Passo 3: definizione del modello dei dati

   − sulla base degli elementi raccolti identificare e definire nel dettaglio gli
     eventi da misurare e le modalità di aggregazione:
        o fatti
        o dimensioni
        o granularità delle analisi

   In questa fase è molto importante tener presente che, nonostante si stia
   analizzando un singolo Data Mart, i concetti definiti dovranno messere essi
   in relazione con le analisi di altre aree aziendali.
   Quindi l’approccio Bottom-Up di questa analisi non dovrà andare a scapito
   della coerenza che dovranno avere i diversi Data Mart quando andranno a
   comporre il Data Warehouse.

Passo 4: identificare le fonti dati

   − fase molto “tecnica” che consiste nell’andare a reperire all’interno dei
     sistemi informativi aziendali tutte le fonti che permetteranno di avere a
     disposizione i dati da organizzare e trasformare per poter “misurare” gli
     eventi sopra descritti.

                                        12
E-mail: infobusiness@zucchetti.it

Passo 5: consolidare i dati

   altra fase “tecnica” necessaria per definire:

   -   le trasformazioni da applicare alle fonti dati in modo che gli eventi
       possano essere misurati esattamente con il metodo definito dal decisore.

   -   stabilire le caratteristiche temporali dei dati in termini di profondità
       temporale e di politiche di aggiornamento dei dati nel Data Mart.

                                        13
Puoi anche leggere