Risultati del Cristian's (Wiki) Geolocation Survey

Pagina creata da Camilla Ferrero
 
CONTINUA A LEGGERE
Risultati del Cristian's (Wiki) Geolocation Survey
Risultati del Cristian's (Wiki) Geolocation Survey
Di seguito riportiamo i risultati del sondaggio sugli strumenti di Geolocation utilizzabili in it.wiki. Il
sondaggio è rimasto aperto dal 2 al 7 novembre 2011. Al sondaggio hanno partecipato 118
persone.

Scopo del survey era mettere a confronto la geolocalizzazione basata su IP fatta da
geoiplookup.wikimedia.org e gli strumenti di geolocalizzazione incorporati nei browser moderni.
Per partecipare al survey veniva richiesto di visitare le pagine:
    • http://geoiplookup.wikimedia.org
    • http://placepuppy.it/geo.html

Premessa
Metodo di raccolta dati
Le risposte sono state        raccolte   attraverso   un   form   GoogleDoc,    disponibile   all'indirizzo
http://bit.ly/GeoSurvey.

La prima pagina ritornava una stringa del tipo:
Geo =
{"city":"Cameri","country":"IT","lat":"45.500000","lon":"8.650000","IP":"2.32.43.1
96","netmask":"19"}

La seconda invece era basata sul codice presente nell'allegato A e ritornava un risultato del tipo:
Latitude: 0.00 Longitude: 0.00

Per trovare le coordinate della “localizzazione vera” (v. domande 5-6-7 qui sotto) il metodo
proposto è stato il seguente:
«[…] usare Google Maps (http://maps.google.it), scrivere il nome della città
inserita, cliccare con il tasto destro e scegliere "Che cosa c'è qui" appariranno
due numeri che sono la latitudine e la longitudine.»

Tuttavia, dato che è stato indicato anche che potevano essere usati metodi differenti (per esempio
consultando la pagina: http://en.wikipedia.org/wiki/Wikipedia:Obtaining_geographic_coordinates)

Domande
Le domande poste nel questionario sono state le seguenti:
    1. Puoi dirmi la latitudine dove sei posizionato usando geoiplookup.wikimedia.org
    2. Puoi dirmi la longitudine dove sei posizionato usando geoiplookup.wikimedia.org
    3. Puoi dirmi la latitudine dove sei posizionato usando placepuppy.it/geo.html
    4. Puoi dirmi la longitudine dove sei posizionato usando placepuppy.it/geo.html
    5. Puoi dirmi la città dove ti trovi ora (dove si trova il pc che stai usando?)
    6. Saresti così gentile da indicarmi la latitudine della città che hai indicato qui sopra?
    7. Saresti così gentile da indicarmi la longitudine della città che hai indicato qui sopra?
    8. Valuta il risultato che hai ottenuto usando geoiplookup.wikimedia.org [Nazione]
    9. Valuta il risultato che hai ottenuto usando geoiplookup.wikimedia.org [Regione]
    10. Valuta il risultato che hai ottenuto usando geoiplookup.wikimedia.org [Provincia]
    11. Valuta il risultato che hai ottenuto usando geoiplookup.wikimedia.org [Città]
    12. Valuta il risultato che hai ottenuto usando placepuppy.it/geo.html [Nazione]
    13. Valuta il risultato che hai ottenuto usando placepuppy.it/geo.html [Regione]
    14. Valuta il risultato che hai ottenuto usando placepuppy.it/geo.html [Provincia]
    15. Valuta il risultato che hai ottenuto usando placepuppy.it/geo.html [Città]
    16. Quale browser stai utilizzando per navigare?
Risultati del Cristian's (Wiki) Geolocation Survey
17. Riesci a dirmi la versione del tuo browser?
    18. Il tuo browser supporta la geolocalizzazione, che tu sappia?

Quindi     per ogni submission i seguenti dati erano disponibili:
   •       timestamp dell'invio del form
   •       coordinate rilevate da geoiplookup.wikimedia.org e loro valutazione
   •       coordinate rilevate da placepuppy.it/geo.html e loro valutazione
   •       nome e coordinate della città dove si trovava chi ha compilato il form
   •       informazioni rispetto al browser (versione, supporto della localizzazione)

Raccolta dati

Purtroppo a causa di un errore di impostazione del form Google Doc alcuni dati dati (22 record)
sono risultati inutilizzabili, infatti entrambi gli strumenti fornivano risposte secondo il locale USA ed
in particolare usando il punto (“.”) come separatore decimale, il form invece era impostato
secondo il locale IT e quindi le cifre inserite con un punto sono state interpretate come date. Non è
stato possibile, nonostante alcuni tentativi, recuperare i dati originali e quindi questi record sono
stati scartati1.

Sono quindi risultati disponibili 96 record. In figura 1 l'andamento delle submission dove la
numerazione negativa indica i dati scartati.

                                            Survey submissions

    120                                                                                                     120

    100                                                                                                     100

     80                                                                                                     80

     60                                                                                                     60

     40                                                                                                     40

     20                                                                                                     20

      0                                                                                                      0
     02/11/11            03/11/11           04/11/11           05/11/11            06/11/11            07/11/11
     -20                                                                                                    -20

     -40                                                                                                    -40

Illustrazione 1: form inviati vs tempo

1 Ringrazio a questo proposito l'utente GIORGIOFOGA del Forum di LibreOffice in italiano per l'aiuto
  (http://it.libreofficeforum.org/node/1750).
Risultati del Cristian's (Wiki) Geolocation Survey
La distribuzione regionale degli invii è visualizzata dalla seguente mappa 2:

              Illustrazione 2: Form inviati per regione
In particolare per la Lombardia la suddivisione in province da:

                        Illustrazione 3: Form inviati dalle province della Lombardia

2 La mappa è stata realizzata utilizzando le Google API:
  http://code.google.com/apis/chart/image/docs/gallery/new_map_charts.html, e alcuni esempi messi a disposizione qui:
  http://sites.google.com/site/e90e50/google-chart-api/google-chart-api-ed-excel-mappe-italia
Risultati del Cristian's (Wiki) Geolocation Survey
8 risposte sono stati inviate da Stati esteri.

Tutti i dati raccolti e la loro analisi sono disponibili come documento ODS al seguente indirizzo:
http://dl.dropbox.com/u/11865418/survey_elab.ods

Oltre a questo per coloro i quali avessero indicato solo la loro “città” (localizzazione vera) e non le
coordinate, questi dati sono stati integrati usando lo stesso metodo indicato sopra.

Analisi dati
Utilizzando i dati reali forniti si è calcolato lo scarto quadratico (rms) medio di ciascun valore di
latitudine e di longitudine rilevato. Utilizzando il raggio quadratico medio della Terra come costante
pari a 6373 km si sono poi calcolate le varie aree indicate.

La media delle posizioni reali raccolte è la seguente:
lat = 44.61147757
long = 9.72832298
situata a Bardi (PR)

I valori massimi e minimi trovati sono
(B) lat_max = 52.355788                                   (A)   lat_min = 37.520619
       long_max = 16.16666667                                   long_min = -8.617963

Illustrazione 4: Sulla mappa sono segnate le località con la combinazione di minime (B) e massime (A)
latitudine e longgitudine
Nota metologica
Una volta trovati gli scarti quadratici in gradi di latitude e longitune, essi sono stati combinati in
                           √   2   2
quadratura, ossia σtot = σlat +σ long l'errore compiuto rispetto ad utilizzare la formula corretta (in
quanto si tratta di angoli su una sfera e non su un piano) è trascurabile.
Analisi dei risultati di localizzazione via geoiplookup.wikimedia.org
Per geoiplookup.wikimedia.org i risultati sono:
rms_lat = 5.0°
rms_long = 2.29°
da questi dati calcoliamo che le posizioni individuate si trovano mediamente entro un raggio di 97
km rispetto alla posizione reale.
Per confronto, ecco quali città includerebbe un'area circolare con lo stesso raggio centrata attorno
a Milano3:

                           Illustrazione 5: errore di localizzazione di
                           geoiplookup.wikimedia.org, il cerchio è centrato
                           su Milano

Valutazione della localizzazione da parte degli utenti

Di seguito riportiamo i risultati della valutazione fatta dagli utenti rispetto alla qualità della
localizzazione. Si noti che i risultati sono da leggere come “È stata individuata esattamente
almeno la [città/provincia/regione]” quindi i valori crescono andando da sinistra verso destra
poiché ogni casella a destra contiene anche i valori precedenti, nella prima riga sono presentati i
valori assoluti nella seconda le percentuali.

                Città       Città      Provincia   Provincia    Regione     Regione
                                                                                      Stato corretto
               corretta   confinante    corretta   confinante   corretta   confinante

                  27         32           37          56          60          68            94

               28.13%      33.33%      38.54%       58.33%      62.50%      70.83%       97.92%

         Tabella 1: Valori assoluti e percentuali sulla precisione di localizzazione di
         geoiplookup.wikimedia.it, da sinistra a destra i valori includono i precedenti

3(immagine tratta da: Idéfix modificata da Luigi Chiesa (Image:Valtaleggioposizione.png) [GFDL
(www.gnu.org/copyleft/fdl.html) or CC-BY-SA-3.0 (www.creativecommons.org/licenses/by-sa/3.0)],
via Wikimedia Commons ( http://commons.wikimedia.org/wiki/File%3ALombardy_map.svg)
Quindi il tool individua correttamente almeno la regione in oltre il 60% dei casi. Lo stato viene
individuato correttamente quasi sempre.

Analisi dei risultati dei risultati di localizzazione via browser
Per la localizzazione via browser bisogna indicare che in 10 casi su 96 (10,4%) la procedura di
localizzazione non ha funzionato restituendo un errore oppure il risultato “0. 0.” .

Questo può dipendere da vari fattori tra cui il tipo browser e la versione e la connessione (infatti
connettendosi da punti diversi potrebbe darsi che in alcuni casi le informazioni di localizzazione
non siano disponibili).

I risultati sono stati quindi limitati agli 86 casi che hanno restituito dei dati ottenendo:
rms_lat = 0.43°
rms_long = 0.66°

da questi dati calcoliamo che le posizioni individuate si trovano mediamente entro un raggio di 14
km rispetto alla posizione reale. Per confronto, ecco quali città includerebbe un'area circolare con
lo stesso raggio centrata attorno a Milano:

                              Illustrazione 6: errore di localizzazione del
                              browser, il cerchio è centrato su Milano

Valutazione della localizzazione da parte degli utenti

A causa di un problema con il form usato per raccogliere i dati le etichette delle varie risposte sono
state mescolate, sono stati ricostruiti questi risultati a partire dai dati disponibili. Quanto ottenuto
ci sembra compatibile con i dati della sezione precedente. I 10 casi per cui lo strumento non ha
funzionato sono stati classificati come “Stato non corretto”.
Città       Città      Provincia   Provincia      Regione       Regione
                                                                                           Stato corretto
                corretta   confinante    corretta   confinante     corretta     confinante

                  56          60            67            69           80             82          84

                58.33%      62.50%      69.79%       71.88%        83.33%           85.42%      87.50%

         Tabella 2: Valori assoluti e percentuali sulla precisione di localizzazione del
         browser, da sinistra a destra i valori includono i precedenti
Come si vede, con la localizzazione via browser, la capacità di individuare correttamente la città è
molto più alta (58% contro il 28% di geoiplookup.wikimedia.org), e la regione corretta viene
individuata in oltre l'80% dei casi (83% contro il 62% di geoiplookup.wikimedia.org). Però la
possibilità che lo strumento fallisca lo limita.

Informazioni sul Browser
A causa del fatto che il campione non è stato preparato in modo statisticamente significativo per i
browser utilizzati si riscontra una predominanza di Mozilla Firefox e di Google Chrome, risulta
invece significativamente sottorappresentato Internet Explorer. Per quanto riguarda questi ultimi
browser si ha una prevalenza delle versioni 3.6.X (7) e 7.00.01 (40) per Firefox e 15.X (19) per
Chrome.

                                                    Browser
                                            Software usato per navigare
                                                  1,04%        1,04%        6,25%

                                   31,25%

                                                                                             59,38%

                                     1,04%

                              (vuoto)               Epiphany                Google Chrome
                              Internet Explorer     Mozilla Firefox         Safari

    Illustrazione 7: Browser utilizzato per la compilazione del form
Da queste risposte invece si vede che una grossa fetta degli utenti non sa che il proprio browser,
molto probabilmente, supporta la localizzazione.
Geolocalizzazione
                          Il tuo browser supporta la geolocalizzazione, che tu sappia?
                                                                         Sì 56,84%
                               Boh!? 41,05%

                                       No 1 2,11%
                                                    Boh!?   No   Sì

                    Illustrazione 8: Opinione degli utenti rispetto alle capacità di
                    geolocalizzazione del proprio browser

Conclusioni
Abbiamo analizzato 96 casi di utilizzo di due differenti strumenti di geolicalizzazione: la
geolocalizzazione via IP (attraverso l'indirizzo geoiplookup.wikimedia.it) e quella via browser, di
utenti principalmente situati nel nord Italia,
La localizzazione via browser ha una precisione accettabile, posizionando un utentei in una regione
corretta nel 62,5% dei casi, però la forbice tra la percentuale di città individuate correttamente e di
localizzazioni regionali corrette è elevata (~34%). Il sistema inoltre è affidabile in quanto quasi
nella totalità dei casi viene indiiduato lo Stato corretto.
La localizzazione via browser invece riesce a individuare correttamente la regione l'83% delle
volte, inoltre presenta una forbice più ristretta (~25%) tra le individuazioni corrette della città nelle
quali riesce a raggiungere una precisione del 58%. Tuttaia lo strumento non ha funzionato nel
10,4% dei casi.

Una combinazione dei due strumenti sembra quindi la soluzione migliore dato che è possibil
riconoscere quando non vengono rilevati dati di localizzazione del browser, in questo modo si
potrebbe unire l'affidabilità del primo metodo alla maggior precisione del secondo.
Allegato A
Codice di http://placepuppy.it/geo.html

    Geolocation Demo
  
    Geolocation Demo
      code from: greenhughes.com
    Latitude: 0.00 Longitude: 0.00
     View on Google
Maps

        // show the position on the page and make a google maps link
        function showPosition(position) {
          var lat = position.coords.latitude;
          var lon = position.coords.longitude;
          document.getElementById("lat").innerHTML = lat;
          document.getElementById("lon").innerHTML = lon;
           var gmaps_url = "http://maps.google.co.uk/maps?f=q&source=s_q&hl=en&geocode=&q=" +
lat + "+" + lon;
          document.getElementById("gmaps_link").href = gmaps_url;
        }
        // report errors to user
        function errorHandler(error) {
          switch (error.code) {
           case error.PERMISSION_DENIED:
             alert("Could not get position as permission was denied.");
             break;
           case error.POSITION_UNAVAILABLE:
                alert("Could not get position as this information is not available at this
time.");
             break;
            case error.TIMEOUT:
              alert("Attempt to get position timed out.");
             break;
            default:
                  alert("Sorry, an error occurred. Code: " + error.code + " Message: " +
error.message);
             break;
            }
        }
        // check browser can support geolocation, if so get the current position
        if (navigator.geolocation) {
          navigator.geolocation.getCurrentPosition(showPosition, errorHandler);
        }
        else {
          alert("Sorry, your browser does not support geolocation services.");
        }
Puoi anche leggere