Home
Accesso / Registrazione
 di 

La legge di Benford

01

La legge di Benford è una bizzarra legge statistica, molto utile per scoprire se qualcuno abbia falsificato dei dati. Vediamo come usarla al meglio, anche per le nostre applicazioni pratiche di tutti i giorni.

Anche quando le informazioni e i dati sembrano profondamente irregolari e non legate tra loro da alcun vincolo, c'è sempre un nesso logico o matematico che ci mette lo zampino. E' il caso della legge di Benford che, benché non sia una esatta formula matematica ma statistica, regala spesso la sua validità nei campi più disparati della vita pratica e quotidiana.

La legge di Benford descrive la probabilità che ha una cifra numerica di essere presente nella parte iniziale  di una raccolta di dati reali. In altre parole, descrive la probabilità che un dato numerico, appartenente ad una collezione di dati reali, inizi con una determinata cifra numerica (da 1 a 9).

Ancora, essa permette di controllare, con un certo grado di affidabilità, se un elenco di dati è genuino e originale oppure è stato del tutto inventato o alterato in parte.

Secondo questa legge, in una grande quantità di dati numerici reali, la maggior parte delle informazioni numeriche inizia con la cifra "1" e a seguire le altre cifre. Sembrerebbe un fatto strano, ma è proprio così.

Passando direttamente ai numeri nudi e crudi, la legge afferma che la prima cifra di un numero (in una distribuzione sufficientemente elevata di dati) ha una probabilità di circa il 30% di essere "1", le successive cifre seguono in ordine logaritmico decrescente.

La legge, applicata a distribuzioni di dati empirici, dà quasi sempre la sua validità: essa può essere adottata per verificare, ad esempio, la veridicità di bilanci aziendali, di quantità di popolazione raggruppata per un certo criterio, e così via.

Pertanto, la probabilità che un dato numerico inizi con una certa cifra è la seguente:

 

Cifra   Probabilità

----------------------

  1        30.1%

  2        17.6%

  3        12.5%

  4         9,7%

  5         7.9%

  6         6.7%

  7         5.8%

  8         5.1%

  9         4.6%

 

Per ottenere la probabilità sopra indicata, oltre che a consultare la tabella, è anche possibile adottare la seguente semplice formula matematica:

 

L'andamento della serie può essere anche visualizzata dal seguente pseudo-grafico:

 

1---------------2---------3-------4-----5----6---7--8--9

 

Esiste anche una versione più dettagliata della legge, che contempla le coppie di numeri 00..99 anziché le singole cifre unitarie, ma il principio è il medesimo.

Per la corretta applicazione della legge è opportuno che i dati da analizzare sia di numero sufficientemente elevato, onde evitare fenomeni di alterazione dei risultati. Infatti essa va impiegata con la dovuta cautela  e se i campioni analizzati fossero in numero ridotto, è molto probabile che la legge di Benford non venga rispettata, anche con dati veritieri.

 

1° Esempio Pratico

Una azienda riceve il controllo della Finanza, al fine di verificare se le fatture emesse siano veritiere o meno. Il controllo delle 2450 fatture, focalizzato sull'importo dell'imponibile, porta ai seguenti risultati:

 

Numero fatture con Imponibile che inizia per "1":  720
Numero fatture con Imponibile che inizia per "2":  400
Numero fatture con Imponibile che inizia per "3":  316
Numero fatture con Imponibile che inizia per "4":  250
Numero fatture con Imponibile che inizia per "5":  180
Numero fatture con Imponibile che inizia per "6":  170
Numero fatture con Imponibile che inizia per "7":  150
Numero fatture con Imponibile che inizia per "8":  134
Numero fatture con Imponibile che inizia per "9":  130
------------------------------------------------------
Totale fatture:                                   2450
 

Il seguente grafico dimostra che il numero delle fatture, con imponibili che iniziano rispettivamente per "1", "2", "3", ecc (istogramma arancione), rispecchia molto fedelmente l'andamento dettato dalla legge di Benford (istogramma azzurro), pertanto si può ritenere (con ottima probabilità) che l'azienda abbia emesso correttamente i documenti di vendita.

Una fatturazione adulterata avrebbe probabilmente mostrato, al contrario, un andamento alquanto diverso, visualizzando un istogramma irregolare e ben diverso dalla previsione formulata di Benford:

Naturalmente una "non congruenza" con il grafico di Benford non vuol dire che l'azienda abbia commesso per forza un illecito, ma in questi casi è opportuno aumentare l'attenzione poichè potrebbe esserci la probabilità che qualcosa non abbia funzionato a dovere...

 

2° Esempio Pratico

Si è scaricato da Internet il file della popolazione italiana al 2011, suddivisa per comune. Esso contempla ben 8092 comuni. Chi volesse eseguire qualche esperimento può scaricare tale archivio dal link http://lab.comuni-italiani.it/files/listacomuni.zip. Si sono quindi contati i comuni la cui popolazione inizia per "1", poi i comuni la cui popolazione inizia per "2", e così via...

I risultati sono stati impressionanti: il conteggio ha generato i seguenti totali:

 

Cifra    Previsione Benford        Conteggio Reale
--------------------------------------------------------------------------------
  1      2435,9347249129                2472
  2       1424,9304682786                1420
  3       1011,0042566344                 993
  4        784,1958252612                 751
  5        640,7346430174                 623
  6        541,7334216909                 539
  7        469,2708349434                 481
  8        413,9262116442                 426
  9        370,269613617                  387
------------------------------------------------
TOTALE                                   8092

 

Come si nota dalla tabella, Benford ha in pratica "indovinato" quanti comuni hanno una popolazione che inizia per "1", per "2", ecc. Il grafico rinforza ancor di più tale affermazione:

Chi disponesse di tempo e passione può eseguire alcuni interessanti esperimenti di conteggio e verificare dove la legge di Benford funzioni bene o dove essa fallisca e fornisca risultati meno attendibili.

A tale scopo si possono contare le cifre iniziali delle seguenti collezioni:

  • Le lunghezze dei fiumi del mondo;
  • Il numero dei libri venduti in Italia, negli anni;
  • Il numero di cani in ogni nazione del mondo;
  • E così via.

Si vedrà che la legge di Benford può ritornare utile in mille occasioni, ricordando però che essa non è una legge assolutamente matematica ma statistica. Occorre pertanto usarla con le "pinze". In ogni caso un elenco "strano" salterebbe subito all'occhio poichè esso, quasi sicuramente, ha violato la regolarità della formula di Benford.

Buona ricerca a tutti.

GDM

 

 

Scrivi un commento all'articolo esprimendo la tua opinione sul tema, chiedendo eventuali spiegazioni e/o approfondimenti e contribuendo allo sviluppo dell'argomento proposto. Verranno accettati solo commenti a tema con l'argomento dell'articolo stesso. Commenti NON a tema dovranno essere necessariamente inseriti nel Forum creando un "nuovo argomento di discussione". Per commentare devi accedere al Blog
ritratto di giorgio.gorine

strano

Grazie per avermi incuriosito, non ho assolutamente provato a fare dei controlli "carta e penna" autonomamente, ma ho un po' guardato su google quali altri fit esistessero.
Insomma, se avete tempo da perdere durante queste vacanze pasquali, date un occhio anche voi e magari vi ritroverete come me, a bocca aperta, nel constatare come sia "armonioso" il mondo che ci circonda!
Buona pasqua

ritratto di Piero Boccadoro

Per la serie: "le bugie hanno

Per la serie: "le bugie hanno le gambe corte" ;)
La statistica sa essere uno strumento straordinario, se utilizzato con un minimo di raziocinio.
Ottima lettura!

ritratto di Boris L.

è proprio vero: le

è proprio vero: le statistiche non sono il verbo!
La gente è così straordinariamente confortata da numeri, percentuali... l'approccio critico ai dati, però, è un'altra cosa...!

ritratto di Luigi Francesco Cerfeda

Fibonacci

Ci sarà qualche collegamento con la sezione aurea e la serie di Fibonacci ?

ritratto di gio22

Fibonacci

E chi lo può dire...... la successione di Fibonanacci è stata trovata in molti eventi, anche naturali.
In ogni caso, per ora, la successione di Fibonacci segue la legge di Benford..... in questi giorni sto verificando se anche i numeri PRIMI seguono tale legge...........

ritratto di Luigi Francesco Cerfeda

Cioè?

In che senso la successione di Fibonacci segue la legge di Benford ? non ho ben capito

ritratto di gio22

Fibonacci

Cioè:
prendi la serie di Fibonacci:
0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, 233, 377, 610, 987, 1597, 2584, 4181, 6765, 10946, 17711, 28657, 46368, 75025, 121393, 196418, 317811, 514229, 832040, ecc ecc, ecc.

Saranno più numerosi i numeri che iniziano per "1", poi un po' meno quelli che iniziano con "2", e così via.
Ovviamente più è grande il campione preso, più è precisa la stima.

ritratto di Luigi Francesco Cerfeda

SPOILER ALERT

Ho capito.
Insomma, Benford è riuscito nell'impresa che portò, invece, Maximillian Cohen a trapassarsi il cranio con un trapano... come si suol dire, quando la realtà supera la fantasia :D

 

 

Login   
 Twitter Facebook LinkedIn Youtube Google RSS

Ultimi Commenti