Legge di Zipf

La legge di Zipf , in probabilità, afferma che le frequenze f di certi eventi sono inversamente proporzionali al loro rango r . La legge è stata originariamente proposta dal linguista americano George Kingsley Zipf (1902–50) per la frequenza di utilizzo di diverse parole in lingua inglese; questa frequenza è data approssimativamente da f ( r ) ≅ 0,1 / r . Pertanto, la parola più comune (rango 1) in inglese, che è il , ricorre circa un decimo delle volte in un testo tipico; la parola successiva più comune (rango 2), che è di , ricorre circa un ventesimo delle volte; e così via. Un altro modo di vedere questo è che una parola di rango r si presenta 1 /r volte più spesso della parola più frequente, quindi la parola di rango 2 ricorre la metà delle volte della parola di rango 1, la parola di rango 3 un terzo più spesso, la parola di rango 4 un quarto più spesso e così via. Oltre il rango 1.000 circa, la legge viene completamente infranta.

La legge di Zipf è stata presumibilmente osservata per molte altre statistiche che seguono una distribuzione esponenziale. Ad esempio, nel 1949 Zipf affermò che la città più grande di un paese è circa il doppio della dimensione successiva, tre volte la terza e così via. Sebbene l'adattamento non sia perfetto per lingue, popolazioni o altri dati, l'idea di base della legge di Zipf è utile negli schemi per la compressione dei dati e nell'allocazione delle risorse da parte degli urbanisti.

William L. Hosch