О числах

Однажды американский астроном и математик Саймон Ньюкомб обратил внимание, что в книге логарифмов первые страницы книги намного более потрепаны, нежели конечные. Ему показалось это странным и он подумал: а нет ли здесь какой-либо закономерности? То есть, почему люди чаще работают с числами, у которых первая цифра от 1 до 4, нежели от 5 до 9? Однако потребовалось почти 60 лет что бы облечь это наблюдение в закон, получивший имя Бенфорда.

Бенфорд исследовал около 20 таблиц, среди которых были данные о площади поверхности 335 рек, удельной теплоемкости и молекулярном весе тысяч химических соединений и даже номера домов первых 342 лиц, указанных в биографическом справочнике американских ученных. Проанализировав около 20 тысяч содержавшихся в таблицах чисел, Бенфорд установил удивительную закономерность. Казалось бы, все девять цифр 1, 2, 3, 4, 5, 6, 7, 8, 9 (из которых состоит любое мыслимое число) равноправны, и вероятность появления каждой из них в качестве первой значащей цифры должна составлять 1 ⁄ 9 = 0,111... (при равновероятном распределении первой значащей цифры). Однако, закон Бенфорда гласит, что в реальных данных чем больше цифра, тем меньше вероятности, что она будет стоять на первом месте в числе и подчиняется эта зависимось логарифмическому закону. То есть вероятнсть того, что на первом месте будет стоять 1 более 30%, а вероятность того что это будет 9 всего 4,6%.

Точнее даже, вероятность распределения следующая:

1 - 30.1%
2 - 17.6%
3 - 12.5%
4 - 9.7%
5 - 7.9%
6 - 6.7%
7 - 5.8%
8 - 5.1%
9 - 4.6%

Причем эта закономерность сохранялась и в других системах (не только в десятичной). Разумеется, этому есть свое математическое объяснение, но нам интересно другое: как это применить?
Хэл Вэриан (да, да, тот самый Chief Economist of Google) в 1972 году решил проверить эту закономерность для обнаружения возможных искажений социо-экономических данных, а Марк Нигрини (Mark Nigrini) применил её для выверки бухгалтерских и финансовых данных. Кстати, во многих штатах несоответствие данных закону Бенфорда (так назвали эту закономерность) является формальной уликой для судебных органов.
Итак, что нужно чтобы распознать фальшивые данные? Просто возьмите эти данные и подсчитайте частоту первых цифр чисел, а затем сравните результаты с таблицей распределения вероятностей выше. И, если данные сильно разнятся, то… ваш бухгалтер просто не читает наш блог :))

6174 & 3435

Мир вычислительных парадоксов хранит в себе очень много неизвестного. По-моему, вот это, например, просто крутейше:

Постоянная Капрекара

Если вкратце, то:

1. Нужно загадать любое четырехзначное число, кроме тех, которые содержат в себе одинаковые цифры типа 1111, 2222 и т. д. (Например, 3412)
2. Теперь нужно выстроить цифры в нем сначала по убыванию, (4321), затем по возрастанию (1234).
3. Из большего числа вычесть меньшее (= 3087).
4. С полученным результатом проделывать пункты 2 и 3 (8730 − 378 = 8352 → 8532 − 2358 = 6174).

В итоге меньше, чем за 7 шагов в ЛЮБОМ случае получится число 6174, которое затем будет бесконечно воспроизводить само себя (7641 – 1467 = 6174).

Еще одна крутая тема
это Munchausen number

Это число 3435, которое почти единственное из всех равняется сумме своих чисел возведенных в самих себя: 3435 = 3
3 + 4
4 + 3
3 + 5
5 = 27 + 256 + 27 + 3125.

Помимо него таким свойством обладают по понятным причинам 0 и 1, а также число 438579088. И ВСЁ. Называются они perfect digit-to-digit invariant (на русском не нашел как).