Наша активность на данном портале По состоянию на «роковую» дату


с. 1
Наша активность на данном портале
По состоянию на «роковую» дату 12.12.12 (12 декабря 2012 года) на портале «Техно-сообщество России» (ТСР) всего было зарегистрировано 4433 пользователя. В разделе «Помощь» данного портала сказано, что любой зарегистрировавшийся пользователь может разместить свои документы (научно-технического содержания) для общего чтения. В открытой базе данных (БД) портала (в его таблице под названием «Наши авторы») напротив имени каждого автора указана его активность. При этом в разделе «Помощь» также сказано: «Активность автора вычисляется администрацией портала и используется для составления рейтинга пользователей. Правила вычисления активности могут меняться. В настоящее время действуют следующие правила: За каждый размещенный документ автор получает от 5 до 50 очков в зависимости от размера документа и количества страниц в нём. За каждый комментарий автор комментария и автор комментируемого документа получают 1 очко».

Активность пользователей и (выше упомянутые) правила портала ТСР таковы, что только 136 пользователей (только 3% от 4433 человек) имеют ненулевую активность, то есть на момент нашего рассмотрения только у 136 авторов их активность (А) выражена неким числом: от А = 2 до А = 812 (очков), а у всех остальных пользователей А = 0 (очков). Для лучшего понимания моих «исследований» приведу первую пятерку (лидеров) из таблицы «Наши авторы»:

Варан A = 812 (то есть автор «Варан», который имеет порядковый номер N = 1)

wigeor A = 740 (автор «wigeor», который имеет порядковый номер N = 2)

petr0v14 A = 655 (… N = 3)

analinik A = 626 (… N = 4)

mer A = 456 (… N = 5)

…………………………..

Таким образом, таблица «Наши авторы» показывает зависимость активности (А) автора от его порядкового номера (N). При этом нетрудно построить график зависимости активности автора от его скрытого номера n = 136 + 1 – N (так, у Варана скрытый номер это n = 136, чтобы найти скрытый номер – мы сначала установили, что количество всех авторов с ненулевой активностью равно 136). На горизонтальной оси этого графика мы будем откладывать (вправо от нуля) скрытый номер (n) каждого автора, а по вертикальной оси – активность (А) соответствующего автора, причем (что весьма важно) в логарифмической шкале (см. рис. 1). При этом реальные точки (реальной активности А) на графике лучше всего описывает так называемая тильда-функция (плавная красная линия):

А* = 10000exp{–6,5546[ln(136/n)]^0,2023}. (1)


Рис. 1. Тильда-распределение активности (А) по мере роста скрытого номера (n)




Формула (1) – это эмпирическая формула, выдающая нам значения А*, близкие к реальным значениям А. Формула (1) получается из уравнения степенной линии тренда, которую строит сам компьютер (его общеизвестная программа «Excel») по точкам со скрытыми номерами n = 1, 2, 3, 4, 5, …, 135 (для n = 136 формула не работает). В формуле (1), немного «поиграв», я нашёл только параметр 10000 так, чтобы красная линия (соединяющая все значения А*) наилучшим образом «легла» на реальные точки графика, а все остальные числовые параметры в формуле (1) компьютер вычислил сам (параметры 6,5546 и 0,2023). Полученная волнообразная красная линия напоминает общеизвестный символ «тильды», поэтому эту линию и саму формулу (1) я называю – тильда-функция или тильда-распределение (или предельно коротко – тильда).

Наиболее стройные (идеальные) тильды нам выдает сама природа при любых масштабах её рассмотрения – от микромира до макрокосмоса (в масштабах Вселенной). Причем всевозможных тильд в природе, практически, бесконечно много, и они отличаются друг от друга только своими параметрами. Стройная тильда, вообще говоря, – это своеобразная «лакмусовая бумажка» логнормального распределения (см. Википедию, если случайная величина имеет логнормальное распределение, то её логарифм имеет нормальное распределение), однако такие распределения требует неких знаний по высшей математике, а, точнее говоря, по его разделу под названием теория вероятности (всевозможных случайных процессов). А вот тильда (как простейший заменитель, как некий эрзац) отчасти позволяет нам также исследовать реальный мир, не прибегая к высшей математике (на данном портале более подробно о тильде – см., например, мою статью «Закон распределения богатства» по ссылке:

http://technic.itizdat.ru/docs/iav2357/FIL13401644040N629046001/ ).

Тильду (красную линию) на рис. 1 трудно назвать «стройной» (в части её согласованности с точками реальной активности авторов ТСР). Но тильда, наверняка, станет более стройной, если количество авторов с ненулевой активностью увеличится на один-два порядка, то есть вместо 136 их станет, скажем, порядка 1000 или 10000 человек. Это во многом вопрос времени, но этому помогут, возможно, также и новые (иные) правила начисления очков авторам за их активность на портале ТСР. Моральные стимулы для думающих людей (на которых и ориентирован портал ТСР), вероятно, не менее важны, чем пресловутые материальные стимулы (главный рычаг капитализма).

Наипростейшим признаком логнормального распределения (и стройной, гармоничной тильды) является также закон Бенфорда (см. журнал «Техника молодежи» № 10 за 1979 год, стр. 59), который в случае (любой!) стройной тильды проявил бы себя следующим образом:

Pц = log(1 + 1/Ц), (2)

где Ц = 1, 2, 3, 4, 5, 6, 7, 8, 9 – это первая (значащая) цифра во всех числах А (выражающих активность авторов на портале ТСР); Рц – это вероятность появления данной цифры Ц (каждой из девяти цифр) в таблице «Наши авторы». Формула (2), то есть закон Бенфорда, указывает нам на идеальный ряд вероятностей: Рц = 0,301; 0,176; 0,125; 0,097; 0,079; 0,067; 0,058; 0,051; 0,046 (для Ц = 1, 2, 3, 4, 5, 6, 7, 8, 9 соответственно). То есть, чем больше цифра Ц – тем меньше вероятность её появления (Рц) в базе данных, по которой мы получаем стройную (идеально «правильную», гармоничную) тильду. Однако при анализе конкретной реальной базы данных (наших 136 чисел А из таблицы «Наши авторы») мы получим ряд, который заметно отличается от идеального (от закона Бенфорда): Рц = 0,213; 0,206; 0,096; 0,074; 0,162; 0,088; 0,081; 0,066; 0,015 (для Ц = 1, 2, 3, 4, 5, 6, 7, 8, 9 соответственно, «считанных» из таблицы «Наши авторы»). На данном портале тайну закона Бенфорда я объясняю, например, в статье «Закон Бенфорда» по ссылке: http://technic.itizdat.ru/docs/iav2357/FIL12826685950N015158001/).

Ещё довольно любопытные наблюдения можно добавить в части… имен (логинов) пользователей, зарегистрированных на портале ТСР. Имена 87 % пользователей (100% – это 4433 человек) начинаются с одной из букв английского алфавита, и лишь у 11 % – имена начинаются с некой русской буквы (заглавной или прописной – без разницы и, как правило, имена состоят из букв одного алфавита). Вероятно, большинство людей при своей регистрации на портале ТСР просто не знают (портал не подсказывает), что здесь логин может состоять из русских букв. Любопытно, что 1 % всех пользователей (полсотни человек) в качестве своего логина выбрали… числа (только набор цифр без единой буквы): 1, 123, 471, 737, 777, 987, 1111, 1234, …., 380989068859 (почти 381 миллиард), причем эти числа (после их сортировки по возрастанию) распределяются явно тильдаобразно (и даже угадывается закон Бенфорда).

Как известно, в достаточно больших текстах на русском языке (выбранных абсолютно случайным образом) разные буквы встречаются с разной вероятностью. Эта вероятность выражается неким числом, меньшим единицы: 0,109; 0,087; 0,075; ….; 0,004; 0,002; 0,002 – в сумме все 32 вероятности дают единицу (достоверное событие). В силу этого, например, на долю 14-ти наиболее распространенных букв [о, е(ё), а, и, н, т, с, р, в, л, к, м, д, п – эти буквы записаны в порядке убывания вероятности их появления] приходится, чаще всего, около 79% всех букв выбранного текста (100% приходится на все 32 буквы русского алфавита). Причем сами вероятности появления всех 32 букв – распределены тильдаобразно и для них также угадывается закон Бенфорда. Более подробно об удивительной гармонии русского алфавита можно прочесть на данном портале в моей книге «Параллельные миры…» на стр. 220 или по ссылке:



http://technic.itizdat.ru/preview.php?MODE=PICT&PATH=/iav2357/FIL13394208300N568514001&PAGE=1&WORDS= . Так вот, возвращаясь к нашему порталу ТСР, первые буквы имен из русских букв (всего на портале 486 «русских» имен) имеют… указанное выше распределение. То есть имена, начинающиеся с 14-ти букв [о, е(ё), а, и, н, т, с, р, в, л, к, м, д, п], составляют именно 79% всех «русских» имен. Более того, первые буквы имен из английских букв (всего на портале 3855 «английских» имен) также имеют указанное выше распределение. То есть имена, начинающиеся с 14-ти букв [o, e, a, i, n, t, s, r, v, l, k, m, d, p – это «заменители» выше указанных 14-ти русских букв], также составляют около 77% всех «английских» имен.

В коротком заключении лишь повторю (уже который раз) следующее. Природе во всех её проявлениях (в том числе и «в качестве»… человеческой цивилизации) характерно извечное устремление к некой гармонии, ярким проявлением которой являются бесконечные логнормальные распределения (и их видимые «симптомы» – тильда-распределения, соблюдение закона Бенфорда). Понимание этих процессов и их движущей силы (Его Величества Случая) – заметно расширяет наш кругозор и глубину постижения мироустройства.
с. 1

скачать файл