Ненормированной связью двух имен из множества I различных имен списка Х назовем число пар таких же имен, расположенных друг от друга в списке Х на расстоянии меньшем, чем p (то есть разность их номеров в списке меньше, чем p). Число p явяется параметром модели и называется длиной связывающей окрестности. Ненормированную связь имен u_i и u_j обозначим через l_0(u_i, u_j).
Параметры k и p подбирались в каждом случае отдельно с целью получить наиболее четкий результат. Оказалось однако, что изменение этих параметров для реальных хронологических списков имен слабо влияет на результат.
В частности, общая структура матрицы связей оставалась неизменной при всех рассмотренных значениях k и p (1«k«7, 3«p«17).
Ненормированная связь l_0(u_i, u_j) неудобна тем, что она не учитывает резких различий в кратностях вхождения имен в список Х, характерных для реальных хронологических списков. В то же время, часто употреблямые имена естественным образом должны в среднем чаще «случайно» сближаться в списке Х, чем имена более редкие. Чтобы исключить влияние кратности имен на их связь, введем следующее определение.
|
|
Определение. Пусть два имени u_i и u_j входят в список Х с кратностями k_i и k_j соответственно. Назовем нормированной связью этих имен (или просто – связью) число
Для уникального имени в списке (то есть при i=j, k_i=1) понятие связи такого имени с самим собой не вводится.
Поясним выбор нормировки в этом определении. Эта нормировка выбиралась так, чтобы связь любой пары имен из списка Х являлась бы случайной величиной со средним, не зависящим от выбора этой пары.
При этом предполагалось, что вероятностный механизм возникновения правильного хронологического списка Х таков, что при условии, что нам известно все множество имен списка, но неизвестен их порядок, все перестановки имен (все варианты выбора их порядка) равновероятны. Другими словами, мы вводим следующее предположение.