Сходство объектов лежит в основе алгоритма k -ближайших соседей (k -nearest neighbor algorithm, KNN). Алгоритм способен выделить среди всех наблюдений k известных объектов (k -ближайших соседей), похожих на новый неизвестный ранее объект. На основе классов ближайших соседей выносится решение касательно нового объекта. Важной задачей данного алгоритма является подбор коэффициента k – количество записей, которые будут считаться похожими.