Коэффициент линейной корреляции множества выданных и истинно релевантных документов

Коэффициент линейной корреляции R выдачи и релевантности документов представляет собой корреляционный момент двух случайных величин: С – «быть выданным документом» (формально релевантным с точки зрения системы)и И – «быть релевантным» (истинно релевантным с точки зрения пользователя).

Каждая из величин может иметь значения 0 и 1 в зависимости от конкретного документа.

Математические ожидания С и И:

; ;

дисперсии определяются аналогично: ; .

Ковариационный момент C, И равен:

Окончательно: .

Очевидно, что в различных точках координат <n,x> значения (знаки) R следующие:

(из рис.3.4.).

В частности, легко убедиться, что повсюду на линии . Для этого достаточно показать, что :

Т.к. на линии выполняется , то .



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: