Релевантностьинформационно-поисковых системах) — степень соответствия запроса найденным ресурсам.
Обычно релевантность оценивается функцией, ставящей в соответствие каждой паре ресурс (документ) — запрос оценку в диапазоне [0, 1]. Вычисление оценки выполняется по алгоритму, учитывающему совпадение слов в запросе и документе, их близость и порядок расположения, частоту повторения. Чем больше частота слов запроса в документе и чем меньше она в других документах определенной коллекции, тем больше вес (оценка релевантности) данного документа по отношению к запросу, т.е. документ будет выдаваться раньше в результатах поиска по данному термину.
Обычно релевантность оценивается коэффициентом релевантности
rk= xkj/m
где xkj = 1 при совпадении j-го термина запроса с каким-либо термином или его синонимом в k–м документе, иначе xkj = 0, m – число слов в запросе, или
rk = (aj xkj)/aj,
где aj – вес (информативность) j–го термина запроса, например можно принять aj = ln((N+1)/(Nj+1)), где N – число документов в базе, Nj – число документов, содержащих j-й термин.
Если вместо булевых величин xki используют частоты fki употребления i-го слова в k-м документе, то релевантность запроса и документа обычно оценивается по формуле косинуса угла между частотным вектором Y документа и вектором Z запроса того же размера
rk= YТZ/(|Y|*|Z|),
где YТZ — скалярное произведение векторов Y и Z, |.| — норма вектора.