Метод ближайшего соседа (nearest neighbour) относится к методам классификации. Классифицируемый объект сравнивается с уже имеющимися прецедентами и принимается решение об отнесении объекта к тому кластеру, к которому принадлежит ближайший прецедент. Напомним, что прецедентом в интеллектуальных системах называют описание ситуации в сочетании с подробным указанием действий, предпринимаемых в данной ситуации. Понятие близости для каждого приложения нужно предварительно конкретизировать.
Метод k-ближайшего соседа — разновидность метода ближайшего соседа, в нем в качестве ближайших соседей рассматриваются не один, а k ближайших соседей.
Обычно в памяти хранятся не все прецеденты, а только подмножество "типичных" случаев. Тогда метод называют методом рассуждения по аналогии (Case Based Reasoning, CBR), или рассуждения на основе аналогичных случаев, или рассуждения по прецедентам.
Подход, основанный на прецедентах, условно можно разделить на следующие этапы:
• сбор подробной информации о поставленной задаче;
• сопоставление этой информации с деталями прецедентов, хранящихся в базе, для выявления аналогичных случаев;
• выбор прецедента, наиболее близкого к текущей проблеме, из базы прецедентов;
• адаптация выбранного решения к текущей проблеме, если это необходимо;
• проверка корректности каждого вновь полученного решения;
• занесение детальной информации о новом прецеденте в базу прецедентов.
Таким образом, вывод, основанный на прецедентах, представляет собой такой метод анализа данных, который делает заключения относительно данной ситуации по результатам поиска аналогий, хранящихся в базе прецедентов.
Метод ближайшего соседа довольно прост для применения. Недостатки метода заключаются в сложности выбора меры близости объектов, а также в высокой трудоемкости использования, поскольку при распознавании требуется полный перебор прецедентов.