→ KNN-K Nearest Neighbours — один из простейших алгоритмов машинного обучения с учителем, который в основном используется для классификации. Он классифицирует точку данных на основе того, как классифицируются ее соседи.

→ KNN хранит все доступные случаи и классифицирует новые случаи на основе меры сходства.

→ K в KNN — это параметр, который относится к числу ближайших соседей, которые должны быть включены в процесс голосования по большинству.

Как мы выбираем «К»?

→ Алгоритм KNN основан на сходстве признаков.

→ Выбор правильного значения «K» — это процесс, называемый настройкой параметров, и он важен для повышения точности.

Пример: - Вы когда-нибудь чувствовали себя одиноким в спешке? Но на самом деле на одном рынке есть много людей, которые чувствуют себя одинокими, а потом вы чувствуете: «Бхир мне танхай ка сатх», вот это шутка. Давайте разберемся на примере изображения.

Теперь вопрос, что в круге? Треугольник или прямоугольник?

Итак, при K=3 мы можем классифицировать ‘?’ как ▯.

и если мы увеличим диаметр, то при K=7 мы можем классифицировать ‘?’ как △.

Теперь вопрос в том, как мы выбираем фактор "K"?

→ Класс неизвестной точки данных был ▯ при k = 3, но изменился при k = 7, так какой k нам следует выбрать?

  • Выбрать значение «k»?

Sqrt(n), где n – общее количество точек данных.

Выбрано нечетное значение «k», чтобы избежать путаницы между двумя классами данных.

{Вышеуказанные два пункта являются наиболее важными, пожалуйста, прочитайте внимательно.}

Как работает алгоритм KNN?

→ Рассмотрим набор данных с некоторыми переменными; давайте сначала посмотрим на это.

мы просто сосредоточимся на нет. столбец сыгранных матчей и пробежек, поэтому мы будем играть здесь с «матом» и «пробежками», на этом основании мы решим, игрок в крикет профессионал или нуб ?.

Теперь, на основе предоставленных данных, мы должны классифицировать приведенный ниже набор как профессиональный игрок или обычный игрок.

Теперь мы просто сосредоточимся на «Мате — 89» и «Пробежках — 12 344».

→ Чтобы найти ближайших соседей, мы рассчитаем Евклидово расстояние.

Евклидово расстояние?, что это такое?

  • Согласно формуле Евклидова расстояния расстояние между двумя точками на плоскости с координатами (x, y) и (a, b) определяется как:

Давайте посчитаем, чтобы было понятно:

расстояние (d1) = корень {(12344–15921)² + (89–200)²} = 3578,721

аналогичным образом рассчитайте каждое расстояние с каждой точкой, теперь, если мы рассчитаем с каждой точкой, в евклидовом расстоянии будет столбец, как показано ниже.

Теперь, как выбрать «к»?

Вопрос все тот же. Вот ответ;

поэтому большинство соседей указывают на «Профессионал».

и если мы посмотрим на пробежки, они совпадают с очками профессионалов (раны).

Следовательно, по алгоритму KNN класс (89, 12344) должен быть профессиональным, значит, Вират Кохли — профессиональный игрок.

— — — — — — — — — — — — — — — — — — — — — — — — — — — — — — —

Подводя итоги:-

  • Задается положительное целое число k вместе с новой выборкой.
  • Мы выбираем «k» записей в нашей базе данных, которые наиболее близки к новому образцу.
  • Находим наиболее распространенную классификацию этих записей.
  • Это классификация, которую мы даем новому образцу

Вот ссылка на реализацию KNN.

Прогнозирование диабета с использованием алгоритма KNN.

Ссылка → https://colab.research.google.com/drive/1RphoDIVYmL0x2ooSt64oNRH34fi_gBGU?usp=sharing

— — — — — — — — — — — — — — — — — — — — — — — — — — — — — —

Если что-то не так, пожалуйста, скажите мне, я буду рад узнать.

Мой аккаунт LinkedIn ждет вас.

Спасибо!