→ KNN-K Nearest Neighbours — один из простейших алгоритмов машинного обучения с учителем, который в основном используется для классификации. Он классифицирует точку данных на основе того, как классифицируются ее соседи.
→ KNN хранит все доступные случаи и классифицирует новые случаи на основе меры сходства.
→ K в KNN — это параметр, который относится к числу ближайших соседей, которые должны быть включены в процесс голосования по большинству.
Как мы выбираем «К»?
→ Алгоритм KNN основан на сходстве признаков.
→ Выбор правильного значения «K» — это процесс, называемый настройкой параметров, и он важен для повышения точности.
Пример: - Вы когда-нибудь чувствовали себя одиноким в спешке? Но на самом деле на одном рынке есть много людей, которые чувствуют себя одинокими, а потом вы чувствуете: «Бхир мне танхай ка сатх», вот это шутка. Давайте разберемся на примере изображения.
Теперь вопрос, что в круге? Треугольник или прямоугольник?
Итак, при K=3 мы можем классифицировать ‘?’ как ▯.
и если мы увеличим диаметр, то при K=7 мы можем классифицировать ‘?’ как △.
Теперь вопрос в том, как мы выбираем фактор "K"?
→ Класс неизвестной точки данных был ▯ при k = 3, но изменился при k = 7, так какой k нам следует выбрать?
- Выбрать значение «k»?
→ Sqrt(n), где n – общее количество точек данных.
→ Выбрано нечетное значение «k», чтобы избежать путаницы между двумя классами данных.
{Вышеуказанные два пункта являются наиболее важными, пожалуйста, прочитайте внимательно.}
Как работает алгоритм KNN?
→ Рассмотрим набор данных с некоторыми переменными; давайте сначала посмотрим на это.
мы просто сосредоточимся на нет. столбец сыгранных матчей и пробежек, поэтому мы будем играть здесь с «матом» и «пробежками», на этом основании мы решим, игрок в крикет профессионал или нуб ?.
Теперь, на основе предоставленных данных, мы должны классифицировать приведенный ниже набор как профессиональный игрок или обычный игрок.
Теперь мы просто сосредоточимся на «Мате — 89» и «Пробежках — 12 344».
→ Чтобы найти ближайших соседей, мы рассчитаем Евклидово расстояние.
Евклидово расстояние?, что это такое?
- Согласно формуле Евклидова расстояния расстояние между двумя точками на плоскости с координатами (x, y) и (a, b) определяется как:
Давайте посчитаем, чтобы было понятно:
расстояние (d1) = корень {(12344–15921)² + (89–200)²} = 3578,721
аналогичным образом рассчитайте каждое расстояние с каждой точкой, теперь, если мы рассчитаем с каждой точкой, в евклидовом расстоянии будет столбец, как показано ниже.
Теперь, как выбрать «к»?
Вопрос все тот же. Вот ответ;
поэтому большинство соседей указывают на «Профессионал».
и если мы посмотрим на пробежки, они совпадают с очками профессионалов (раны).
Следовательно, по алгоритму KNN класс (89, 12344) должен быть профессиональным, значит, Вират Кохли — профессиональный игрок.
— — — — — — — — — — — — — — — — — — — — — — — — — — — — — — —
Подводя итоги:-
- Задается положительное целое число k вместе с новой выборкой.
- Мы выбираем «k» записей в нашей базе данных, которые наиболее близки к новому образцу.
- Находим наиболее распространенную классификацию этих записей.
- Это классификация, которую мы даем новому образцу
Вот ссылка на реализацию KNN.
Прогнозирование диабета с использованием алгоритма KNN.
Ссылка → https://colab.research.google.com/drive/1RphoDIVYmL0x2ooSt64oNRH34fi_gBGU?usp=sharing
— — — — — — — — — — — — — — — — — — — — — — — — — — — — — —
Если что-то не так, пожалуйста, скажите мне, я буду рад узнать.
Мой аккаунт LinkedIn ждет вас.
Спасибо!