-
K-NN (K-Nearest Neighbor)BIG DATA & AI/Machine Learning 2021. 10. 19. 16:50반응형
K-NN의 개념은 직관적이다. K-NN Regression이란 가까운 K개의 점들의 평균 값을 구하여 값을 도출하는 회귀 방법이고, K-NN Classification은 가까운 K개의 점들이 A라는 classification이 많으면 A로 분류되는 방식이다. K-NN classifier는 지금도 많이 사용하고 있다고 한다.
여기서 K란 근처의 data 중 몇 개를 참조할 것인지를 결정하는 hyperparameter이다. 또한 근처라는 개념을 정의할 수 있는 거리는 일반적으로 점 사이의 거리를 구할 때 사용되는 유클리드 거리(Euclidean Distance)가 사용된다. 그 외에도 격자 무늬로 간 거리를 계산하는 맨해튼 거리(Manhatten Distance) 방식도 있다.
K-NN은 query가 들어오기 전까지(정보를 요청하기 전까지) 아무것도 하지 않는 lazy method라고 한다. 왤까? 사실 머신러닝에서 예를 들어 decision tree의 경우 주어진 data가 들어오면 식을 만들고, 계수를 계산하여 tree를 구축한다. 하지만 k-NN은 사전에 data를 가지고 어떠한 행위도 하지 않는다는 점에서 lazy method로 불린다.
Reference
반응형'BIG DATA & AI > Machine Learning' 카테고리의 다른 글
[책 리뷰] 파이썬 라이브러리를 활용한 머신러닝 (2판) (0) 2022.03.31 Decision Tree (의사결정 트리) (0) 2021.10.19 Handling Devices in TensorFlow 2.0 (Colab) (0) 2021.09.24 Anaconda에 Tensorflow 2.0 설치하기 (쉬움주의) (0) 2021.08.11 머신러닝과 일반 소프트웨어 비교 (Machine Learning VS General Software) (0) 2021.05.01