ML&DL
2021. 7. 3.
[머신러닝] K-NN (K-Nearest Neighbors)
현재 데이터와 가장 가까이 있는 데이터들은 무엇일까? 라는 물음에서부터 시작합니다. 현재 데이터를 특정 카테고리로 분류하기 위해, 가장 가까운 데이터 K개를 찾는 방법입니다. 이후 K개의 데이터에서 다수인 카테고리를 현재 데이터의 카테고리로 분류합니다. 만약 짝수인 경우 반반이 나올 수 있기 때문에, K는 주로 홀수로 설정합니다. 아래 그림은 초록별이 어떤 영화 카테고리일지 구분하는 예시입니다. 이 경우 만약 K=3 이라면, 초록별과 가장 가까운 3개의 데이터는 액션 영화인 파란원 2개, 로맨스 영화인 빨간하트 1개이기 때문에 초록별은 액션 영화로 분류가 됩니다. K-NN의 장점과 단점은 다음과 같습니다. 장점 구현이 쉬우며 이해하기도 직관적입니다. 숫자로 구분된 속성에 좋은 성능을 보입니다. 별도의 모..