본문 바로가기

bbomi

Notice

Recent Posts

Popular Posts

Calendar

Tags

더보기

Archives

sklearn

[sklearn] datasets 샘플 데이터 6개

Python 2023. 10. 31. [sklearn] datasets 샘플 데이터 6개 https://scikit-learn.org/stable/datasets/toy_dataset.html 7.1. Toy datasets scikit-learn comes with a few small standard datasets that do not require to download any file from some external website. They can be loaded using the following functions: These datasets are usefu... scikit-learn.org sklearn에서 기본적으로 제공되는 6가지의 데이터셋입니다. 1. 붓꽃 (iris) 데이터 (load_iris, 분류 문제) 붓꽃 분류를 다루는 데이터입니다. target 3개: 0: ..

[머신러닝] K-NN (K-Nearest Neighbors)

ML&DL 2021. 7. 3. [머신러닝] K-NN (K-Nearest Neighbors) 현재 데이터와 가장 가까이 있는 데이터들은 무엇일까? 라는 물음에서부터 시작합니다. 현재 데이터를 특정 카테고리로 분류하기 위해, 가장 가까운 데이터 K개를 찾는 방법입니다. 이후 K개의 데이터에서 다수인 카테고리를 현재 데이터의 카테고리로 분류합니다. 만약 짝수인 경우 반반이 나올 수 있기 때문에, K는 주로 홀수로 설정합니다. 아래 그림은 초록별이 어떤 영화 카테고리일지 구분하는 예시입니다. 이 경우 만약 K=3 이라면, 초록별과 가장 가까운 3개의 데이터는 액션 영화인 파란원 2개, 로맨스 영화인 빨간하트 1개이기 때문에 초록별은 액션 영화로 분류가 됩니다. K-NN의 장점과 단점은 다음과 같습니다. 장점 구현이 쉬우며 이해하기도 직관적입니다. 숫자로 구분된 속성에 좋은 성능을 보입니다. 별도의 모..

이전 1 다음

티스토리툴바