머신러닝 과정
2019. 7. 25. 16:54ㆍ기타
728x90
▣ 문제정의
▣ 데이터 수집
▣ 데이터전처리
- 글자들을 숫자로(기계가 읽어들일 수 있게) 인코딩
- 스케일링(단위 바꿔보기), 칼럼정돈, 결측치 정리 등
▣ 탐색적 데이터분석
- 모아놨던 데이터를 시각화하면서 데이터를 파악해본다
- 모든 칼럼을 다 쓰는게 아니라 어떤 칼럼들을 사용할지 정한다(=사용할 feature를 선택한다)
▣ 모델선택, 하이퍼 파라미터 조정
- 목적에 맞는 적절한 모델 선택
- 여러가지 모델을 만들어놓고 그중에 어떤 모델이 내 프로젝트에 적합한지 선별한다.
▣ 학습과 예측
- 학습: fit(X_train, y_train)
- 예측: predict(X_test)
- 내 데이터 중에서 70%는 train data, 나머지 30%는 test data로 잡아주는 것이 적절.
- 70% 까지만 기계에게 학습시키고 예측을 뽑아본다.
- 나머지 30%와 기계가 뽑아낸 예측치를 비교하여 accuracy를 측정한다.
▣ 모델평가
confusion matrix
- 정확도 accuracy
- 재현율 recall : 양성과 음성.
- 정밀도 precision
- f1 score
728x90
반응형
'기타' 카테고리의 다른 글
머신러닝 결정트리 모델 (0) | 2019.08.05 |
---|---|
아두이노 uno board 구조 (0) | 2019.08.05 |
머신러닝 파이썬 응용프로그램 만들기 .py (0) | 2019.07.29 |
머신러닝 하이퍼파라미터 튜닝(최적의 k값 찾기) (0) | 2019.07.29 |
머신러닝 붓꽃 학습 (0) | 2019.07.29 |