sklearn classification_report를 이용한 모델 검증
Classification Report sklearn에서는 분류 모델의 검증을 위한 classificrion_report api를 제공한다. text로 된 classification metrics에 대한 기본적인 리포트를 만들어 주며 다음과 같이 사용한다. sklearn.metrics.classification_report(y_true, y_pred, *, labels=None, target_names=None, sample_weight=None, digits=2, output_dict=False, zero_division='warn') 파라미터 y_true : 1차원 배열, 레이블 배열, 희소행렬 레이블의 실제 값을 입력 y_pred : 1차원 배열, 레이블 배열, 희소행렬 classifier가 예측한..
더보기
[머신러닝] MultiLabel Classification을 이용한 속성 분류 모델
속성분류 모델 개요 인풋 값으로 텍스트를 받아, 총 6개의 속성(’가격’, ‘제형’, ‘색상’, ‘향’, ‘디자인’, ‘사용감’) 중 어떤 속성들에 해당하는 지를 예측하는 모델을 생성하고자 함 Multiclass classification이면서 동시에, y값으로 1개~6개를 반환하기에 Multilabel classification 문제임 X, Y 형태는 다음과 같음 데이터 전처리 X, feature feature EDA print('feature 평균 길이 :', np.mean(df['feature'].str.len())) print('feature 최대 길이 :', max(df['feature'].str.len())) print('feature 최소 길이 :', min(df['feature'].str...
더보기