분류 전체보기
-
-
-
-
2024-02-19스파르타/TIL(Today I Learned) 2024. 2. 19. 22:30
오늘 드디어 발표긴한데 후... 솔직히 내가 말해달라고 피드백 드린 부분 싹다 다시 빼고 발표를 해버려서 멘털에 타격이 가서 좀 감정이 진정이 안되는 것과, 예정보다 컨디션과 자격증 공부 진도가 덜 나간 관계로 후에 수정하도록 하겠다 내용으로는 간단한 내용? 정도와 발표 들으면서 참고하면 좋을 만한 부분, 그리고 우리 조 발표에 대해 피드백받은 부분에 대해 적으면 될듯하다 (추가 수정부분) 흠.. 적을려고 했으나 새로 다시 다른 팀들 결과도 보면서 따로 작성해주는 것이 좋겠다는 생각이 들었다 https://docs.google.com/presentation/d/1wtPPylb-tzSOaKEhxjMzOrvEk7X5--ROh2p7sNP8zsg/edit#slide=id.p A09_What's your EDA_..
-
2024-02-18스파르타/WIL(Weekly I Learned) 2024. 2. 19. 09:26
프로젝트와 자격증으로 인해서 제대로 적지 못했음 자격증 시험 끝나고 적을듯? 더보기 17일 중간 결과물 17차 하이퍼 파라미터를 좀더 넓은 범위와 많이 건드려보고 많은 시도해봄 매우 오래 걸렸음 점수와 파라미터Model: model_rf Best Parameters: {'n_estimators': 100, 'min_samples_split': 8, 'max_depth': 44, 'criterion': 'gini'} Best F1-macro Score: 0.9477164467194635 Best Accuracy Score: 0.9528149047208994 Best Score: 0.9477164467194635Model: model_xgb Best Parameters: {'tree_method': 'exa..
-
2024-02-16스파르타/TIL(Today I Learned) 2024. 2. 17. 01:07
마찬가지로 프로젝트로 인해 작성못함 수정해줄예정 -> 추가 수정 어제 학습시킬 때 oe로 인코딩한 것을 빼먹고 학습시켰음-> 그래서 이때 해준 것인지는 기억나지 않지만 다시 포함시켜 학습시켜주었음 더보기 각 모델 하이퍼 파라미터 https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.GridSearchCV.html https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.RandomizedSearchCV.html dt 패키지 sklearn.tree.DecisionTreeClassifier from sklearn.tree import DecisionTree..
-
2024-02-15스파르타/TIL(Today I Learned) 2024. 2. 16. 02:18
프로젝트로 인하여 내용 나중에 적을 예정 -> (추가해 줌) 더보기 추가 아이디어 스케일링도 여러가지 있는 듯해서 여유되면 다른 스케일러 찾아서 해보기 인코딩도 확인할 수있으면 추가로 비교해서 확인해보기 그리고 여테 각 변수의 범주별 등급분포를 봤는데 등급별 각 변수 분포도 반대로 확인해봐야 할듯 파생 변수 voting from sklearn.ensemble import VotingClassifier 학습시킨 모델 파일로 저장하기~~from sklearn.externals import joblib~~ import joblib joblib.dump(clf, 'model.pkl', compress=3) import sys scoring 커스텀으로 만들어서 중간 진행도 확인하기 tqdm으로 진행도 파악하기 p..
-
2024-02-14스파르타/TIL(Today I Learned) 2024. 2. 15. 01:20
어제와 마찬가지로 바빠서 따로 작성하지 못했다 오늘은 어제와 달리 강의가 아니라 프로젝트관련해서 하다가 못적은 점은 다르지만 말이다 이날 노션에 공부한 내용등 적어 둔것은 있지만 옮겨쓸 정도로 정리가 되어있진 않아서 나중에 자격증시험 끝나고 아마 적게 되지 않을까 싶다 (추가하여 수정) 더보기 코드 패치노트 (노션에 적어둔 부분 복붙) 메인에 올린 부분train, test 분리하는 부분 순서 전처리 다하고나서 분리해주는 방식으로 순서를 뒷부분으로 미루기 위에 위에서 분리하던 부분 주석처리 ID가 유니크한 key, index역할일 것으로 예상되어 확인하는 부분 추가 및 제거 부분 따로 분리하여 추가 데이터 중복 확인 및 처리중복되는 값이 있는지 pandas.dataframe.duplicated를 사용하면 ..