전체 글
-
-
2024-02-19스파르타/TIL(Today I Learned) 2024. 2. 19. 22:30
오늘 드디어 발표긴한데 후... 솔직히 내가 말해달라고 피드백 드린 부분 싹다 다시 빼고 발표를 해버려서 멘털에 타격이 가서 좀 감정이 진정이 안되는 것과, 예정보다 컨디션과 자격증 공부 진도가 덜 나간 관계로 후에 수정하도록 하겠다 내용으로는 간단한 내용? 정도와 발표 들으면서 참고하면 좋을 만한 부분, 그리고 우리 조 발표에 대해 피드백받은 부분에 대해 적으면 될듯하다 (추가 수정부분) 흠.. 적을려고 했으나 새로 다시 다른 팀들 결과도 보면서 따로 작성해주는 것이 좋겠다는 생각이 들었다 https://docs.google.com/presentation/d/1wtPPylb-tzSOaKEhxjMzOrvEk7X5--ROh2p7sNP8zsg/edit#slide=id.p A09_What's your EDA_..
-
2024-02-18스파르타/WIL(Weekly I Learned) 2024. 2. 19. 09:26
프로젝트와 자격증으로 인해서 제대로 적지 못했음 자격증 시험 끝나고 적을듯? 더보기 17일 중간 결과물 17차 하이퍼 파라미터를 좀더 넓은 범위와 많이 건드려보고 많은 시도해봄 매우 오래 걸렸음 점수와 파라미터Model: model_rf Best Parameters: {'n_estimators': 100, 'min_samples_split': 8, 'max_depth': 44, 'criterion': 'gini'} Best F1-macro Score: 0.9477164467194635 Best Accuracy Score: 0.9528149047208994 Best Score: 0.9477164467194635Model: model_xgb Best Parameters: {'tree_method': 'exa..
-
2024-02-16스파르타/TIL(Today I Learned) 2024. 2. 17. 01:07
마찬가지로 프로젝트로 인해 작성못함 수정해줄예정 -> 추가 수정 어제 학습시킬 때 oe로 인코딩한 것을 빼먹고 학습시켰음-> 그래서 이때 해준 것인지는 기억나지 않지만 다시 포함시켜 학습시켜주었음 더보기 각 모델 하이퍼 파라미터 https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.GridSearchCV.html https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.RandomizedSearchCV.html dt 패키지 sklearn.tree.DecisionTreeClassifier from sklearn.tree import DecisionTree..
-
2024-02-15스파르타/TIL(Today I Learned) 2024. 2. 16. 02:18
프로젝트로 인하여 내용 나중에 적을 예정 -> (추가해 줌) 더보기 추가 아이디어 스케일링도 여러가지 있는 듯해서 여유되면 다른 스케일러 찾아서 해보기 인코딩도 확인할 수있으면 추가로 비교해서 확인해보기 그리고 여테 각 변수의 범주별 등급분포를 봤는데 등급별 각 변수 분포도 반대로 확인해봐야 할듯 파생 변수 voting from sklearn.ensemble import VotingClassifier 학습시킨 모델 파일로 저장하기~~from sklearn.externals import joblib~~ import joblib joblib.dump(clf, 'model.pkl', compress=3) import sys scoring 커스텀으로 만들어서 중간 진행도 확인하기 tqdm으로 진행도 파악하기 p..
-
2024-02-14스파르타/TIL(Today I Learned) 2024. 2. 15. 01:20
어제와 마찬가지로 바빠서 따로 작성하지 못했다 오늘은 어제와 달리 강의가 아니라 프로젝트관련해서 하다가 못적은 점은 다르지만 말이다 이날 노션에 공부한 내용등 적어 둔것은 있지만 옮겨쓸 정도로 정리가 되어있진 않아서 나중에 자격증시험 끝나고 아마 적게 되지 않을까 싶다 (추가하여 수정) 더보기 코드 패치노트 (노션에 적어둔 부분 복붙) 메인에 올린 부분train, test 분리하는 부분 순서 전처리 다하고나서 분리해주는 방식으로 순서를 뒷부분으로 미루기 위에 위에서 분리하던 부분 주석처리 ID가 유니크한 key, index역할일 것으로 예상되어 확인하는 부분 추가 및 제거 부분 따로 분리하여 추가 데이터 중복 확인 및 처리중복되는 값이 있는지 pandas.dataframe.duplicated를 사용하면 ..
-
2024-02-13스파르타/TIL(Today I Learned) 2024. 2. 14. 00:14
마찬가지로 자격증강의듣고 정신없이 있다보니 12시 넘어서 글제목만 써두고 나중에 수정 우선 심화프로젝트 진행하면서 기록해둔 부분을 보면 더보기 코드 패치노트 메인에 올린것 object에서 category로 바꿔주는 것이 상황에 따라 다른데 지금 상황에서는 크게 이익되는 부분이 없는 듯하여 주석처리 (데이터 형식 바꿔주기type_change_category부분, 수치형 데이터에서 범주형 컬럼 추가해주는 부분에서 각 3부분 카테고리로 타입변경부분 주석처리, 학습 및 평가 부분에서 예측된 데이터 타입 int에서 category로 바꾼 부분 다시 주석처리) → 해주는게 나아보여서 다시 활성화… xgb 에러 수정 에러난 이유 : xgb는 0부터 순차적으로 레이블? 클래스? 생각하는데 실제는 1,2,3,4,5,6,..
-
2024-02-09~2024-02-12(설날연휴)스파르타/TIL(Today I Learned) 2024. 2. 14. 00:14
(일단 글만 적어두고 나중에 수정) 더보기 SQL 코드카타 아직 해결 못한 문제는 제외하고 작성 Interviews(SQL) (해결은 했는데 제출이 안되서 못함) Interviews | HackerRank 각 contest_id별로 contest_id와 hacker_id, name, 각 전체 submissions, accepted_submissions, views, unique_views를 출력하는데 contests_id의 오름차순으로 정렬하여 출력하는 문제이다 이번 문제도 뭔가 테이블이 많이 주어진 것으로 봐서 조금 복잡할 수 있겠다는 생각이 들었다. 이전 시도한 내용들 WITH total AS ( SELECT v.challenge_id, SUM(v.total_views) total_views, SUM..