-
2024-02-19스파르타/TIL(Today I Learned) 2024. 2. 19. 22:30
오늘 드디어 발표긴한데 후... 솔직히 내가 말해달라고 피드백 드린 부분 싹다 다시 빼고 발표를 해버려서 멘털에 타격이 가서 좀 감정이 진정이 안되는 것과, 예정보다 컨디션과 자격증 공부 진도가 덜 나간 관계로 후에 수정하도록 하겠다
내용으로는 간단한 내용? 정도와 발표 들으면서 참고하면 좋을 만한 부분, 그리고 우리 조 발표에 대해 피드백받은 부분에 대해 적으면 될듯하다(추가 수정부분)
흠.. 적을려고 했으나 새로 다시 다른 팀들 결과도 보면서 따로 작성해주는 것이 좋겠다는 생각이 들었다
https://docs.google.com/presentation/d/1wtPPylb-tzSOaKEhxjMzOrvEk7X5--ROh2p7sNP8zsg/edit#slide=id.p
2채널 부분만 듣고 간략히 필기로 적어뒀던 부분들이다
발표 및 피드백
코호트 분석이 뭐였지?→ 전체로 하는게 아니라 약간 남은 사람중에서 몇명 남았는지 하는 느낌이였음
streamlit으로 대시보드 A07 가넷 김동제
혼동행렬 그려서 어느정도인지 확인하는 방법도 괜찮은듯
대출 등급에 따른 상황비율? 평균 확인도 괜찮았는듯
총상환금액이 0인 고객들이 상환 능력이 부족한 그룹인지 판단지을 수 없다고 봄
내가 놓친 부분 몇개있어서 자격증 시험 끝나고 다시 한번 보면서 확인하면 좋을 듯
이상치 고려를 나도 좀더 해줬으면 좋았을 듯 했음
과적합 확인하는 방법은 따로 피드백은 없고 있었드면 정말 좋았을 것인데 아쉽다고 하심..
z-score 보통 3으로 제거하는데 너무 많이 손실되니, 7로
기술적 분석이나 통계적 분석의 의미가 무엇인지 짚어주는 것
이러한 의미 때문에 이렇게 되었던 것 같다, field side에 기반해서 얘기를 해줬으면 더 좋았을듯
→ 사실 어느정도는 넣어놨는데 발표내용에서 다 날리고 발표해서… 관련해서 진행한 부분에 대해 따로 얘기 못들음…
Unknown 회귀를 이용하여 유추해보았음
가설을 여러개 미리 설정해서 그것을 통해 파생변수를 잡아주었고, 등급 분류가 잘안되는 클래스를 확인하고 잘 분류할 수 있게 해줬음, EDA와 feature_importance와 엮어서 해주었음
마지막 주제 6번 조 뭔가 참고해볼 만한 부분 많은듯
아예 shap value 라이브러리 자체가 있는 듯
shap value 음수 일 때 예측값의 확률을 낮춘다 생각하면 될듯 → 그 값이 많아지면 예측력이 낮아진다 생각하면 얼추 맞는듯 (상관관계라던가 여러 부분도 알아야 제대로 할 수 있음)
보고서를 데이터 분석 flow에 따라 작성한 것이 좋은듯
전처리도 근거를 둬서 했는부분
피쳐 selection 하나하나 해본 부분도 좋았음
결과 및 해석을 진짜 잘했는 듯
모델을 해석하는 부분이 확실히 있어서 좋았는듯
실무자 입각해서 논문을 통해서 보강하면 좋음,
어떤 주제에 대하여 애기할 때 관련 문제라던가 관련 배경 등 설명해주는 것이 매우 좋은 방법이라고 생각
모델 선택에 대한 이유, 데이터의 특성을 고려해서 모델의 특징과 연관지어 얘기하는 점이 좋은 듯(특성, 장점, 단점 이런 부분 확실히 알고 쓰는 것이 좋아서)
데이터 분석가는 모르는 사람에게도 용어 등을 풀어서 설명해줘야함 좋은 방법이 시각화, 그리고 정성적으로 풀어서 설명
단순히 이부분만 가지고는 프로젝트 했던 부분을 보완하기는 힘들 듯하여 따로 다시 영상부분 듣고 해야할듯하다
'스파르타 > TIL(Today I Learned)' 카테고리의 다른 글
2024-02-21 (0) 2024.02.21 2024-02-20 (0) 2024.02.20 2024-02-16 (0) 2024.02.17 2024-02-15 (0) 2024.02.16 2024-02-14 (0) 2024.02.15