전체 글
-
2024-02-14스파르타/TIL(Today I Learned) 2024. 2. 15. 01:20
어제와 마찬가지로 바빠서 따로 작성하지 못했다 오늘은 어제와 달리 강의가 아니라 프로젝트관련해서 하다가 못적은 점은 다르지만 말이다 이날 노션에 공부한 내용등 적어 둔것은 있지만 옮겨쓸 정도로 정리가 되어있진 않아서 나중에 자격증시험 끝나고 아마 적게 되지 않을까 싶다 (추가하여 수정) 더보기 코드 패치노트 (노션에 적어둔 부분 복붙) 메인에 올린 부분train, test 분리하는 부분 순서 전처리 다하고나서 분리해주는 방식으로 순서를 뒷부분으로 미루기 위에 위에서 분리하던 부분 주석처리 ID가 유니크한 key, index역할일 것으로 예상되어 확인하는 부분 추가 및 제거 부분 따로 분리하여 추가 데이터 중복 확인 및 처리중복되는 값이 있는지 pandas.dataframe.duplicated를 사용하면 ..
-
2024-02-13스파르타/TIL(Today I Learned) 2024. 2. 14. 00:14
마찬가지로 자격증강의듣고 정신없이 있다보니 12시 넘어서 글제목만 써두고 나중에 수정 우선 심화프로젝트 진행하면서 기록해둔 부분을 보면 더보기 코드 패치노트 메인에 올린것 object에서 category로 바꿔주는 것이 상황에 따라 다른데 지금 상황에서는 크게 이익되는 부분이 없는 듯하여 주석처리 (데이터 형식 바꿔주기type_change_category부분, 수치형 데이터에서 범주형 컬럼 추가해주는 부분에서 각 3부분 카테고리로 타입변경부분 주석처리, 학습 및 평가 부분에서 예측된 데이터 타입 int에서 category로 바꾼 부분 다시 주석처리) → 해주는게 나아보여서 다시 활성화… xgb 에러 수정 에러난 이유 : xgb는 0부터 순차적으로 레이블? 클래스? 생각하는데 실제는 1,2,3,4,5,6,..
-
2024-02-09~2024-02-12(설날연휴)스파르타/TIL(Today I Learned) 2024. 2. 14. 00:14
(일단 글만 적어두고 나중에 수정) 더보기 SQL 코드카타 아직 해결 못한 문제는 제외하고 작성 Interviews(SQL) (해결은 했는데 제출이 안되서 못함) Interviews | HackerRank 각 contest_id별로 contest_id와 hacker_id, name, 각 전체 submissions, accepted_submissions, views, unique_views를 출력하는데 contests_id의 오름차순으로 정렬하여 출력하는 문제이다 이번 문제도 뭔가 테이블이 많이 주어진 것으로 봐서 조금 복잡할 수 있겠다는 생각이 들었다. 이전 시도한 내용들 WITH total AS ( SELECT v.challenge_id, SUM(v.total_views) total_views, SUM..
-
2024-02-11스파르타/WIL(Weekly I Learned) 2024. 2. 11. 22:47
**FACTS(사실, 객관)** : 이번 일주일 동안 있었던 일, 내가 한 일 SQL 코드카타 17문제, 머신러닝 개인과제 해설특강, 프로젝트 주제 정하기 및 관련 작업 (+설날연휴) (자세한 내용 설명은 TIL에 작성하였던 부분으로 대체하겠다) **FEELINGS(느낌, 주관)** : 나의 감정적인 반응, 느낌 코드카타는 마지막 8문제? 쯤 부터는 갑자기 난이도가 많이 올라간 듯 생각되었는데 테이블이 많이 주어지거나 문제 내용이 이해가 잘안되어 헤매었던 부분도 다수라 정말 어렵다 느낀 것은 몇 문제 되지 않다고 생각할 수 도 있겠지만 그냥 단순 여러개가 주어지거나해서 복잡한 경우도 해결하는데 꽤 시간이 소요되었으니 최대한 이해가 되는 대로 차근차근 빨리 해결할 수 있도록 해결하면 좋겠다는 생각을 했다(..
-
Pandas와 친해지기(10분 Pandas) (2024-02-10)코딩 공부/Pandas 2024. 2. 10. 21:42
Selection 부분 추가로 (2024-02-10)¶어제 내용 미리 조금 작석해두고 날짜나눠서 친척집 가기 전에 올려두고 갈려했는데 뭔가 꼬였는지 2월 8일 날짜로 두번 올라가서 덮어쓰기 되었다 Selection by position¶위치로 하는 것으로 index를 사용하게 되어 이전 label로 하던 것에서 i가 추가로 붙은 형태의 메소드를 사용한다 In [ ]: df A B C D 2013-01-01 1.502471 0.594288 2.118684 0.760508 2013-01-02 -0.819508 0.625336 0.437477 -0.566756 2013-01-03 1.338780 0.066758 0.931451 -0.750420 2013-01-04 -1.518039 -1.663265 0.738..
-
Pandas와 친해지기(10분 Pandas) (2024-02-09)코딩 공부/Pandas 2024. 2. 9. 13:00
Selection 부분 (2024-02-09)¶ In [ ]: df A B C D 2013-01-01 -2.136993 0.078948 -0.701306 0.715640 2013-01-02 0.036191 -0.312787 -1.213996 -0.499502 2013-01-03 -1.163258 0.746266 -2.155175 0.689680 2013-01-04 -0.270996 0.901398 0.330045 0.811605 2013-01-05 -0.560772 0.529117 1.118020 -0.268348 2013-01-06 0.929646 0.378252 0.950864 -0.297048 Getitem([])¶ In [ ]: display(df.A) # 메소드?방식? 속성방식? 안정적이지 않음..
-
Pandas와 친해지기(10분 Pandas) (2024-02-08)코딩 공부/Pandas 2024. 2. 8. 23:40
View부분 (2024-02-08)¶ In [ ]: dates = pd.date_range("20130101", periods=6) dates DatetimeIndex(['2013-01-01', '2013-01-02', '2013-01-03', '2013-01-04', '2013-01-05', '2013-01-06'], dtype='datetime64[ns]', freq='D') In [ ]: df = pd.DataFrame(np.random.randn(6, 4), index=dates, columns=list("ABCD")) df A B C D 2013-01-01 0.084276 -0.990418 0.766975 -0.105054 2013-01-02 -0.060532 -1.116166 -0.190412..
-
2024-02-08스파르타/TIL(Today I Learned) 2024. 2. 8. 23:21
더보기 SQL코드카타 Placements(SQL)(with, case when, left join 같은 테이블 2개 더 가져오기)(join하는데 A테이블에 B테이블 두번 각각 열에 대해 join해주고 그것의 결과끼리 비교하여 판단결과 컬럼으로 추가하기) Placements | HackerRank 가장 친한 친구가 자신보다 더 높은 연봉을 제안 받은 학생의 이름을 가장 친한 친구가 받게되는 연봉의 금액에 따라 오름차순 정렬하는 문제이다. SELECT f.id, f.friend_id, pid.salary, pfid.salary friend_salary, CASE WHEN pid.salary pfid.salary THEN "ow..