채용정보 | 인재채용 | 코오롱베니트 (kolonbenit.com)
코오롱베니트 | 채용정보
www.kolonbenit.com
<오전>
실제로 성능 좋은건 딥뉴러닝
bagging : 데이터셋을 다르게 처리해서 병렬처리
앙상블
못하는 애들끼리 모여있으면 성능이 안좋아짐
조금이라도 잘하는 애들 있으면 성능 확 올라감
배깅 = 부트스트레핑 + 어그리게이션
전체데이터의 36% 정도는 안뽑힘
weighted voting : 잘하는 모델에 가중치 더 줌
bagging(대표적 모델 : random forest)
부트스트레핑은 복원 추출을 뽑는 것.
각각의 다른 객체학습기 만들어 놓고, 복원추출로 데이터셋 뽑고, 학습 시킴, 보팅으로 추론.
디시젼 트리는 피쳐를 어떤걸 쓰느냐에 따라 결과가 달라짐
랜덤 섭스페이스 : 로그 n개, 루트 n개
오민엽 4명이 메시 1명이랑 축구경기
OOB : 안뽑힌애
배깅과 페이스팅 읽어보기
Boosting
AdaBoost
가중을 어떻게 주는지에 따라 값이 바뀜
서비스 이탈예측 데이터
모델마다 베스트 파라미터가 좀 다름
lightgbm 쓰는게 좋음
Pycaret : 어떤게 좋은지 찾아주는거
<오후>
pandas AI 가 전처리 잘함
겟더미, 원핫인코더(사이킷런)
concat : 수가 안맞아서 더미로 합치고 다시 나눠줌
'새싹일지' 카테고리의 다른 글
0627 새싹일지 (0) | 2024.06.27 |
---|---|
remove, delete 뭔데?? (파이썬 기본 문법) (0) | 2024.06.27 |
깃허브 계정을 만들었다. (0) | 2024.06.24 |
0624 새싹일지 (0) | 2024.06.24 |
0621 새싹일지 (0) | 2024.06.21 |