새싹일지

0625 새싹일지

gamnyam 2024. 6. 25. 19:40

채용정보 | 인재채용 | 코오롱베니트 (kolonbenit.com)

 

코오롱베니트 | 채용정보

 

www.kolonbenit.com

 

<오전>

 

실제로 성능 좋은건 딥뉴러닝

bagging : 데이터셋을 다르게 처리해서 병렬처리

 

앙상블

못하는 애들끼리 모여있으면 성능이 안좋아짐

조금이라도 잘하는 애들 있으면 성능 확 올라감

 

배깅 = 부트스트레핑 + 어그리게이션

 

전체데이터의 36% 정도는 안뽑힘

 

weighted voting : 잘하는 모델에 가중치 더 줌

 

bagging(대표적 모델 : random forest)

부트스트레핑은 복원 추출을 뽑는 것.

 

각각의 다른 객체학습기 만들어 놓고, 복원추출로 데이터셋 뽑고, 학습 시킴, 보팅으로 추론.

 

디시젼 트리는 피쳐를 어떤걸 쓰느냐에 따라 결과가 달라짐

 

랜덤 섭스페이스 : 로그 n개, 루트 n개

오민엽 4명이 메시 1명이랑 축구경기

 

OOB : 안뽑힌애

 

배깅과 페이스팅 읽어보기

 

 

Boosting

 

AdaBoost 

가중을 어떻게 주는지에 따라 값이 바뀜

 

서비스 이탈예측 데이터

 

모델마다 베스트 파라미터가 좀 다름

lightgbm 쓰는게 좋음

 

Pycaret : 어떤게 좋은지 찾아주는거

 

<오후>

 

pandas AI 가 전처리 잘함

 

겟더미, 원핫인코더(사이킷런)

 

concat : 수가 안맞아서 더미로 합치고 다시 나눠줌

 

 

'새싹일지' 카테고리의 다른 글

0627 새싹일지  (0) 2024.06.27
remove, delete 뭔데?? (파이썬 기본 문법)  (0) 2024.06.27
깃허브 계정을 만들었다.  (0) 2024.06.24
0624 새싹일지  (0) 2024.06.24
0621 새싹일지  (0) 2024.06.21