새싹일지

0613 새싹일지

gamnyam 2024. 6. 13. 17:29

실습 : 대졸자 직업 이동 자료 시각화

 

# cheat sheet

https://python-graph-gallery.com/cheat-sheets/

 

Cheat sheets | The Python Graph Gallery

A collection of cheat sheets related with Python and data visualization

python-graph-gallery.com

 

실습

- 펭귄

- word colud

 

<머신러닝>

 

딥러닝은 논리 연산기 AND OR XOR

학습을 통해 분류기를 만듦

 

차수가 높을수록 표현할 수 있는 그래프가 많아짐(표현력이 커짐)

3차식으로 표현 가능.

5차식으로도 표현 가능.

 

ax^2 + bx + c 에서 a, b, c 찾는게 머신러닝(ML)

 

차수가 높다고 다 좋은게 아님. 

오버피팅 : 데이터에 너무 최적화, 너무 많이 꺾임 -> 모델로서의 가치가 없음. 일반화가 안됨

 

 

ML regression

 

DNN, RNN, LSTN(?), Transformer 제일 좋음

 

주가는 시퀀스 데이터인데 변동을 주는 요인이 많음 -> 주가예측 어려움

강화학습 트레이딩 시키면 조금 나음. 

 

딥러닝은 보통 다변수 일차방정식

 

로그 : 지수의 역수

 

Sigmoid Function 중요(이진분류)

주가 : 오른다 내린다. 기업 : 파산한다 안한다

 

sigmoid가 더 발저나면 softmoid -> 다중분류할 때 사용

'새싹일지' 카테고리의 다른 글

0617 새싹일지  (1) 2024.06.17
0614 새싹일지  (1) 2024.06.14
0612 새싹일지  (1) 2024.06.13
PANDAS에서 loc, iloc 처리 방식  (0) 2024.06.11
0610 새싹일지  (0) 2024.06.10