데이터의 가능성/pandas

pandas 자주 쓰는 문법

gamnyam 2024. 10. 8. 20:31

- nan 값이 있는 행의 모든 컬럼 추출하기

df[df.isna().any(axis=1)]

 

- 특정 셀 값 채우기

df.loc[12076, 'intro'] = '''지금 가장 필요한 것은 돈 되는 공부'''
df.loc[25:26, 'title'] = df.loc[25:26, 'title'].fillna('+F 전략')
# df[25:26]['title'].fillna('+F 전략', inplace = True)
# 아래는 SettingWithCopyWarning 발생

# 이 경고는 DataFrame에서 슬라이싱을 통해 얻은 결과에 대해 값을 변경할 때 발생
# 이는 원본 DataFrame이 아닌 슬라이스된 복사본에 값을 변경하고 있다는 경고
# 실제로 원본에 값이 반영되지 않을 수 있다는 의미
# 명시적으로 원본 데이터에 접근하는 방식으로 코드를 수정

 

- 인덱스로 특정 행 찾기

df.loc[30:50]

 

- 특정 값으로 셀 나누기

df[['저자', '역자', '기타']] = df['authors'].str.split('/', n=2, expand=True)

 

- 특정 컬럼 제거

books.drop('authors', axis = 1, inplace = True)

 

- 특정 행, 열 검색

df.loc[3:5, ['title','full_name']]

 

- 데이터타입변경

df['isbn'] = df['isbn'].astype('object')

 

- 특정 컬럼에 nan값이 있는지 확인

df_unique[df_unique.pages.isna( )]

 

- 특정 컬럼에 nan값이 있는 행 삭제

del_nan = df_unique.dropna(subset=['authors','publisher'])