CS 공부/잡다한 것들
1주차 과제 회고
imsmile2000
2023. 3. 10. 20:56
- 기본과제 1
- 어려웠던점
- 딱히 없었던 것 같다... 구지 뽑자면 중간값 구하는 코드 정도?
- 어려웠던점
number_list.sort()
if len(number_list)%2!=0:
median = number_list[len(number_list)//2]
else:
median=(number_list[(len(number_list)//2)-1]+number_list[len(number_list)//2])/2
return median
- 기본과제 2
- 어려웠던 점
- 과제2도 딱히 없었다. 중요한 것을 뽑자면 행렬곱을 구하는 방법 정도
- 어려웠던 점
- 기본과제3
- 어려웠던 점 (과제3은 조금 어려웠다)
1. 데이터프레임 타입 바꾸기 (astype)
df.dtypes #하나의 데이터프레임 타입 확인하기
df.astype('category') #원본 데이터를 astype('category')로 형변환, 전체 타입 확인
2. 비율구하기 (value_counts 함수)
# 남녀 비율 구하기
df["sex"].value_counts(sort=True)/len(df)
# 비율 구하기
df["title"].value_counts(normalize=True) # normalize: 상대 빈도 구하기
pandas value_counts() 함수
Pandas의 value_counts() 함수는 가장 기초적이면서 일반적으로 사용되는 함수 중 하나입니다. 기본적으로 지정된 열의 각 값(value)에 대한 모든 발생 횟수를 반환합니다. 단순한 방법 이외에 여러 옵
zzinnam.tistory.com
3. 특정 행/열에 함수 적용하기 (apply 함수)
# extract_title 함수를 name 열에 적용하기
df["title"] = df["name"].apply(extract_title)
[Pandas] 16. apply 함수 사용법 알아보기.
안녕하세요~ 꽁냥이에요. 데이터 전처리를 하다 보면 특정 열을 변환해야 할 때가 있지요. 예를 들어 회귀 모형을 구축할 때 설명 변수를 log 함수를 이용하여 변환하는 것처럼 말이죠. Pandas에서
zephyrus1111.tistory.com
4. 파이썬 구간 나누기 (pd.cut 함수)
# age열을 0~10대, 10~20대 ... 70~80대로 나누기
bins=list(range(0, int(df["age"].max()) + 10, 10)) # [0,10,20,...80]
pd.cut(df['age'], bins)
#출력 :
#0 (20.0, 30.0]
#1 (30.0, 40.0]
#2 (20.0, 30.0]
# ...
#413 NaN
#414 (30.0, 40.0]
#415 (30.0, 40.0]
[Pandas]구간 나누기(pd.cut,pd.qcut)
판다스에는 구간 나누는 기능이 있습니다. 그래서 카테고리를 만들 때 굉장히 편합니다. 물론 파이썬 자체에서도 가능하지만 제 생각에는 판다스로 하는게 편리하고 한눈에 볼 수 있어서 좋은
seong6496.tistory.com