CS 공부/잡다한 것들

1주차 과제 회고

imsmile2000 2023. 3. 10. 20:56
  • 기본과제 1 
    • 어려웠던점
      • 딱히 없었던 것 같다... 구지 뽑자면 중간값 구하는 코드 정도?
number_list.sort()
if len(number_list)%2!=0:
   median = number_list[len(number_list)//2]
else:
   median=(number_list[(len(number_list)//2)-1]+number_list[len(number_list)//2])/2
return median

 

  • 기본과제 2
    • 어려웠던 점
      • 과제2도 딱히 없었다.  중요한 것을 뽑자면 행렬곱을 구하는 방법 정도

행렬곱을 구하는 방법 (c_11 구하기)

 

  • 기본과제3
    • 어려웠던 점 (과제3은 조금 어려웠다)

1. 데이터프레임 타입 바꾸기 (astype)

df.dtypes #하나의 데이터프레임 타입 확인하기
df.astype('category') #원본 데이터를 astype('category')로 형변환, 전체 타입 확인

 

 2. 비율구하기 (value_counts 함수)

# 남녀 비율 구하기
df["sex"].value_counts(sort=True)/len(df)
# 비율 구하기
df["title"].value_counts(normalize=True) # normalize: 상대 빈도 구하기
 

pandas value_counts() 함수

Pandas의 value_counts() 함수는 가장 기초적이면서 일반적으로 사용되는 함수 중 하나입니다. 기본적으로 지정된 열의 각 값(value)에 대한 모든 발생 횟수를 반환합니다. 단순한 방법 이외에 여러 옵

zzinnam.tistory.com

 

3. 특정 행/열에 함수 적용하기 (apply 함수)

# extract_title 함수를 name 열에 적용하기
df["title"] = df["name"].apply(extract_title)

 

 

[Pandas] 16. apply 함수 사용법 알아보기.

안녕하세요~ 꽁냥이에요. 데이터 전처리를 하다 보면 특정 열을 변환해야 할 때가 있지요. 예를 들어 회귀 모형을 구축할 때 설명 변수를 log 함수를 이용하여 변환하는 것처럼 말이죠. Pandas에서

zephyrus1111.tistory.com

 

4. 파이썬 구간 나누기 (pd.cut 함수)

# age열을 0~10대, 10~20대 ... 70~80대로 나누기
bins=list(range(0, int(df["age"].max()) + 10, 10)) # [0,10,20,...80]
pd.cut(df['age'], bins)
#출력 :
#0      (20.0, 30.0]
#1      (30.0, 40.0]
#2      (20.0, 30.0]
#           ...     
#413             NaN
#414    (30.0, 40.0]
#415    (30.0, 40.0]
 

[Pandas]구간 나누기(pd.cut,pd.qcut)

판다스에는 구간 나누는 기능이 있습니다. 그래서 카테고리를 만들 때 굉장히 편합니다. 물론 파이썬 자체에서도 가능하지만 제 생각에는 판다스로 하는게 편리하고 한눈에 볼 수 있어서 좋은

seong6496.tistory.com