[Python/파이썬] 판다스 데이터프레임 열 이름/컬럼명 변경하기

How to Rename Pandas Dataframe Columns

파이썬 판다스 데이터프레임을 다룰 때, 열 이름 또는 컬럼명을 변경해야 될 때가 있습니다. 예를 들면, 컬럼명이 너무 복잡해서 간단하게 변경하거나 보다 컬럼에 속하는 데이터를 잘 반영하도록 이름을 변경합니다. 이번 글에서는 데이터프레임의 컬럼명을 확인하는 방법과 컬럼명을 변경하는 방법에 대해서 알아봅시다.

# 샘플 데이터
new_jeans = pd.DataFrame({'이름':['민지', '하니', '다니엘', '해린', '혜인'],
                             '키':[169, 162, 165, 164, 170],
                             '출생연도':[2004, 2004, 2005, 2006, 2008]})

 

데이터프레임 컬럼명 확인하는 방법

df.columns

 

컬럼명 확인하는 방법

데이터프레임의 컬럼명을 확인하는 것은 매우 간단합니다. 데이터프레임 이름에 뒤에 ".columns"만 붙이면 됩니다.

# 리스트 안의 요소처럼, 각 컬럼의 이름을 호출할 수 있습니다.

print(new_jeans.columns[0],
      new_jeans.columns[1],
      new_jeans.columns[2])
      
# result : 이름 키 출생연도

 

데이터프레임 컬럼명 변경하기

(1) df.columns

컬럼명을 확인하는 방법을 조금 응용하면, 마찬가지로 쉽게 컬럼명을 변경할 수 있습니다.

변경하고 싶은 컬럼명을 리스트에 담으면 됩니다.

영어로 컬럼명을 변경해봅시다.

이 방법에서 주의해야 할 점은 컬럼명의 개수와 리스트 원소의 개수가 일치해야 된다는 것입니다. 즉, 변경하려는 컬럼명 뿐만 아니라 바꾸지 않을 컬럼명까지 모두 적어줘야 합니다. 샘플 데이터의 경우 컬럼명이 3개 뿐이기 때문에 체감이 잘 안 되는데, 1000개의 컬럼 중에 하나만 바꾸려고 해도 변경하지 않는 나머지 999개의 컬럼명을 그대로 적어줘야 한다는 뜻입니다.

 

# 컬럼의 개수와 리스트 요소의 개수가 일치하지 않으면 ValueError가 발생

new_jeans.columns = ['name','height']

# ValueError: Length mismatch: Expected axis has 3 elements, new values have 2 elements

 

따라서 이 방법은 컬럼의 개수가 적거나 대부분의 컬럼명을 변경할 때 적합한 방법입니다. 아래에서는 변경하려는 컬럼명만 콕 집어서 적어도 되는 방법을 알아봅시다.

 

(2) df.rename

변경 전 이름과 변경 후 이름을 dictionary 형태로 표현하면, 컬럼명을 쉽게 변경할 수 있습니다. 위에서 살펴본 df.columns 방식과 달리, 변경하려는 컬럼만 입력해주면 돼서 보다 편리한 방법입니다.

 

여기서 또 조심해야 될 것이 하나 있습니다.

inplace=True를 추가로 적어줘야, 기존 데이터프레임의 컬럼명이 변경됩니다.


inplace=True를 추가로 적지 않고도 변경할 수 있는 방법도 있습니다.

컬럼명을 변경하지 않을 키, 출생연도는 적지 않아도 변경할 수 있음

컬럼명을 변경한 데이터프레임을 다시 지정해주는 것입니다.

반응형
  • 네이버 블로그 공유
  • 네이버 밴드 공유
  • 페이스북 공유
  • 카카오스토리 공유