본문 바로가기
언어/파이썬

[파이썬] 데이터 전처리 - 여러 행 데이터를 한 행으로 합치기 / 한 행의 데이터를 여러 행으로 분리, 여러 열로 분리

by 퇴근후개발 2021. 1. 20.
반응형

 

1. 여러 행 데이터를 한행으로 합치기

import pandas as pd
data = pd.read_csv('ColToRow.txt', sep = "\t", engine='python', encoding = "utf-8")
data = pd.DataFrame(data)
data

 

data = data.groupby('구분', as_index=False).agg(','.join)
data

 

2. 한 행의 데이터를 여러 행으로 분리, 여러 열로 분리하기

data

 

data_split = data['데이터'].str.split(',')
data_split

 

data_split = data_split.apply(lambda x: pd.Series(x))
data_split

 

result = pd.concat([data['구분'],data_split], axis=1) # 열방향 연결
result

 

result.set_index("구분", inplace=True) # 인덱스 변경
result

 

result = pd.DataFrame(result.stack())
result.columns = ['데이터'] # 컬럼명 변경
result

 

result = result.reset_index(level=1,drop=True) # 인덱스 변경 후, 버리기
result

 

 

출처

반응형