Python/기초공부
[Pandas 기초] 파일에서 데이터 불러오기 / 데이터프레임 생성하기 / 데이터프레임 파일로 저장하기
jisun_rea
2020. 3. 31. 15:19
Pandas 팬더스 데이터분석 기초 실습 - Minsuk Heo
Pandas 라이브러리 불러오기
import pandas as pd
파일 불러오기
df = pd.read_csv('data/friend_list.csv')
df
구분자, header 이름 지정하기
friend_list_noheader.txt
0.00MB
df = pd.read_csv('data/friend_list_noheader.txt', delimiter='\t', header=None, names=['name', 'age', 'job'])
Dictionary를 사용하여 데이터프레임 생성하기
friend_dict_list = [
{'name':'John', 'age':25, 'job':'student'},
{'name':'Nate', 'age':30, 'job':'teacher'}
] # dictionary
df = pd.DataFrame(friend_dict_list) # 데이터프레임 생성
df.head()
List를 사용하여 데이터프레임 생성하기
friend_list = [
['John', 20, 'student'],
['Nate', 30, 'teacher']
] # list
column_name = ['name', 'age', 'job']
df = pd.DataFrame.from_records(friend_list, columns = column_name)
df.head()
데이터프레임 파일로 저장하기
friend_dict_list = [
{'name':'John', 'age':20, 'job':'student'},
{'name':'Jenny', 'age':30, 'job': None},
{'name':'Nate', 'age':30, 'job':'teacher'}
]
df = pd.DataFrame(friend_dict_list)
# 저장하기
df.to_csv('output/friends_out.csv', index=False, header=False, na_rep = '-')
# 만약 index 혹은 header을 살리고 싶으면 True로 바꾸거나 생략 가능
# na_rep은 None값, 즉 빈칸을 다른 값으로 대체시키고싶을 때 사용