본문 바로가기

Python/기초공부

[Pandas 기초] 파일에서 데이터 불러오기 / 데이터프레임 생성하기 / 데이터프레임 파일로 저장하기

Pandas 팬더스 데이터분석 기초 실습 - Minsuk Heo

https://www.inflearn.com/course/pandas-%ED%8C%AC%EB%8D%94%EC%8A%A4-%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%B6%84%EC%84%9D-%EA%B8%B0%EC%B4%88

 

Pandas 라이브러리 불러오기

import pandas as pd

 

파일 불러오기

friend_list.csv
0.00MB

df = pd.read_csv('data/friend_list.csv')
df

 

구분자, header 이름 지정하기

friend_list_noheader.txt
0.00MB

df = pd.read_csv('data/friend_list_noheader.txt', delimiter='\t', header=None, names=['name', 'age', 'job'])

 

Dictionary를 사용하여 데이터프레임 생성하기

friend_dict_list = [
    {'name':'John', 'age':25, 'job':'student'},
    {'name':'Nate', 'age':30, 'job':'teacher'}
] # dictionary

df = pd.DataFrame(friend_dict_list) # 데이터프레임 생성
df.head()

 

List를 사용하여 데이터프레임 생성하기

friend_list = [
    ['John', 20, 'student'],
    ['Nate', 30, 'teacher']
] # list
column_name = ['name', 'age', 'job']

df = pd.DataFrame.from_records(friend_list, columns = column_name)
df.head()

 

데이터프레임 파일로 저장하기

friend_dict_list = [
    {'name':'John', 'age':20, 'job':'student'},
    {'name':'Jenny', 'age':30, 'job': None},
    {'name':'Nate', 'age':30, 'job':'teacher'}
]
df = pd.DataFrame(friend_dict_list)

# 저장하기
df.to_csv('output/friends_out.csv', index=False, header=False, na_rep = '-')
# 만약 index 혹은 header을 살리고 싶으면 True로 바꾸거나 생략 가능
# na_rep은 None값, 즉 빈칸을 다른 값으로 대체시키고싶을 때 사용