Pandas 팬더스 데이터분석 기초 실습 - Minsuk Heo
Pandas 라이브러리 불러오기
import pandas as pd
파일 불러오기
df = pd.read_csv('data/friend_list.csv')
df
구분자, header 이름 지정하기
df = pd.read_csv('data/friend_list_noheader.txt', delimiter='\t', header=None, names=['name', 'age', 'job'])
Dictionary를 사용하여 데이터프레임 생성하기
friend_dict_list = [
{'name':'John', 'age':25, 'job':'student'},
{'name':'Nate', 'age':30, 'job':'teacher'}
] # dictionary
df = pd.DataFrame(friend_dict_list) # 데이터프레임 생성
df.head()
List를 사용하여 데이터프레임 생성하기
friend_list = [
['John', 20, 'student'],
['Nate', 30, 'teacher']
] # list
column_name = ['name', 'age', 'job']
df = pd.DataFrame.from_records(friend_list, columns = column_name)
df.head()
데이터프레임 파일로 저장하기
friend_dict_list = [
{'name':'John', 'age':20, 'job':'student'},
{'name':'Jenny', 'age':30, 'job': None},
{'name':'Nate', 'age':30, 'job':'teacher'}
]
df = pd.DataFrame(friend_dict_list)
# 저장하기
df.to_csv('output/friends_out.csv', index=False, header=False, na_rep = '-')
# 만약 index 혹은 header을 살리고 싶으면 True로 바꾸거나 생략 가능
# na_rep은 None값, 즉 빈칸을 다른 값으로 대체시키고싶을 때 사용
'Python > 기초공부' 카테고리의 다른 글
[python] 파이썬 내장함수: zip(), reversed() (0) | 2020.04.20 |
---|---|
[Pandas 기초] 행, 열 삭제/생성/수정 (0) | 2020.03.31 |
[Pandas 기초] 행, 열 선택 / 인덱스, column 이름으로 필터링하기 (0) | 2020.03.31 |