Pandas 관련 이것저것

2021. 3. 6. 23:33파이썬

다음의 강의를 공부하기 위해 실습한 내용입니다.

www.inflearn.com/course/pandas-%ED%8C%AC%EB%8D%94%EC%8A%A4-%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%B6%84%EC%84%9D-%EA%B8%B0%EC%B4%88/dashboard

 

 

1. Pandas로 csv파일 읽는 법

import pandas as pd

data_frame = pd.read_csv('data/friend_list.csv', delimiter = ',')

data_frame

  - pandas는 numpy를 이용한다.

 

2. Column Name이 없어서 넣어줄 때

import pandas as pd

data_frame = pd.read_csv('data/friend_list_noheader.csv', delimiter = ',', header=None, names=['name','age','job'])

data_frame

 

3. Data Frame의 컬림은 Series로 구성되어 있다.(리스트로 넣으면 된다)

  - pandas.core.series.Series

import pandas as pd

series1 = pd.core.series.Series([1,2,3])
series2 = pd.core.series.Series(['1','2','3'])
series3 = pd.core.series.Series([4,5,6])
series4 = pd.core.series.Series(['a','b','c'])

pd.DataFrame(data=dict(s1=series1, s2=series2, s3=series3, s4=series4))

4. Dictionary 와 Ordered Dictionary를 이용한 DataFrame 생성

import pandas as pd

friend_pd_list =[
    {'name' : 'John', 'age' : 25, 'job' : 'student'},
    {'name' : 'Baek', 'age' : 47, 'job' : 'worker'}
]

df = pd.DataFrame(friend_pd_list)
df


#기호를 잘 봐야 한다.
friend_ordered_dict =OrderedDict(
[
    ('name' , ['John', 'Baek']),
    ('age' , [25, 46]),
    ('job' , ['student', 'worker'])
])

df = pd.DataFrame(friend_ordered_dict)
df