04_handling_series(basic)
In [1]:
import pandas as pd
from collections import OrderedDict
In [2]:
scientists = pd.DataFrame(OrderedDict([
    ["Occupation", ["Chemist", "Statistician"]],
    ["Born", ["1920-07-25", "1876-06-13"]],
    ["Died", ["1958-04-16", "1937-10-16"]],
    ["Age", [37, 61]]
]), index=["Rosaline Franklin", "William Gosset"])
In [3]:
first_row = scientists.loc["William Gosset"]
print(first_row)

## Age열에 정수를 전달해도 series의 자료형을 오브젝트로 인식
Occupation    Statistician
Born            1876-06-13
Died            1937-10-16
Age                     61
Name: William Gosset, dtype: object


index, values, keys

In [4]:
print("index: \t{}".format(first_row.index))
print("values: \t{}".format(first_row.values))
print("keys: {}".format(first_row.keys()))
index: 	Index(['Occupation', 'Born', 'Died', 'Age'], dtype='object')
values: 	['Statistician' '1876-06-13' '1937-10-16' 61]
keys: Index(['Occupation', 'Born', 'Died', 'Age'], dtype='object')
In [5]:
# index 속성 응용
# index 속성의 첫번째 값 추출
print("{}".format(first_row.index[0]))
Occupation
In [6]:
# key method 
# key method 결과값을 이용하여 인덱스의 첫번째 값을 추출
print("{}".format(first_row.keys()[0]))
Occupation


statistic

In [7]:
ages = scientists["Age"]
print(ages)
Rosaline Franklin    37
William Gosset       61
Name: Age, dtype: int64
In [8]:
print("mean: {}".format(ages.mean()))
print("min: {}".format(ages.min()))
print("max: {}".format(ages.max()))
print("std: {}".format(ages.std()))
mean: 49.0
min: 37
max: 61
std: 16.97056274847714


series method

series describe
append 2개 이상의 시리즈 연결
describe 요약 통계량 계산
drop_duplicates 중복값이 없는 시리즈
equals 시리즈에 해당 값을 요소가 있는지 확인
get_values 시리즈 값 구하기(values 속성과 동일)
isin 시리즈에 포합된 값이 있는지 확인
min 최소값
max 최댓값
mean 평균
median 중간값
replace 특정 값을 가진 시리즈 값을 교체
sample 임의의 값을 반환
sort_values 값을 정렬
to_frame 시리즈를 데이터프레임으로 변환
In [9]:
from IPython.core.display import HTML, display
display(HTML("<style> .container{width:100% !important;}</style>"))


'pandas > basic' 카테고리의 다른 글

06.handling_dataframe(bool)  (0) 2018.12.09
05.handling_series(apply)  (0) 2018.12.09
03.create_data_frame  (0) 2018.12.09
02.basic_statistic  (0) 2018.12.09
01.data_slicing  (0) 2018.12.09

+ Recent posts