In [1]:
import pandas as pd
from collections import OrderedDict
In [2]:
scientists = pd.DataFrame(OrderedDict([
["Occupation", ["Chemist", "Statistician"]],
["Born", ["1920-07-25", "1876-06-13"]],
["Died", ["1958-04-16", "1937-10-16"]],
["Age", [37, 61]]
]), index=["Rosaline Franklin", "William Gosset"])
In [3]:
first_row = scientists.loc["William Gosset"]
print(first_row)
## Age열에 정수를 전달해도 series의 자료형을 오브젝트로 인식
index, values, keys¶
In [4]:
print("index: \t{}".format(first_row.index))
print("values: \t{}".format(first_row.values))
print("keys: {}".format(first_row.keys()))
In [5]:
# index 속성 응용
# index 속성의 첫번째 값 추출
print("{}".format(first_row.index[0]))
In [6]:
# key method
# key method 결과값을 이용하여 인덱스의 첫번째 값을 추출
print("{}".format(first_row.keys()[0]))
statistic¶
In [7]:
ages = scientists["Age"]
print(ages)
In [8]:
print("mean: {}".format(ages.mean()))
print("min: {}".format(ages.min()))
print("max: {}".format(ages.max()))
print("std: {}".format(ages.std()))
series method¶
series | describe |
---|---|
append | 2개 이상의 시리즈 연결 |
describe | 요약 통계량 계산 |
drop_duplicates | 중복값이 없는 시리즈 |
equals | 시리즈에 해당 값을 요소가 있는지 확인 |
get_values | 시리즈 값 구하기(values 속성과 동일) |
isin | 시리즈에 포합된 값이 있는지 확인 |
min | 최소값 |
max | 최댓값 |
mean | 평균 |
median | 중간값 |
replace | 특정 값을 가진 시리즈 값을 교체 |
sample | 임의의 값을 반환 |
sort_values | 값을 정렬 |
to_frame | 시리즈를 데이터프레임으로 변환 |
In [9]:
from IPython.core.display import HTML, display
display(HTML("<style> .container{width:100% !important;}</style>"))
'pandas > basic' 카테고리의 다른 글
06.handling_dataframe(bool) (0) | 2018.12.09 |
---|---|
05.handling_series(apply) (0) | 2018.12.09 |
03.create_data_frame (0) | 2018.12.09 |
02.basic_statistic (0) | 2018.12.09 |
01.data_slicing (0) | 2018.12.09 |