Python/Pandas
[Pandas 기초] Pandas의 DataFrame
유달잇
2021. 6. 12. 23:48
728x90
DataFrame에 대해 알아보자.
1. DataFrame 생성
from pandas import Series, DataFrame
import pandas as pd
import numpy as np
# Example from - https://chrisalbon.com/python/pandas_map_values_to_values.html
raw_data = {'first_name': ['Jason', 'Molly', 'Tina', 'Jake', 'Amy'],
'last_name': ['Miller', 'Jacobson', 'Ali', 'Milner', 'Cooze'],
'age': [42, 52, 36, 24, 73],
'city': ['San Francisco', 'Baltimore', 'Miami', 'Douglas', 'Boston']}
df = pd.DataFrame(raw_data, columns = ['first_name', 'last_name', 'age', 'city'])
df
-> DataFrame은 기본적으로 2차원 매트릭스를 가정하며 row와 column으로 구성된다.
2. DataFrame 추출
1. 데이터프레임명, 칼럼명을 지정하여 데이터프레임에서 원하는 칼럼만 출력
2. . 과 [" "]을 사용하여 데이터프레임에서 시리즈를 추출할 수 있다.
3. loc[ ] 과 iloc[ ] 을 사용하여 추출하기
-> iloc은 index number 기준으로 슬라이싱을 하며,
loc은 index 이름을 기준으로 슬라이싱을 한다는 차이점이 있다.
3. DataFram 칼럼 추가
1. 생성된 데이터프레임에 칼럼명을 추가로 명시하여 추가한다.
2. 조건에 따라 다른 값을 할당하여 칼럼을 추가한다.
4. DataFrame 칼럼 삭제
-> del 명령어를 사용하여 원하는 칼럼을 삭제한다.
[AI Tech Pre-course] 인공지능(AI) 기초 다지기
부스트코스 무료 강의
www.boostcourse.org
728x90