목록Python (23)
nada
Series 인덱스 및 값 확인 Reference Pandas In action Series.index 해당 Series의 인덱스와 인덱스의 type 확인 Series.values 해당 Series의 값 확인 import pandas as pd calories_info = { 'Protein Bar' : 125, 'Salade' : 215, 'Chocolate Bar' : 406, } diet = pd.Series(calories_info) diet Protein Bar 125 Salade 215 Chocolate Bar 406 dtype: int64print(f"diet의 인덱스 : {diet.index}") print(f"diet의 값 : {diet.valu..
Series 행 반환 Reference Pandas In Action import pandas as pd values = range(0,500,5) nums = pd.Series(data = values) nums 0 0 1 5 2 10 3 15 4 20 ... 95 475 96 480 97 485 98 490 99 495 Length: 100, dtype: int64 1. Series 상위 행 반환 :: Series.head( ) Series.head( n = 5 ) 처음 n개의 행을 반환 Option n : 선택할 행 수 nums.head() # nums의 상위 5개의 행 반환 0 0 1 5 2 10 3 15 4 20 dtype: int64 2. Series 하위 행 확인 :: Series.tail(..
JSON 파일 불러오기 :: pd.read_json( ) Reference Pandas In Action JSON(Jave Script Object Notation) 텍스트 데이터를 저장하고 전송하기 위한 형식 키 - 값 쌍으로 구성 Python의 딕셔너리 객체와 유사 린터(Linter) 각 키 - 값 쌍을 별도의 줄에 배치하여 JSON 응답을 가독성 있는 형식으로 나타냄 pd.read_csv( path_or_buf = None, ) Option path_or_buf : 파일 경로 및 파일 이름 import pandas as pd nobel = pd.read_json("./Data/nobel.json") nobel prizes 0 {'year': '2019', 'catego..
Excel 파일 :: pd.read_excel( ) Reference Pandas In Action pd.read_excel( io, usecols = None, index_col = None, sheet_name ) Excel 통합문서 파일을 DataFrame으로 불러오기 Option io : 파일 경로 및 파일 이름 usecols : 사용할 열 index_col : 이덱스로 사용할 열 sheet_name : 사용할 시트 # conda install xlrd openpyxl pd.read_excel("./Data/Single Worksheet.xlsx") First Name Last Name City Gender 0 Brandon James Miami M 1 Sean Hawkins Denver M 2 ..
CSV 파일 불러오기 :: pd.read_csv( ) Reference Pandas In Action pd.read_csv( filepath_or_buffer, usecols = None, index_col = None, sep = None, na_values = None, dtype = None, skiprows = None ) CSV파일을 DataFrame으로 불러오기 Option filepath_orbuffer : 파일 경로 및 파일 이름 usecols : 사용할 열 index_col : 인덱스로 사용할 열 sep : 구분자 na_values : 결측값 형태 dtype : 데이터 유형 skiprows : 특정 행 제외 url = 'https://data.cityofnewyork.us/api/view..
DataFrame 생성 :: pd.DataFrame( ) Reference Pandas In Action import pandas as pd pd.DataFrame( data = None, # 딕셔너리(Dictionary), Numpy ndarray, etc... index = None, # 리스트(list), MultiIndex 객체 columns = None, # 리스트(list), MultiIndex 객체 ) Option data : 데이터 index : 행 이름 설정 columns : 열 이름 설정 중복된 행과 열 인덱스를 허용함 But, 인덱스는 고유값(유니크 값)을 가지는 것이 좋음 기본적인 DataFrame의 index, columns옵션에 MultiIndex 객체를 넣게 되면 MultiIn..
Series 생성 :: pd.Series( ) Reference Reference Pandas In Action import pandas as pd pd.Series( data = None, # 리스트(List) idnex = None, dtype = None ) Option data : 입력 데이터 집합(Set) Error가 → 리스트(List) 집합에서는 리스트와 같은 순서 개념이나 딕셔너리와 같은 연관 개념이 없음 → 판다스는 집합의 값을 저장하는 순서를 가정할 수 없음 index : 인덱스 레이블 할당 파이썬의 딕셔너리와 다르게 Series의 인덱스는 중복을 허용 (But, Index는 고유한 값이기 때문에 중복을 피하는 것이 좋음) dtype : 입력 데이터 형태 설정 import pandas ..