본문 바로가기
728x90

분류 전체보기279

[Python] Pandas 다루기 - 인구 데이터 import pandas as pd # 데이터 불러오기 population_number = pd.read_csv('population_number.csv', index_col = '도시', encoding = 'euc-kr') # euc-kr은 한글을 읽도록 설정하는것 population_number # 데이터프레임 인덱싱 # 1) loc 사용 : 인덱스명, 컬럼명 사용 print(population_number.loc['서울', '2015']) # 2) iloc 사용 : 인덱스 넘버 사용 print(population_number.iloc[0,1]) type(population_number.iloc[0,1]) # 데이터 프레임 슬라이싱 # 1) loc 사용 : a 2021. 4. 26.
[Python] Pandas - Pandas 파이썬에서 사용하는 엑셀 대용량 데이터를 빠른 속도로 처리 Series와 DataFrame 요소 import pandas as pd - Series 1차원 배열, 인덱스(index) + 값(value) # Series 생성(2015년) population = pd.Series([9904312, 3448737, 2890451, 2466052], index = ['서울', '부산', '인천', '대구']) # Series에 이름 지정 population.name = '인구' population.index.name = '도시' population # Series 이름 확인 print(population.name) print('') # Series 값 확인 print(population.valu.. 2021. 4. 26.
[Python] Numpy - Numpy 빠르고 효율적인 벡터 산술연산을 제공하는 다차원배열(array) 제공 반복문 없이 전체 데이터 배열 연산이 가능한 표준 수학 함수 선형대수, 난수 생성, 푸리에 변환 # 모듈 사용하기 import numpy as np # numpy 모듈을 import하고 앞으로 np라는 이름으로 부른다 - 배열 생성 # 1) 1차원 list = [1, 2, 3, 4, 5] arr = np.array(list) print(arr) arr = np.array([1, 2, 3, 4, 5]) print(arr) print('') # 2) 2차원 arr2 = np.array([[1, 2, 3], [4, 5, 6]]) print(arr2) z1 = np.zeros([4]) # 0 으로 채운 배열 만들기 o2 = np.. 2021. 4. 26.
[Python] 모듈, 패키지, 예외처리, 내장함수 - 모듈(라이브러리) 파이썬 함수 혹은 변수 또는 클래스의 코드를 모아놓은 파일 확장자 : .py - 분석에 특화된 라이브러리 Numpy : 고성능 과학계산을 위한 데이터 분석 라이브러리 Pandas : 행과 열로 구성된 표 형식의 데이터를 지원하는 라이브러리 Matplotlib : 기본적인 시각화가 가능한 라이브러리 Seaborn : 다양한 기능으로 시각화가 가능한 라이브러리 - 모듈 만들기 모듈에 넣고 싶은 변수, 함수, 클래스 등을 코딩하고 .py로 저장 - 모듈 불러오기 모듈을 저장한 디렉토리로 이동 !dir : 현재 있는 디렉토리에 있는 파일 목록 반환(모듈이 있는 디렉토리인지 확인가능) import 모듈이름 모듈.변수이름 : 모듈에 있는 변수 출력 모듈.함수(클래스)이름() : 모듈에 있는 함.. 2021. 4. 26.
728x90