본문 바로가기
728x90

파이썬170

[Python] 정규 분포, 확률 분포, 사분위 수 - 과거의 인공지능, 머신러닝 기반 시스템은 주로 확률과 관련 있었음 -통계학(Statistics) : 수치 데이터의 수집, 분석, 해석, 표현 등을 다루는 수학의 한 분야 통계학 기술 통계학 추론 통계학 연속형 데이터 범주형 데이터 단서 > 가설 설립/검정 > 문제 해결 일부 연령층, 일부 지역 주민, 혹은 무작위 선정 통해 표본 선정 > 통계분석 실시 > 모집합(전 국민)에 대한 결과 유추 - 가설 검정 - 수치로 되어있는 특징들 계산 - 각 데이터 간의 상관관계 분석 키/나이/가격 데이터 바탕으로 평균/표준편자와 같은 형식으로 요약 이름/종족/성별 데이터 바탕으로 빈도/백분율과 같은 자료 형식으로 요약 - 통계 모델링 : 데이터에 통계학을 적용하여 변수의 유의성을 분석함으로써 방대한 양의 데이터에 .. 2021. 5. 10.
[Python] JSON, open API 다루기 - JSON(JavasSript Object Notation) 자바스크립트 프로그래밍 언어 부분에 기반 데이터를 효율적으로 저장하고 교환하는 데 사용하는 텍스트 데이터 사람이 읽고 쓰기에 쉬우며 컴퓨터가 파싱하고 생성하기도 쉬움 이름&값의 집합, 정렬된 값의 리스트의 구조로 이루어짐 파이썬의 리스트와 튜플이 JSON으로 변환하게 되면 array로 바뀜 (JSON의 array는 파이썬의 리스트로 변환하게 됨) 파이썬에서 JSON을 다루려면 내장 모듈 JSON이 필요함 (import json) import json # JSON형식의 데이터를 열어 파이썬 객체로 읽기 with open('파일명.json') as json_file : json_data = json.load(json_file) json_data .. 2021. 4. 28.
[Python] Matplotlib - Matplotilb 기본적인 시각화가 가능한 라이브러리 import matplotlib.pyplot as plt - plot() : 라인을 그릴 때 사용 data = [1, 2, 3, 4, 5, 4, 3, 2, 1] plt.plot(data) plt.show() - 라인 스타일 변경하기 : ls (line style), lw(line width) line style '-' : 실선 '--' : 점선 '-.' : 선과 점의 반복 ':' : 촘촘한 점선 x = [0, 1, 2, 3, 4] y = [1, 2, 3, 4, 5] plt.plot(x, y, ls = '-.', lw = '3') plt.show() - 그래프 크기 조정 plt.figure(figsize = (3, 4)) # 사이즈는 인치 기준 p.. 2021. 4. 26.
[Python] Pandas 다루기 - 범죄 현황 데이터 - 2015-2017 광주광역시 범죄현황 데이터를 이용해 전년 대비 지역별 증감률을 구해보자 증감률 : (금년 - 작년) / 작년 * 100 import pandas as pd # 데이터 불러오기 crime_2015 = pd.read_csv('2015.csv', index_col = '관서명', encoding = 'euc-kr') crime_2016 = pd.read_csv('2016.csv', index_col = '관서명', encoding = 'euc-kr') crime_2017 = pd.read_csv('2017.csv', index_col = '관서명', encoding = 'euc-kr') # 데이터 살펴보기 # 1) 상위 데이터 출력 print(crime_2015.head()) print(.. 2021. 4. 26.
728x90