본문 바로가기
728x90

PROGRAMMING/R8

[R] t검정, 분산분석, 카이제곱 검정 - 일표본 t검정 data 2021. 7. 19.
[R] 데이터 전처리 실습 # 패키지 로딩 library(dplyr) library(hflights) # 11월 6일 데이터만 출력 hflights %>% filter(Month==11 & DayofMonth==6) # 11월 6일 데이터에 대해 출발시간 기준 오름차순 정렬 후, # 월, 일, 출발시간, 출발지, 도착지만 출력 hflights %>% filter(Month==11, DayofMonth==6) %>% arrange(DepTime) %>% select(Month, DayofMonth, DepTime, Origin, Dest) # 결항사유별 데이터 개수 출력 hflights %>% group_by(CancellationCode) %>% summarise(n()) # 또는 table(hflights$Cancellation.. 2021. 7. 19.
[R] 데이터 전처리 - dplyr : 데이터 전처리에 가장 많이 사용되는 패키지 install.packages('dplyr') library(dplyr) # 데이터 가져오기 exam %) : Ctrl + Shift + m 왼쪽에서 오른쪽, 위에서 아래로 읽음 여러 개의 함수를 작업 순서에 따라 연속하여 호출 가능 - filter() : 행 추출 # 1반 데이터만 출력하기 exam %>% filter(class==1) - select() : 열 추출 # id, class, math만 출력하기 exam %>% select(id, class, math) - arrange() : 정렬 # math 기준 오름차순 exam %>% arrange(math) # englist 기준 내림차순 exam %>% arrange(desc(engl.. 2021. 7. 19.
[R] Text Mining과 WordCloud 실습 - 사용할 패키지 불러오기 library(KoNLP) library(wordcloud) library(RColorBrewer) - 팔레트, 사전 설정하고 text파일 가져오기 # 팔레트 설정 pal 2021. 7. 19.
728x90