본문 바로가기
PROGRAMMING/R

[R] 데이터 전처리 실습

by 안녕나는현서 2021. 7. 19.
728x90
# 패키지 로딩
library(dplyr)
library(hflights)

# 11월 6일 데이터만 출력
hflights %>%  filter(Month==11 & DayofMonth==6)

# 11월 6일 데이터에 대해 출발시간 기준 오름차순 정렬 후,
# 월, 일, 출발시간, 출발지, 도착지만 출력
hflights %>% 
  filter(Month==11, DayofMonth==6) %>% 
  arrange(DepTime) %>% 
  select(Month, DayofMonth, DepTime, Origin, Dest)

# 결항사유별 데이터 개수 출력
hflights %>% 
  group_by(CancellationCode) %>% 
  summarise(n())
# 또는
table(hflights$CancellationCode)

# 결항사유가 B이거나 C인 데이터만 출력
hflights %>% filter(CancellationCode=='B' | CancellationCode=='C')
# 또는
hflights %>% filter(CancellationCode %in% c('B', 'C'))
# %in% : 벡터 내 특정 값 포함 여부 확인

# 결항사유가 B이거나 C인 데이터 중
# 월, 일,별 건수를 출력하고, 건수 기분 내림차순 정렬
hflights %>% 
  filter(CancellationCode=='B' | CancellationCode=='C') %>% 
  group_by(Month, DayofMonth) %>% 
  summarise(n=n()) %>% 
  arrange(desc(n))

# 비행기 고유번호별 평균 비행거리 계산하여
# 평균 비행거리 기준 내림차순 정렬 후 상위 20개 데이터 출력
hflights %>% 
  group_by(TailNum) %>% 
  summarise(mean_D=mean(Distance)) %>% 
  arrange(desc(mean_D)) %>% 
  head(20)
728x90

'PROGRAMMING > R' 카테고리의 다른 글

[R] t검정, 분산분석, 카이제곱 검정  (0) 2021.07.19
[R] 데이터 전처리  (0) 2021.07.19
[R] Text Mining과 WordCloud 실습  (0) 2021.07.19
[R] Text Mining과 WordCloud  (0) 2021.07.17
[R] csv파일 불러오고 살펴보기  (0) 2021.07.17

댓글