본문 바로가기
728x90

PROGRAMMING77

[R] 데이터 전처리 - dplyr : 데이터 전처리에 가장 많이 사용되는 패키지 install.packages('dplyr') library(dplyr) # 데이터 가져오기 exam %) : Ctrl + Shift + m 왼쪽에서 오른쪽, 위에서 아래로 읽음 여러 개의 함수를 작업 순서에 따라 연속하여 호출 가능 - filter() : 행 추출 # 1반 데이터만 출력하기 exam %>% filter(class==1) - select() : 열 추출 # id, class, math만 출력하기 exam %>% select(id, class, math) - arrange() : 정렬 # math 기준 오름차순 exam %>% arrange(math) # englist 기준 내림차순 exam %>% arrange(desc(engl.. 2021. 7. 19.
[R] Text Mining과 WordCloud 실습 - 사용할 패키지 불러오기 library(KoNLP) library(wordcloud) library(RColorBrewer) - 팔레트, 사전 설정하고 text파일 가져오기 # 팔레트 설정 pal 2021. 7. 19.
[R] Text Mining과 WordCloud - Text Minig 비정형 텍스트를 기반으로 의미있는 명사를 추출하는 기술 단어분류 또는 문법적 구조분석 등의 자연언어(Natural Language Processing)기술 기반 워드클라우드는 문서의 단어들을 분류하여 그 빈도를 한 눈에 보기 쉽게 함 - 사용 패키지 wordcloud : 워드클라우드 출력기능 RColorBrewer : 보기좋은 다양한 유형의 색들에 대한 팔레트 제공 KoNLP : 한글 처리 - wordcloud install.packages('wordcloud') library(wordcloud) word extractNoun(sentence) [1] "여름" "여름" "가을" "겨울" - 한글사전의 종류 sejongDic : R 형태소 분석 시 많이 사용하던 형태소사전 NIADi.. 2021. 7. 17.
[R] csv파일 불러오고 살펴보기 - 외부 데이터 불러오기 # 루트 변경 (\는 인식하지 못하므로 /로 변경해서 사용) > setwd('C:/Users/user/Desktop/R/210717') # 현재 경로의 파일 리스트 출력 > list.files() [1] "01_Vector.R" "02_Data Frame.R" [3] "1-4호선승하차승객수.csv" "210717.Rproj" [5] "csv_exam.csv" # 외부 데이터 가져오기 > exam exam id class math english science 1 1 1 50 98 50 2 2 1 60 97 60 3 3 1 45 86 78 4 4 1 30 98 58 5 5 2 25 80 65 6 6 2 50 89 98 7 7 2 80 90 45 8 8 2 90 78 25 9 9 3 .. 2021. 7. 17.
728x90