본문 바로가기
728x90

PROGRAMMING/R8

[R] Text Mining과 WordCloud - Text Minig 비정형 텍스트를 기반으로 의미있는 명사를 추출하는 기술 단어분류 또는 문법적 구조분석 등의 자연언어(Natural Language Processing)기술 기반 워드클라우드는 문서의 단어들을 분류하여 그 빈도를 한 눈에 보기 쉽게 함 - 사용 패키지 wordcloud : 워드클라우드 출력기능 RColorBrewer : 보기좋은 다양한 유형의 색들에 대한 팔레트 제공 KoNLP : 한글 처리 - wordcloud install.packages('wordcloud') library(wordcloud) word extractNoun(sentence) [1] "여름" "여름" "가을" "겨울" - 한글사전의 종류 sejongDic : R 형태소 분석 시 많이 사용하던 형태소사전 NIADi.. 2021. 7. 17.
[R] csv파일 불러오고 살펴보기 - 외부 데이터 불러오기 # 루트 변경 (\는 인식하지 못하므로 /로 변경해서 사용) > setwd('C:/Users/user/Desktop/R/210717') # 현재 경로의 파일 리스트 출력 > list.files() [1] "01_Vector.R" "02_Data Frame.R" [3] "1-4호선승하차승객수.csv" "210717.Rproj" [5] "csv_exam.csv" # 외부 데이터 가져오기 > exam exam id class math english science 1 1 1 50 98 50 2 2 1 60 97 60 3 3 1 45 86 78 4 4 1 30 98 58 5 5 2 25 80 65 6 6 2 50 89 98 7 7 2 80 90 45 8 8 2 90 78 25 9 9 3 .. 2021. 7. 17.
[R] 데이터 프레임 (Data Frame) - R의 데이터 구조 - 데이터 프레임 다양한 데이터 타입을 저장할 수 있는 자료형태 일반 DBMS에서의 Table과 같은 자료구조 대부분의 데이터들은 데이터 프레임에 저장됨 열(column) : 속성을 나타냄 행(row) : 하나의 데이터 - 벡터로부터 데이터 프레임 생성 # 각각의 column이 될 벡터 생성 > no name price qty # 데이터 프레임 생성 > sales sales No Name Price Qty 1 1 Apple 500 5 2 2 Peach 200 2 3 3 Banana 100 4 4 4 Grape 50 7 - 데이터 프레임에서 원하는 데이터만 조회 # 열 이름으로 출력하기 > sales$Name [1] Apple Peach Banana Grape Levels: Apple.. 2021. 7. 17.
[R] 벡터 (Vector) - 벡터 R에서 가장 기본이 되는 데이터 구조 동일한 유형의 데이터가 1차원으로 구성 벡터 중에서 구성인자가 1개인 것을 '스칼라'라고 함 V1 c c [1] 1 5 9 # length.out : 수열의 길이 > d d [1] 1 4 7 10 rep() : 반복적인 벡터 생성 # times : 반복 횟수 > a a [1] 1 1 1 > b c c [1] 1 2 3 1 2 3 # each : 각각 반복 횟수 > d d [1] 1 1 2 2 3 3 - 벡터 원소 추출하기 > x x [1] 1 4 7 10 13 16 19 # 단일 원소 추출 > x[1] [1] 1 # 여러 개의 원소 추출 > x[c(1, 3, 5)] [1] 1 7 13 # 특정 원소 제외하고 추출 > x[-c(2, 4)] [1] 1 7 13 .. 2021. 7. 17.
728x90