데이터 분석/텍스트 분석
-
[R] KoNLP 패키지 설치데이터 분석/텍스트 분석 2022. 5. 8. 14:02
더보기 출처 : https://www.youtube.com/watch?v=Ewy8mEUriJg R 설치 RStudio 설치 KoNLP 설치 install.packages('multilinguer') library(multilinguer) install_jdk() install.packages(c("hash", "tau", "Sejong", "RSQLite", "devtools", "bit", "rex", "lazyeval", "htmlwidgets", "crosstalk", "promises", "later", "sessioninfo", "xopen", "bit64", "blob", "DBI", "memoise", "plogr", "covr", "DT", "rcmdcheck", "rversions"), ..
-
-
-
[R] Do it R 텍스트마이닝_1데이터 분석/텍스트 분석 2022. 4. 11. 16:38
출처 : Do it R 텍스트마이닝 https://6u2ni.tistory.com/46 텍스트 데이터의 전처리에 대해서 공부하였다. 개요 1. 원하는 문자를 제외하고 불필요한 문자를 제거 2. 처리한 문자열 벡터를 데이터 분석에 용이하도록 tibble 구조로 변경 3. 전처리한 데이터의 빈도를 보기 좋게 시각화 + 폰트 변경 + 파이프를 이용한 함수 연속 실행 데이터는 'Do it R 텍스트마이닝' 저자 김영우님의 github에 있는 speech_park.txt를 이용하였다. 출처 : github.com/yongwoos/Doit_textmining 사용하는 패키지 더보기 library(stringr) library(dplyr) library(tidytext) library(ggplot2) 글자 제거, 대..
-
[R] sub(), gsub(), 정규 표현식데이터 분석/텍스트 분석 2022. 4. 8. 23:10
출처 : do it! 쉽게 배우는 R 텍스트마이닝 sub(), gsub() sub(), gsub() 함수는 지정한 패턴과 같은 부분을 제시한 문자로 대체할 때 사용된다. sub() 함수는 'pattern' 파라미터 입력값과 같은 부분 중 문장 가장 앞에 위치하고 있는 부분만 'replacement' 파라미터에 입력한 문자열로 대체된다. gsub() 함수는 'pattern' 파라미터 입력값과 같은 부분 전체가 'replacement' 파라미터에 입력한 문자열로 대체된다. 예제) xt
-
[R] readr 패키지데이터 분석/텍스트 분석 2022. 4. 1. 06:27
언어 R에서 readr 패키지에 대해 알아보았다. 설치 setwd("C:/Users/사용자/") install.packages('readr') # 'readr' 패키지 설치 library(readr) # 'readr' 패키지 실행 'tidyverse' 패키지를 설치할 경우 'readr' 패키지를 포함한 여러 패키지를 함께 설치할 수 있다. 파일 읽기 write_file("A|B|C\n1|2|3\n4|5|NA", file = "file.txt") read_del