텍스트분석
-
-
[R] Do it R 텍스트마이닝_1데이터 분석/텍스트 분석 2022. 4. 11. 16:38
출처 : Do it R 텍스트마이닝 https://6u2ni.tistory.com/46 텍스트 데이터의 전처리에 대해서 공부하였다. 개요 1. 원하는 문자를 제외하고 불필요한 문자를 제거 2. 처리한 문자열 벡터를 데이터 분석에 용이하도록 tibble 구조로 변경 3. 전처리한 데이터의 빈도를 보기 좋게 시각화 + 폰트 변경 + 파이프를 이용한 함수 연속 실행 데이터는 'Do it R 텍스트마이닝' 저자 김영우님의 github에 있는 speech_park.txt를 이용하였다. 출처 : github.com/yongwoos/Doit_textmining 사용하는 패키지 더보기 library(stringr) library(dplyr) library(tidytext) library(ggplot2) 글자 제거, 대..
-
[R] sub(), gsub(), 정규 표현식데이터 분석/텍스트 분석 2022. 4. 8. 23:10
출처 : do it! 쉽게 배우는 R 텍스트마이닝 sub(), gsub() sub(), gsub() 함수는 지정한 패턴과 같은 부분을 제시한 문자로 대체할 때 사용된다. sub() 함수는 'pattern' 파라미터 입력값과 같은 부분 중 문장 가장 앞에 위치하고 있는 부분만 'replacement' 파라미터에 입력한 문자열로 대체된다. gsub() 함수는 'pattern' 파라미터 입력값과 같은 부분 전체가 'replacement' 파라미터에 입력한 문자열로 대체된다. 예제) xt