stringr
-
-
[R] Do it R 텍스트마이닝_1데이터 분석/텍스트 분석 2022. 4. 11. 16:38
출처 : Do it R 텍스트마이닝 https://6u2ni.tistory.com/46 텍스트 데이터의 전처리에 대해서 공부하였다. 개요 1. 원하는 문자를 제외하고 불필요한 문자를 제거 2. 처리한 문자열 벡터를 데이터 분석에 용이하도록 tibble 구조로 변경 3. 전처리한 데이터의 빈도를 보기 좋게 시각화 + 폰트 변경 + 파이프를 이용한 함수 연속 실행 데이터는 'Do it R 텍스트마이닝' 저자 김영우님의 github에 있는 speech_park.txt를 이용하였다. 출처 : github.com/yongwoos/Doit_textmining 사용하는 패키지 더보기 library(stringr) library(dplyr) library(tidytext) library(ggplot2) 글자 제거, 대..