공부방 :: 공부방

[R] Stringr 패키지

데이터 분석/텍스트 분석 2022. 4. 16. 00:02

Stringr 패키지 설치 및 실행 string

데이터 분석/텍스트 분석 2022. 4. 14. 21:04

데이터 생성 더보기 # 문자열 벡터 string

[이론]Study on Decision Tree

데이터 분석/빅데이터 프로젝트 2022. 4. 14. 18:26

출처 : https://www.kaggle.com/code/prashant111/decision-tree-classifier-tutorial 의사결정나무 알고리즘 의사결정나무 알고리즘은 가장 널리 사용되는 기계학습 알고리즘 중 하나입니다. 특정 문제를 해결하기 위해 트리와 같은 구조를 사용합니다. 분류 및 회귀 목적으로 사용할 수 있는 지도 학습 알고리즘 클래스에 속합니다. 의사결정나무 알고리즘은 루트 노드, 분기 및 리프 노드를 포함하는 구조입니다. 각 내부 노드는 특성에 대한 테스트를 나타내고, 가 분기는 테스트 결과를 나타내며, 각 리프 노드는 분류나 회귀된 클래스 레이블을 포함합니다. 트리의 최상위 노드는 루트 노드이고 분류 또는 회귀를 바라는 데이터셋 전체를 포함합니다. / 분류 및 회귀 트리(..

[Python] Study on non-linear-regression

데이터 분석 2022. 4. 13. 22:39

출처 : https://www.kaggle.com/code/ibrahimbahbah/non-linear-regression-tutorial/notebook 비선형 사용 이유 데이터가 직선을 벗어난 곡선 추세를 보이는 경우 선형 회귀는 비선형 회귀에 비해 정확한 결과를 생성하지 않습니다. 그리하여 사용하는 것이 비선형 회귀입니다. 필수 라이브러리 가져오기 import numpy as np import matplotlib.pyplot as plt %matplotlib inline 선형 회귀(Linear-Regression) 선형 함수는 Y = ax + b와 같이 표현합니다. x = np.arange(-6.0, 6.0, 0.1) # -6 ~ 6 까지 0.1 간격으로 배열 생성 y = 4*(x) + 5 # 데이..

[Github] Github 홈 화면 commit graph 그리기

기타 2022. 4. 12. 23:59

출처 : https://github.com/lowlighter/metrics/blob/master/.github/readme/partials/documentation/setup/action.md 깃허브 이름과 같은 레포지토리(이하 레포) 생성 Repository name에 본인의 깃허브 이름을 넣습니다. 저의 경우는 GBDO가 되죠, 그리고 Add a README file을 체크한 후 Create repository를 클릭하여 생성을 마칩니다. 토큰 만들기 레포지토리에 토큰 연결 워크플로우 생성 우리들은 워크플로우를 불러오는 것이 아니라 복사, 붙어 넣을 것이기 때문에 직접 설정에 해당합니다. name: Metrics on: # Schedule daily updates schedule: [{cron: "..

[Python] 혼공 머신러닝 + 딥러닝 데이터 표준화의 중요성

데이터 분석 2022. 4. 11. 22:33

출처 : 혼자 공부하는 머신러닝 + 딥러닝 데이터 전처리_2 fish_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33.5, 33.5, 34.0, 34.0, 34.5, 35.0, 35.0, 35.0, 35.0, 36.0, 36.0, 37.0, 38.5, 38.5, 39.5, 41.0, 41.0, 9.8, 10.5, 10.6, 11.0, 11.2, 11.3, 11.8, 11.8, 12.0, 12.2, 12.4, 13.0, 14.3, 15.0] fish_weight = [242.0, 290.0, 340.0, 363.0, 430.0, 450.0,..

[Python] 혼공 머신러닝 + 딥러닝 샘플링 편향

데이터 분석 2022. 4. 11. 22:28

출처 : 혼자 공부하는 머신러닝 + 딥러닝 생선의 무게, 길이 데이터를 이용해 k-최근접 이웃 알고리즘으로 빙어와 도미를 분류합니다. import 더보기 import matplotlib.pyplot as plt import numpy as np 데이터 입력 및 데이터 구조 처리_1 # 데이터 입력 fish_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33.5, 33.5, 34.0, 34.0, 34.5, 35.0, 35.0, 35.0, 35.0, 36.0, 36.0, 37.0, 38.5, 38.5, 39.5, 41.0, 41.0, 9.8, 1..

[R] Do it R 텍스트마이닝_1

데이터 분석/텍스트 분석 2022. 4. 11. 16:38

출처 : Do it R 텍스트마이닝 https://6u2ni.tistory.com/46 텍스트 데이터의 전처리에 대해서 공부하였다. 개요 1. 원하는 문자를 제외하고 불필요한 문자를 제거 2. 처리한 문자열 벡터를 데이터 분석에 용이하도록 tibble 구조로 변경 3. 전처리한 데이터의 빈도를 보기 좋게 시각화 + 폰트 변경 + 파이프를 이용한 함수 연속 실행 데이터는 'Do it R 텍스트마이닝' 저자 김영우님의 github에 있는 speech_park.txt를 이용하였다. 출처 : github.com/yongwoos/Doit_textmining 사용하는 패키지 더보기 library(stringr) library(dplyr) library(tidytext) library(ggplot2) 글자 제거, 대..

ABOUT ME

공부방 공부방

티스토리툴바

ABOUT ME

전체 글

티스토리툴바