전체 글
-
[Python][캐글]Reducing Commercial Aviation Fatalities Data EDA 1데이터 분석/빅데이터 프로젝트 2022. 4. 3. 23:47
________________________________________________________________________ lightgbm(Light Gradient Boosting Machine): 기계 학습을 위한 무료 오픈 소스 분산 경사 하강법(Gradient Boostiong) 프레임 워크 tqdm 실행 시간이 긴 코드에 대한 진행상황을 확인 가능하도록 하는 라이브러리 dask 병렬컴퓨팅을 위한 라이브러리 __________________________________________________________________________________________ about this Data 이 데이터 세트에서 다양한 상황을 겪은 18명의 조종사로부터 실제 생리학적 데이터를 포함하고 있..
-
[R] readr 패키지데이터 분석/텍스트 분석 2022. 4. 1. 06:27
언어 R에서 readr 패키지에 대해 알아보았다. 설치 setwd("C:/Users/사용자/") install.packages('readr') # 'readr' 패키지 설치 library(readr) # 'readr' 패키지 실행 'tidyverse' 패키지를 설치할 경우 'readr' 패키지를 포함한 여러 패키지를 함께 설치할 수 있다. 파일 읽기 write_file("A|B|C\n1|2|3\n4|5|NA", file = "file.txt") read_del
-
Clustering(군집화)데이터 분석/빅데이터 프로젝트 2022. 3. 30. 23:50
비지도 학습 목표값을 전달하지 않고 다른 데이터를 기반으로 목표값은 예측하는 모델을 학습 비지도 학습은 군집화, 차원축소, 시각화 있다. 군집화 주어진 데이터들을 비슷한 것끼리 나누어 그룹을 만드는 것, 비지도학습 방법이다. 예시: 종류 1. Linkage Basd(계측적 군집화) ex) Hierarchical Clustering 2. Density Based(밀도적 군집화) ex) DBSCAN(Density-Based Spatial Clustering Of Applications With Noise) 3. By Partitioning ex) k-means +No clustering method works universally well - 언제든지 잘 작동하는 군집화 방법은 없다. 데이터의 분포 방식에 ..