데이터 분석/빅데이터 프로젝트
-
[Python][캐글]Reducing Commercial Aviation Fatalities Data EDA 1데이터 분석/빅데이터 프로젝트 2022. 4. 3. 23:47
________________________________________________________________________ lightgbm(Light Gradient Boosting Machine): 기계 학습을 위한 무료 오픈 소스 분산 경사 하강법(Gradient Boostiong) 프레임 워크 tqdm 실행 시간이 긴 코드에 대한 진행상황을 확인 가능하도록 하는 라이브러리 dask 병렬컴퓨팅을 위한 라이브러리 __________________________________________________________________________________________ about this Data 이 데이터 세트에서 다양한 상황을 겪은 18명의 조종사로부터 실제 생리학적 데이터를 포함하고 있..
-
Clustering(군집화)데이터 분석/빅데이터 프로젝트 2022. 3. 30. 23:50
비지도 학습 목표값을 전달하지 않고 다른 데이터를 기반으로 목표값은 예측하는 모델을 학습 비지도 학습은 군집화, 차원축소, 시각화 있다. 군집화 주어진 데이터들을 비슷한 것끼리 나누어 그룹을 만드는 것, 비지도학습 방법이다. 예시: 종류 1. Linkage Basd(계측적 군집화) ex) Hierarchical Clustering 2. Density Based(밀도적 군집화) ex) DBSCAN(Density-Based Spatial Clustering Of Applications With Noise) 3. By Partitioning ex) k-means +No clustering method works universally well - 언제든지 잘 작동하는 군집화 방법은 없다. 데이터의 분포 방식에 ..