데이터분석
-
[Knime]프로젝트_3 의사결정나무 모델 생성데이터 분석/빅데이터 프로젝트 2022. 5. 2. 23:51
더보기 2편 : https://ford.tistory.com/24 의사결정나무 각 변수들이 모델 생성에 끼치는 영향을 대략적으로 살피기 위해 의사결정나무 진행 crew 변수가 제한적인 환경, 예를 들어 고정된 항공기 조종사 구성원에게서 예측을 하기 위해서는 긍정적인 예측 요소가 될 수 있다고 생각했다. 그래서 crew 변수를 포함한 모델과 포함하지 않은 모델 두 개 모두 진행해보았다. 결과적으로 모델의 성능 차이는 크지 않았다. 뇌파가 주된 영향력을 끼치리라는 나의 예상과는 다르게 조종사의 상태 분류에 주된 영향력을 미치는 변수들은 gsr, ecg r, time 변수였다. eeg 변수들의 영향력에 대해 좀 더 알아보고자 eeg 변수만을 남기고 의사결정나무를 진행해보았다. eeg변수만이 사용된 의사결정나무..
-
Clustering(군집화)데이터 분석/빅데이터 프로젝트 2022. 3. 30. 23:50
비지도 학습 목표값을 전달하지 않고 다른 데이터를 기반으로 목표값은 예측하는 모델을 학습 비지도 학습은 군집화, 차원축소, 시각화 있다. 군집화 주어진 데이터들을 비슷한 것끼리 나누어 그룹을 만드는 것, 비지도학습 방법이다. 예시: 종류 1. Linkage Basd(계측적 군집화) ex) Hierarchical Clustering 2. Density Based(밀도적 군집화) ex) DBSCAN(Density-Based Spatial Clustering Of Applications With Noise) 3. By Partitioning ex) k-means +No clustering method works universally well - 언제든지 잘 작동하는 군집화 방법은 없다. 데이터의 분포 방식에 ..