머신러닝
-
[Knime]프로젝트_4 로지스틱 회귀 모델 생성데이터 분석/빅데이터 프로젝트 2022. 5. 3. 23:25
더보기 3편 : https://ford.tistory.com/25 로지스틱 회귀 지난번 의사결정나무를 이용하여 모델을 학습시켜보았고, 이번에는 로지스틱 회귀 모델을 학습시켜보았다. 다중공선성 제거 로지스틱 회귀 분석의 조건 중 하나인 독립 변수은 모두 독립적인 데이터여야 한다는 점을 충족시키기 위해 다중공선성을 제거해야 한다. Knime 로지스틱 회귀 모델 학습 노드는 Regularization 옵션 조작을 통해서 정규화를 적용하여 다중공선성을 제거할 수 있고, 다른 방법으로는 VIF 노드를 이용하여 제거하는 방법이 있다. 나의 경우 VIF 노드를 이용해 다중공선성을 제거하였고, 이 과정에서 제거된 변수는 eeg_p3, eeg_p4, r이었다. 로지스틱 회귀 모델 학습 및 평가 위의 노드를 활용하여 모델..
-
[Knime]프로젝트_3 의사결정나무 모델 생성데이터 분석/빅데이터 프로젝트 2022. 5. 2. 23:51
더보기 2편 : https://ford.tistory.com/24 의사결정나무 각 변수들이 모델 생성에 끼치는 영향을 대략적으로 살피기 위해 의사결정나무 진행 crew 변수가 제한적인 환경, 예를 들어 고정된 항공기 조종사 구성원에게서 예측을 하기 위해서는 긍정적인 예측 요소가 될 수 있다고 생각했다. 그래서 crew 변수를 포함한 모델과 포함하지 않은 모델 두 개 모두 진행해보았다. 결과적으로 모델의 성능 차이는 크지 않았다. 뇌파가 주된 영향력을 끼치리라는 나의 예상과는 다르게 조종사의 상태 분류에 주된 영향력을 미치는 변수들은 gsr, ecg r, time 변수였다. eeg 변수들의 영향력에 대해 좀 더 알아보고자 eeg 변수만을 남기고 의사결정나무를 진행해보았다. eeg변수만이 사용된 의사결정나무..
-
[이론][머신러닝] 기계학습을 위한 거리데이터 분석/빅데이터 프로젝트 2022. 4. 18. 23:21
출처 : https://machinelearningmastery.com/distance-measures-for-machine-learning/ 참조 : 더보기 https://ko.wikipedia.org/wiki/%ED%95%B4%EB%B0%8D_%EA%B1%B0%EB%A6%AC https://untitledtblog.tistory.com/50 https://wiko.wiki/wiki/Chebyshev_metric 거리 측정의 역할 기계학습에서 거리 측정은 단일 데이터들 사이의 차이를 요약하는 객관적인 지표이다. 그것을 잘 보여주는 예시는 k-최근접 이웃 알고리즘이다. k-최근접 이웃 알고리즘은 각 데이터와 가장 가까운 k개의 데이터와 그 사이의 거리를 수집하고, 그것을 분류의 척도로 사용하여 군집을 나..
-
[Python] 혼공 머신러닝 + 딥러닝 데이터 표준화의 중요성데이터 분석 2022. 4. 11. 22:33
출처 : 혼자 공부하는 머신러닝 + 딥러닝 데이터 전처리_2 fish_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33.5, 33.5, 34.0, 34.0, 34.5, 35.0, 35.0, 35.0, 35.0, 36.0, 36.0, 37.0, 38.5, 38.5, 39.5, 41.0, 41.0, 9.8, 10.5, 10.6, 11.0, 11.2, 11.3, 11.8, 11.8, 12.0, 12.2, 12.4, 13.0, 14.3, 15.0] fish_weight = [242.0, 290.0, 340.0, 363.0, 430.0, 450.0,..
-
[Python] 혼공 머신러닝 + 딥러닝 샘플링 편향데이터 분석 2022. 4. 11. 22:28
출처 : 혼자 공부하는 머신러닝 + 딥러닝 생선의 무게, 길이 데이터를 이용해 k-최근접 이웃 알고리즘으로 빙어와 도미를 분류합니다. import 더보기 import matplotlib.pyplot as plt import numpy as np 데이터 입력 및 데이터 구조 처리_1 # 데이터 입력 fish_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33.5, 33.5, 34.0, 34.0, 34.5, 35.0, 35.0, 35.0, 35.0, 36.0, 36.0, 37.0, 38.5, 38.5, 39.5, 41.0, 41.0, 9.8, 1..