Kaggle
-
[머신러닝][Kaggle][Python] 개인 건강 데이터를 이용한 심부전 예측 모델2머신러닝 | 딥러닝 2022. 5. 22. 21:46
더보기 [머신러닝][Kaggle][Python] 개인 건강 데이터를 이용한 심부전 예측 모델1 : https://ford.tistory.com/33 출처 : https://www.kaggle.com/datasets/andrewmvd/heart-failure-clinical-data Heart Failure Prediction 12 clinical features por predicting death events. www.kaggle.com Boxplot 계열의 그래프를 이용하여 범주별 통계 확인 Boxplot 계열의 그래프는 각 범주별로 표시된 4분위 수와 이상치를 통해서 범주 사이의 차이를 확인할 수 있고, 이를 통해 범주(독립 변수)와 종속 변수 사이 상관관계에 대한 가설 생성을 돕는다. 사망 - 박..
-
[머신러닝][Kaggle][Python] 개인 건강 데이터를 이용한 심부전 예측 모델1머신러닝 | 딥러닝 2022. 5. 22. 21:10
출처 : https://www.kaggle.com/datasets/andrewmvd/heart-failure-clinical-data Heart Failure Prediction 12 clinical features por predicting death events. www.kaggle.com 데이터 소개 Kaggle의 Heart Failure Prediction Dataset 이용 Dataset 구성 age: 환자의 나이 anaemia: 환자의 빈혈증 여부 (0: 정상, 1: 빈혈) creatinine_phosphokinase: 크레아틴키나제 검사 결과 diabetes: 당뇨병 여부 (0: 정상, 1: 당뇨) ejection_fraction: 박출계수 (%) high_blood_pressure: 고혈압..
-
[Knime]프로젝트_2 EDA데이터 분석/빅데이터 프로젝트 2022. 4. 29. 06:12
더보기 1편 : https://ford.tistory.com/23 EDA Duplicate Row Filter node를 이용하여 중복 행 확인 중복행 없음 Data Explorer node를 통해서 데이터 자료형 확인 자료 차원: 28개, 자료 행 수: 4867421개 축소한 행의 수: 486743개 데이터의 자료형은 Experiment, event 열은 string이고 seat 열은 integer 나머지 열은 모두 double이다. Box plot을 이용하여 이상치 확인 데이터의 분포의 경우 eeg(뇌파 데이터)의 경우 중간에 해당되는 범위에 많은 수의 행이 포함되어 있다. Box plot을 이용해서 뇌파 데이터를 살펴본 결과 중간 범위에 다른 범위에 해당하는 데이터보다 많은 데이터가 집중되어있어서 ..
-
[Knime] 프로젝트_1 데이터 개요데이터 분석/빅데이터 프로젝트 2022. 4. 28. 06:52
출처 : https://www.kaggle.com/competitions/reducing-commercial-aviation-fatalities Reducing Commercial Aviation Fatalities(상업용 항공기 사망자 감소)를 위한 데이터 활용을 목표로 진행해보았다. 데이터 설명 : 이 데이터 세트에서 다양한 상황을 겪은 18명의 조종사로부터 실제 생리학적 데이터이다. 훈련 세트는 비행 시뮬레이터 외부의 비행 환경에서 수집된 제어 실험 세트로 구성되고, 테스트 세트(LOFT = Line Oriented Flight Training)는 비행 시뮬레이터의 전체 비행(이륙, 비행 및 착륙)으로 구성된다. 변수 설명: id - 승무원 + 시간 조합에 대한 고유 식별자입니다.(test.csv ..
-
[Python][캐글]Reducing Commercial Aviation Fatalities Data EDA 1데이터 분석/빅데이터 프로젝트 2022. 4. 3. 23:47
________________________________________________________________________ lightgbm(Light Gradient Boosting Machine): 기계 학습을 위한 무료 오픈 소스 분산 경사 하강법(Gradient Boostiong) 프레임 워크 tqdm 실행 시간이 긴 코드에 대한 진행상황을 확인 가능하도록 하는 라이브러리 dask 병렬컴퓨팅을 위한 라이브러리 __________________________________________________________________________________________ about this Data 이 데이터 세트에서 다양한 상황을 겪은 18명의 조종사로부터 실제 생리학적 데이터를 포함하고 있..