ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [Knime] 프로젝트_1 데이터 개요
    데이터 분석/빅데이터 프로젝트 2022. 4. 28. 06:52

    출처 : https://www.kaggle.com/competitions/reducing-commercial-aviation-fatalities

     

    Reducing Commercial Aviation Fatalities(상업용 항공기 사망자 감소)를 위한 데이터 활용을 목표로 진행해보았다.

     

    데이터 설명 :

     

    이 데이터 세트에서 다양한 상황을 겪은 18명의 조종사로부터 실제 생리학적 데이터이. 훈련 세트는 비행 시뮬레이터 외부의 비행 환경에서 수집된 제어 실험 세트로 구성되고, 테스트 세트(LOFT = Line Oriented Flight Training)는 비행 시뮬레이터의 전체 비행(이륙, 비행 및 착륙)으로 구성된다.

     

    변수 설명:

      id - 승무원 + 시간 조합에 대한 고유 식별자입니다.(test.csv sample_submission.csv만 해당)

      crew - 한 쌍의 조종사를 위한 고유 ID입니다데이터에는 9의 승무원이 있습니다.
      Experiment - 주어진 시간의 대상자 상황
      time - 실험 시작 후 시간(
      seat - 왼쪽(0) 또는 오른쪽(1) 좌석의 조종사입니다.
      ‘eeg접두사로 있는 변수 - 뇌파 기록 변수(20)
     
      r - 호흡 가슴의 오르내림 정도
      gsr - 피부 전기 활동의 척도인 Galvanic Skin Response(피부전도도). 
      ecg - 3점 심전도 신호
      event - 주어진 시간에 조종사 상태

    사용자에게 유도되거나 발생되는 감정 유형

      1. Channelized Attention(CA)는 대략적으로 말하면 다른 모든 작업을 배제하고 한 작업에 집중하는 상태. 이것은 피험자들이 매력적인 퍼즐 기반 비디오 게임을 하게 함으로써 유도됨.
      2. Diverted Attention(DA)은 결정과 관련된 행동이나 사고 과정에 의해 주의가 분산된 상태. 이는 피험자가 디스플레이 모니터링 작업을 수행하도록 함으로써 유도됨. 주기적으로 모니터링 작업으로 돌아가기 전에 해결해야 하는 수학 문제가 줌.
      3. Startle/Surprise(SS)ㄷ은 피험자들이 놀라 움찔할 정도로 무서운 영화를 보게 함으로써 유발됨.

    데이터 목적

     대부분의 비행 관련 사망자는 졸림, 주의 결핍 등 비행기 조종사의 주의 관리 실패로부터 야기되는데, 이 데이터를 통해 기여하려는 문제는 조종사의 생리학적 데이터로부터 인지(주의 관리) 상태를 모니터링하여 상태를 분류해내는 모델을 구축하여 비행기 조종사 주의 관리를 원활하게 하고 주의 관리 미흡으로 인한 비행 관련 사망자 발생을 줄이는 것이다.

     

    데이터 축소

    train_input, test_input, train_target, test_target = train_test_split(df,df_target,test_size=0.1, shuffle=True, stratify = df_target)
    test_input.to_csv('data_splited2.csv’)
    
    #위의 코드를 실행하여 전체 데이터 중 10%만 뽑아 사용.
    #자세한 코드는 깃허브(https://github.com/GBDO/data-analysis/blob/main/Study_on_Kaggle_Reducing_Commercial_Aviation_Fatalities.ipynb)에 있음

     

    댓글

Designed by Tistory.