-
[python][ubuntu]'데이터 분석을 위한 Python, 3E' _ 1데이터 분석 2022. 4. 6. 00:30
출처 :
책에서 말하는 필수 라이브러리로 아래 목록이 있다.
모두 한 번씩은 실행해본 경험이 있는 라이브러리들이다.
특히 numpy, pandas, matplotlib은 모든 수업에 도입에서 다루는 부분이고 ipython은 코랩을 자주 이용하는 덕분에 친숙하다.
scikit-learn 경우는 model_selection의 train_test_split을 inport 할 때가 많아 기억에 남는다.
- numpy # 수치 데이터를 과학 응용 프로그램에 사용할 수 있도록 데이터 구조, 수학 연산, 데이터 리더 등
- pandas # 데이터 사용에 도움을 주는 데이터 구조와 기능
- matplotlib # 데이터 시각화
- ipyton # 대화형 인터프리터
- scipy # 수학, 과학 툴
- scikit-learn # 기계 학습 도구
- statsmodels # 통계 분석 모델
- tensorflow # 기계 학습 도구
- pytoch # 기계 학습 도구
miniconda 설치(ubuntu)
# 아래 사이트에서 원하는 버전의 파이썬 아래에 있는 Miniconda3 Linux 64-bit 파일을 받는다.
-> https://docs.conda.io/en/latest/miniconda.html
# terminal에서 아래 코드 실행
cd ~/Downloads bash Miniconda3-(version)-Linuix-x86_64.sh
Enter키를 누르고 지시에 따라 yes를 두 번 입력하면 설치가 완료된다.
terminal에 conda를 썻을 때 정상적으로 실행이 안 되는 경우
# terminal에서 아래 코드 실행
$ nano ~/.bashrc
# 파일 제일 하단에 아래 코드 입력
export PATH=/home/(username)/miniconda3/bin:$PATH
ctrl + 'X'를 눌러 종료한다.
# 환경변수가 반영되도록 아래 코드 실행
$ source ~/.bashrc
필수 패키지 설치 1
# 아래코드 실행
(base) $ conda config --add channels conda-forge (base) $ conda config --set channel_priority strict
가상 환경 생성
# 원활한 실습 진행을 위해 python 3.8 버전의 가상 환경 생성
(base) $ conda create -n (원하는 이름) python=3.8
가상 환경 활성화
(base) $ conda activate (원하는 이름) (원하는 이름) $
필수 패키지 설치 2
(원하는 이름) $ conda install -y pandas jupyter matplotlib
+ 패키지 업데이트가 필요할 경우
conda update package_name
or
pip install --upgrade package_name
주의: 패키지 업데이트 시 conda를 우선해서 사용하고 conda로 패키지 업데이트가 실행되지 않을 때 pip를 이용해 업데이트해야 한다. 그렇지 않으면 환경에 문제가 발생할 수 있다.
Python 언어 기초, IPython 및 Jupyer 노트북
IPython 실행
$ ipython In [1]: # 이와 같은 Input 셀이 특징
Jupyter 실행
$ jupyter notebook
+ 'tab' 키를 이용하면 지금 작성하고 있는 것을 전에 실행시켜둔 변수 중 닮은 변수로 자동완성 시켜준다.
명령어
# 변수, 함수에 대한 설명(정의되어있는 경우)
a = [1, 2, 3] a?
실행결과: Type: list String form: [1, 2, 3] Length: 3 Docstring: Built-in mutable sequence. If no argument is given, the constructor creates a new empty list. The argument must be an iterable if specified.
# 파일명.py 실행
%run 파일명.py
# 파일명.py의 코드를 코드 셀로 가져옴
%load 파일명.py
# 복사한 것들을 붙여 넣음
%paste
# 복사한 것들을 원하는 부분까지 붙여 넣음
%cpaste # 종료는 '=='를 입력하거나 ctrl + 'D'
# 코드 실행 시간 확인
%timeit
# 디버그 포인트를 설정하거나 전에 실행한 코드에 대해 디버그 실행
%debug
'데이터 분석' 카테고리의 다른 글
[Python] Study on non-linear-regression (0) 2022.04.13 [Python] 혼공 머신러닝 + 딥러닝 데이터 표준화의 중요성 (0) 2022.04.11 [Python] 혼공 머신러닝 + 딥러닝 샘플링 편향 (0) 2022.04.11