파이썬 데이터 분석 라이브러리
1판다
Pandas 는 파이썬에서 가장 많이 사용되는데이터 분석 라이브러리
대용량 데이터를 쉽게 처리할수 있는강력한 데이터 구조및 데이터 조작 도구를 제공함
pandas를 사용하면 추가분석을 위해 데이터를 쉽게 로드, 정리와 준비를 할구 있음
또한 필터링, 그룹화 및 데이터 조인과 같은데이터 조작 작업을 수행할 수 있음
2 넘피
Numpy는 수치계산밑 데이터 조작을 위한 강력한 라이브러리
광범위한 수학 함수를 제공하며 데이터 배열에 대한 연산을 수행할수 있음
numpy를 사용하면 데이터의 평균, 표준편차및 상관관계와 같은 통계를 쉽게 계산할 수 있음
3. 매트 플롯 라이브러리
Matplotlib은 정적, 애니메이션 및 대화형 시각화를 만들수 있는 python 의 프로팅 라이브러리
데이터 시각화를 위한 강력한도구이며 라인플롯, 스캐터 차트 및 히스토그램과 같은 광범위한 플롯을 만드는데 사용
4. 씨본
Seaborn은 Matplotlib 를 기반으로 구축된 라이브러리로 고급 시각화를 만들수 있음
Pandas를 통한 데이터 시각화 지원이 내장되어 있으며 히트맵 박스 플롯 및 바이올린 플롯을 만드는데 사용할수 있다.
5. 싸이킷 런
Scikit-learn 은 파이썬 기반 머신러닝을 위한 강력한 라이브러리
분류 회귀 클러스터링 등을 위한 광범위한 알고리즘 제공
또한 numpy 및 pandas 와 같은 다른 라이브러리와도 호환 -> 데이터 분석 워크 플로우와 쉽게 통합
6.텐써 플로우
TensorFlow는 파이썬의 딥 러닝을 위한 강력한 라이브러리
이를통해 기계 학습모델 특히 딥 러닝 모델을 구축 , 학습 그리고 배포를 할수 있음
TensorFlow를 사용하면 신경망을 쉽게 구축하고 이미지 분류및 자연어 처리와 같은 작업을 수행
7.케라스
Keras는 파이썬으로 작성된 고수준 신경망 API
신경망 모델을 쉽게 구축 , 학습 밑 테스트 할 수 있는 사용자 친화적인 api
tensorflow를 기반으로 구축 되어있으며 최소한의 코드로 복잡한 신경망을 구축하는데 사용할 수 있다.
8. NLTK
NLTK는 자연어 처리를 위한 도구를 제공하는 python 라이브러리
토큰화 어간분석 및 품사태깅과 같은 작업을 수행하는데 사용
NLTK 를 사용하면 텍스트 데이터를 쉽게 분석하고 이해할수 있음
9. 스키피
Scipy는 numpy를 기반으로 구축되고 광범위한 수학밑 과학 함수를 제공하는 파이썬 라이브러리
최적화, 통합, 보간 , 신호및 이미지 처리등에 사용
과학 컴퓨팅밑 데이터 분석을 위한 강력한 라이브러리
10. statsmodels
Statsmodels는 다양한 통뎨모델을 추정하기 위한 클래스와 함수를 제공하는 python 라이브러리
다양한 통계 테스트 및 데이터 탐색 도구를 제공
Numpy 및 pandas와 호환되므로 데이터 분석 워크플로우와 쉽게 통합할수 있음
-==>위와 같은 라이브러리를 사용하면 대규모 데이터를 세트로 쉽게 작업하고 데이터정리및 준비를 수행하고, 의미있는통찰력을 추출하고 시각화를 만들수 있음
보다 현대화된 인터페이스와 인과 분석, 데이터 탐색 부조종 등과 같은 발전된 기능을 선호하는 사람들에게는 Rath 는 도움을 줄수 있음
출처 - docs.kanaries.net