Ssoon

[혼공데분] 01 데이터분석을 시작하며 - 1) 데이터 분석이란 본문

혼자 공부하는 데이터분석

[혼공데분] 01 데이터분석을 시작하며 - 1) 데이터 분석이란

구구달스 2024. 1. 2. 21:41

데이터 분석

  • 데이터를 수집, 처리, 정제, 분석, 모델링하영 의사 결정을 내리는 데 도움을 주는 작업

데이터 과학

  • 데이터 분석, 머신 러닝을 아우르는 개념
  • 머신러닝 모델을 만들어 문제를 해결하는 데 많은 비중

데이터 마이닝

  • 데이터에서 패턴 혹은 지식을 추출하는 작업

머신러닝

  • 데이터에서 자동으로 규칙을 학습하여 문제를 해결하는 소프트웨어를 만드는 기술
  • 모델 : 머신러닝에서 학습한 소프트웨어 객체

NumPy

  • numerical pythin 의 줄임말
  • 고성능 과학 계산과 다차원 배열을 위한 파이썬 패키지

https://numpy.org/

 

NumPy

Powerful N-dimensional arrays Fast and versatile, the NumPy vectorization, indexing, and broadcasting concepts are the de-facto standards of array computing today. Numerical computing tools NumPy offers comprehensive mathematical functions, random number g

numpy.org

Pandas

  • 파이썬 데이터 문석을 위한 전문 패키지
  • 엑셀의 시트처럼 숫자와 문자를 섞어서 표 형태로 저장할 수 있는 데이터프레임을 사용
  • 데이터 처리와 분석 작업

https://pandas.pydata.org/

 

pandas - Python Data Analysis Library

pandas pandas is a fast, powerful, flexible and easy to use open source data analysis and manipulation tool, built on top of the Python programming language. Install pandas now!

pandas.pydata.org

 

Matplotlib

  • 파이썬 데이터 시각화를 위한 기본 패키지
  • 정적 혹은 동적 그래프를 그릴 수 있고, 고품징릐 다양한 그래프 제공

https://matplotlib.org/

 

Matplotlib — Visualization with Python

seaborn seaborn is a high level interface for drawing statistical graphics with Matplotlib. It aims to make visualization a central part of exploring and understanding complex datasets. statistical data visualization Cartopy Cartopy is a Python package des

matplotlib.org

SciPy

  • 넘파이를 기반으로 구축된 수학과 과학 계산 전문 패키지

https://scipy.org/

 

SciPy

Fundamental algorithms SciPy provides algorithms for optimization, integration, interpolation, eigenvalue problems, algebraic equations, differential equations, statistics and many other classes of problems. Broadly applicable The algorithms and data struc

scipy.org

scikit-learn

  • 파이썬의 머신러닝 패키지

https://scikit-learn.org/stable/

 

scikit-learn: machine learning in Python — scikit-learn 1.3.2 documentation

Model selection Comparing, validating and choosing parameters and models. Applications: Improved accuracy via parameter tuning Algorithms: grid search, cross validation, metrics, and more...

scikit-learn.org

 

 
Comments