Python програмын Data Science -д зориулсан ТОП-8 санг тайлбарлан хүргэж байна.
ҮНДСЭН САНГУУД
1. NumPy

NumPy (Numerical Python) нь Python – ы хамгийн суурь сан бөгөөд вектор, матриц дээр хийгдэх математик үйлдлүүдийг хийхэд зориулагдсан.
2. SciPy

SciPy нь инженеринг болон шинжлэх ухаанд зориулагдсан програмын сан бөгөөд шугаман алгебр, оновчлол, интеграц, статистикийн модулийг агуулдаг.
3. Pandas

Pandas нь өгөгдлийг хувиргах хамгийн төгс хэрэгсэл гэж ойлгож болно. Өгөгдлийг хурдан, хялбараар удирдах, нэгтгэх, дүрслэхэд зориулагдсан.
ГРАФИК БАЙГУУЛАХ
4. Matplotlib

Matplotlib нь энгийнээс эхлээд ахисан түвшний графикуудыг байгуулахад зориулсан хамгийн өргөн хэрэглэгддэг сангуудыг нэг юм. Жишээлбэл доорх графикуудыг байгуулах боломжтой:

- Line plots;
- Scatter plots;
- Bar charts and Histograms;
- Pie charts;
- Stem plots;
- Contour plots;
- Quiver plots;
- Spectrograms.
5. Seaborn
Seaborn нь статистикийн загваруудыг дүрслэхэд зориулагдсан бөгөөд Heatmap, FactorPlot гэх зэрэг графикуудыг байгуулах боломжтой. Seaborn нь Matplotlib дээр суурилдаг.

MACHINE LEARNING
6. SciKit-Learn

SciKit-Learn нь хамгийн түгээмэл хэрэглэгддэг Машин сургалтын сан бөгөөд Numpy болон SciPy зэрэг сангуудтай хоршин ажиллахаар зохиогдсон. Машин сургалтын үндсэн алгоритмууд (Classification, Regression, Clustering) болох KNN, Support Vector Machine, Decision Tree, Random Forest, Gradient Boosting, Naive Bayes, k-means clustering зэргийг ашиглах боломжтой.

DEEP LEARNING
7. TensorFlow

Google Brain Team-ынсудлаач, инженерүүд боловсруулсан бөгөөд 2015 онд олон нийтэд нээлттэй болгосон. Tensorflow нь өндөр хүчин чадалтай тооцоолол хийхэд зориулагдсан бөгөөд CPU, GPU болон TPU дээр ажиллах боломжтой. TensorFlow-ийн гол онцлог нь асар их хэмжээний өгөгдөл дээр Neural Networks-г хурдан сургах боломжийг олгодог тул дуу, дүрс, зураг таних зэрэг хиймэл оюун ухааны салбарт маш өргөнөөр ашиглагдаж байна.
Data Mining & Statistics
8. Statsmodels

Statsmodels сан нь маш олон төрлийн статистик загваруудын тооцоолол (linear regression models, generalized linear models, discrete choice models, robust linear models, time series analysis …) болон төрөл бүрийн статистикийн шинжүүрүүдийг шалгах, тоон шинжилгээ хийхэд зориулагдсан.
