Python – ы Data Science-д зориулсан ТОП-8 сан

Python програмын Data Science -д зориулсан ТОП-8 санг тайлбарлан хүргэж байна.

ҮНДСЭН САНГУУД

1. NumPy 

NumPy (Numerical Python) нь Python – ы хамгийн суурь сан бөгөөд вектор, матриц дээр хийгдэх математик үйлдлүүдийг хийхэд зориулагдсан.

2. SciPy 

SciPy нь инженеринг болон шинжлэх ухаанд зориулагдсан програмын сан бөгөөд шугаман алгебр, оновчлол, интеграц, статистикийн модулийг агуулдаг.

3. Pandas

Pandas нь өгөгдлийг хувиргах хамгийн төгс хэрэгсэл гэж ойлгож болно. Өгөгдлийг хурдан, хялбараар удирдах, нэгтгэх, дүрслэхэд зориулагдсан.

ГРАФИК БАЙГУУЛАХ

4. Matplotlib 

Matplotlib нь энгийнээс эхлээд ахисан түвшний графикуудыг байгуулахад зориулсан хамгийн өргөн хэрэглэгддэг сангуудыг нэг юм. Жишээлбэл доорх графикуудыг байгуулах боломжтой:

  • Line plots;
  • Scatter plots;
  • Bar charts and Histograms;
  • Pie charts;
  • Stem plots;
  • Contour plots;
  • Quiver plots;
  • Spectrograms.

5. Seaborn

Seaborn нь статистикийн загваруудыг дүрслэхэд зориулагдсан бөгөөд Heatmap, FactorPlot гэх зэрэг графикуудыг байгуулах боломжтой. Seaborn нь Matplotlib дээр суурилдаг.

MACHINE LEARNING

6. SciKit-Learn

SciKit-Learn нь хамгийн түгээмэл хэрэглэгддэг Машин сургалтын сан бөгөөд Numpy болон SciPy зэрэг сангуудтай хоршин ажиллахаар зохиогдсон. Машин сургалтын үндсэн алгоритмууд (Classification, Regression, Clustering) болох KNN, Support Vector Machine, Decision Tree, Random Forest, Gradient Boosting, Naive Bayes, k-means clustering зэргийг ашиглах боломжтой.

DEEP LEARNING

7. TensorFlow

Google Brain Team-ынсудлаач, инженерүүд боловсруулсан бөгөөд 2015 онд олон нийтэд нээлттэй болгосон. Tensorflow нь өндөр хүчин чадалтай тооцоолол хийхэд зориулагдсан бөгөөд CPU, GPU болон TPU дээр ажиллах боломжтой. TensorFlow-ийн гол онцлог нь асар их хэмжээний өгөгдөл дээр Neural Networks-г хурдан сургах боломжийг олгодог тул дуу, дүрс, зураг таних зэрэг хиймэл оюун ухааны салбарт маш өргөнөөр ашиглагдаж байна.

Data Mining & Statistics

8. Statsmodels

Statsmodels сан нь маш олон төрлийн статистик загваруудын тооцоолол (linear regression models, generalized linear models, discrete choice models, robust linear models, time series analysis …) болон төрөл бүрийн статистикийн шинжүүрүүдийг шалгах, тоон шинжилгээ хийхэд зориулагдсан.

Хуваалцах:

Холбоотой нийтлэлүүд

Virtual Environment гэж юу вэ? Virtual Environment (виртуал орчин) нь Python дээр хөгжүүлэгдэх төслийн тусгайлан тохируулагдсан орчин юм. Энэ нь...
  • Python
    ,
    Software Engineering
  • 7 сар 19, 2024
Python-ы класс бол объект хандалтат программчлалын үндсэн нэгж юм. Класс нь объектуудын төлөв (Attribute) ба үйлдлүүдийг (Action) тодорхойлдог. Классыг тодорхойлохдоо...
  • Python
    ,
    Software Engineering
  • 7 сар 18, 2024
Python-ы Matplotlib болон Seaborn сангуудыг ашиглан Монгол улсын хүн амын тоон мэдээллийг графикаар хэрхэн дүрслэхийг энэхүү нийтлэлээр үзье. Хүн амын...
  • Python
  • 5 сар 25, 2024