Өнөө цагт аливаа салбарын судалгаа, шийдвэр гаргалт, загварчлалд регрессийн шинжилгээ (regression analysis) чухал байр суурь эзэлж байна. Энэхүү аргын гол зорилго нь хоёр ба түүнээс дээш хувьсагчдын хоорондын хамаарлыг тооцоолон, хамаарлын түвшин болон чиглэлийг тодорхойлж, ирээдүйн таамаглал хийх боломжийг олгодог.
Эдийн засаг, эрүүл мэнд, нийгмийн ухаан, инженерчлэл зэрэг олон салбарт регрессийн аргыг өргөн хэрэглэдэг бөгөөд энэ нийтлэлд түүний үндсэн ойлголтууд, загварын төрлүүд, шинжилгээний алхамууд, мөн практик жишээгээр тооцоолол хэрхэн хийгддэгийг танилцуулах болно.
1. Регрессийн шинжилгээний үндсэн ойлголтууд
Регрессийн шинжилгээ гэдэг нь хамааран хувьсагч (dependent variable) болон нэг буюу хэд хэдэн тайлбарлагч хувьсагчид (independent variables) хоорондын хамаарлыг илэрхийлэх статистик арга юм. Үндсэн зорилго нь:
- Хувьсагчдын хамаарлыг хэмжих,
- Таамаглал хийх,
- Нөлөөлөл үзүүлэгч хүчин зүйлсийг ялгах,
- Шийдвэр гаргалтад дэмжлэг үзүүлэх.
Гол ойлголтууд:

2. Регрессийн загварын төрлүүд
2.1. Энгийн шугаман регресс (Simple Linear Regression)
Нэг тайлбарлагч хувьсагч болон нэг хамааран хувьсагчийн хоорондын шугаман хамаарлыг тодорхойлно.
Жишээ:
Сургалтын цаг (X) ба шалгалтын оноо (Y) хоорондын хамаарлыг судлах
import seaborn as sns
import statsmodels.api as sm
# Жишээ өгөгдөл
X = [2, 4, 6, 8, 10]
Y = [50, 55, 65, 70, 78]
# Регрессийн шинжилгээ
X_with_const = sm.add_constant(X)
model = sm.OLS(Y, X_with_const).fit()
print(model.summary())
2.2. Олон хүчин зүйлт регресс (Multiple Linear Regression)
Хэд хэдэн X хувьсагчид Y-д зэрэг нөлөөлж буйг судална.
Жишээ:
Оюутны шалгалтын оноонд суралцсан цаг, өмнөх хичээлүүдийн дүн, сургуулийн орчин зэрэг нөлөөлөх эсэхийг судлах
2.3. Бусад нарийн загварууд
- Полиномиал регресс (Polynomial Regression)
- Логистик регресс (Logistic Regression – хоёр утгатай Y)
- Ridge, Lasso регресс (Тохируулгатай регрессийн загварууд)
3. Шинжилгээний үндсэн алхмууд
- Өгөгдөл цуглуулах – Найдвартай эх сурвалжаас өгөгдөл цуглуулах, хувьсагч тодорхой байх.
- Сургалт ба шинжилгээ хийх – Загварыг тааруулах, тохиргоо хийх.
- Үр дүн тайлбарлах – R-squared, p-value, coefficient тайлбар хийх.
- Оношилгоо – Хэрэглээнд тохиромжтой эсэх, хэт тохируулалт зэргийг шалгах.
- Таамаглал хийх – Ирээдүйн утгыг таамаглах.
4. Тооцоолол хийх
4.1. Шугаман регрессийн томъёо
Регрессийн шинжилгээ нь хамааран хувьсагч (Y) болон тайлбарлагч хувьсагч (X) хоорондын хамаарлыг тодорхойлдог статистик загвар юм. Энэ хамаарлыг дараах шугаман регрессийн тэгшитгэлээр илэрхийлнэ:
\[Y = \beta_0 + \beta_1 X + \varepsilon\]- Y — хамааран хувьсагч (dependent variable)
- X — тайлбарлагч буюу үл хамааран хувьсагч (independent variable)
- beta_0 — тэгшитгэлийн огтлолцол (intercept)
- beta_1 — хазайлт буюу налуугийн коэффициент (slope)
- e — санамсаргүй алдаа (residual/error)
4.2. Тооцооллын жишээ (Энгийн шугаман регресс)
Жишээ өгөгдөл


Томъёо 1: Дунджуудыг олох
\[\bar{X} = \frac{\sum X}{n}, \quad \bar{Y} = \frac{\sum Y}{n}\] \[\bar{X} = \frac{2 + 4 + 6 + 8 + 10}{5} = 6, \quad \bar{Y} = \frac{50 + 55 + 65 + 70 + 78}{5} = 63.6\]Томъёо 2: Налуу коэффициент (beta_1)
\[\beta_1 = \frac{\sum (X_i – \bar{X})(Y_i – \bar{Y})}{\sum (X_i – \bar{X})^2}\]
Томъёо 3: Огтлолцол (beta_0)
\[\beta_0 = \bar{Y} – \beta_1 \bar{X} = 63.6 – 3.55 \times 6 = 63.6 – 21.3 = 42.3\]Регрессийн тэгшитгэл
\[\hat{Y} = 42.3 + 3.55X\]Жишээ тооцоолол
Хэрэв оюутан 7 цаг хичээллэвэл түүний шалгалтын оноог дараах байдлаар таамаглаж болно:
\[\hat{Y} = 42.3 + 3.55 \times 7 = 42.3 + 24.85 = 67.15\]4.3. Загварын тайлбар үзүүлэлтүүд
R² (тодорхойлох коэффициент)
\[R^2 = 1 – \frac{\text{SSE}}{\text{SST}} = \frac{\text{SSR}}{\text{SST}}\]- SST: нийт хэлбэлзэл
- SSR: тайлбарлагдсан хэлбэлзэл
- SSE: үлдэгдэл хэлбэлзэл
Үр дүн:
\[\beta_0 \approx 42.3\] \[\beta_1 \approx 3.55\] \[R^2 \approx 0.991\]4.4. Python ашиглан баталгаажуулах
import pandas as pd
import statsmodels.api as sm
# Өгөгдөл
X = [2, 4, 6, 8, 10]
Y = [50, 55, 65, 70, 78]
df = pd.DataFrame({'X': X, 'Y': Y})
# Загварын боловсруулалт
X_const = sm.add_constant(df['X'])
model = sm.OLS(df['Y'], X_const).fit()
print(model.summary())


Дүгнэлт
Регрессийн шинжилгээ нь өгөгдөлд суурилсан таамаглал, шийдвэр гаргалтын үр дүнтэй арга бөгөөд гар тооцооллоор загварын мөн чанарыг ойлгож, Python зэрэг орчин үеийн хэрэгслээр үр дүнг баталгаажуулан энэхүү нийтлэлээр харууллаа. Энэ аргыг суралцах нь өгөгдлийн шинжилгээ, эдийн засаг, боловсрол, эрүүл мэндийн судалгаа зэрэг олон салбарт чухал ач холбогдолтой.