R нь өгөгдөлд анализ хийх, статистикийн төрөл бүрийн шинжилгээ хийхэд зориулагдсан байдаг. R-ийн үндсэн ойлголтуудыг эзэмшсэнээр та R дээр ажиллах үндсэн аргачлалуудыг ойлгож, өгөгдөлд шинжилгээ хийх чадвартай болно. Энэ нийтлэлээрээ жишээний хамт товч танилцуулъя.
1. Суурь ойлголтууд
Өгөгдлийн төрөл
R-д хэд хэдэн төрлийн өгөгдөл байдаг:
- Numeric: Тоон өгөгдөл (e.g., 3.14, 42)
- Integer: Бүхэл тоо (e.g., 1L, 2L)
- Character: Тэмдэгт мөр (e.g., “Hello, World!”)
- Logical: Логик утга (TRUE, FALSE)
- Factor: Категорийн өгөгдөл
x <- 42 # Numeric
y <- 1L # Integer
z <- "Hello" # Character
a <- TRUE # Logical
b <- factor(c("red", "green", "blue")) # Factor
Вектор
Вектор нь нэг төрлийн өгөгдлийн дарааллыг илэрхийлдэг.
vec <- c(1, 2, 3, 4, 5) # Numeric vector
chars <- c("A", "B", "C") # Character vector
Матриц
Матриц нь хоёр хэмжээст вектор бөгөөд нэг төрлийн өгөгдлүүдийг агуулна.
mat <- matrix(1:9, nrow = 3, ncol = 3)
Өгөгдлийн хүрээ (Data Frame)
Өгөгдлийн хүрээ нь багана бүр нь вектороос бүрдэх, олон төрлийн өгөгдөл агуулж болох хоёр хэмжээст бүтэц юм.
df <- data.frame(Name = c("Alice", "Bob", "Charlie"), Age = c(25, 30, 35), Score = c(90, 85, 95))
Жагсаалт
Жагсаалт нь төрөл бүрийн өгөгдлүүдийг нэгтгэх боломжтой бүтэц юм.
lst <- list(Name = "Alice", Age = 25, Scores = c(90, 85, 95))
2. Үндсэн үйлдлүүд
Туслах функцууд
R-д олон төрлийн туслах функцууд байдаг.
# Векторын урт
length(vec)
# Хамгийн бага ба хамгийн их утга
min(vec)
max(vec)
# Дундаж утга
mean(vec)
Индексжүүлэлт
R-д индексжүүлэлт нь вектор, матриц, өгөгдлийн хүрээ гэх мэт өгөгдлийн бүтэцтэй ажиллахад хэрэглэгддэг.
# Векторын хоёр дахь элемент
vec[2]
# Матрицын хоёр дахь мөр, гурав дахь багана
mat[2, 3]
# Өгөгдлийн хүрээний 'Name' багана
df$Name
df[["Name"]]
График дүрслэл
R-д өгөгдлийг дүрслэх олон функцууд байдаг.
# Энгийн баганан график
barplot(table(df$Name))
# Дэлгэрэнгүй график (ggplot2 багц ашиглана)
install.packages("ggplot2")
library(ggplot2)
ggplot(df, aes(x = Name, y = Score)) + geom_bar(stat = "identity")
3. Функц тодорхойлох
R-д өөрийн функцыг тодорхойлон ашиглаж болно.
# x, y хоёр тоог нэмэх функц
add <- function(x, y) {
return(x + y)
}
# Функцыг дуудах
result <- add(5, 3) # Output: 8
4. Багц ашиглах
R-д олон төрлийн нэмэлт функцуудыг багцын тусламжтайгаар ашиглах боломжтой байдаг.
# dplyr багц суулгах ба ашиглах
install.packages("dplyr")
library(dplyr)
# Өгөгдлийн хүрээн дээр ажиллах
df_filtered <- filter(df, Age > 25)
df_summarized <- summarize(df, avg_score = mean(Score))
Эдгээр ойлголтуудыг эзэмшсэнээр та өгөгдлийг боловсруулах, анализ хийх болон дүрслэх чадвартай болно. Хэрвээ та видео хичээл бүхий цогц сургалтанд хамрагдахыг хүсвэл “Дата Анализ R” сургалтанд хамрагдаарай.