R программчлалын үндсэн ойлголтууд

R нь өгөгдөлд анализ хийх, статистикийн төрөл бүрийн шинжилгээ хийхэд зориулагдсан байдаг. R-ийн үндсэн ойлголтуудыг эзэмшсэнээр та R дээр ажиллах үндсэн аргачлалуудыг ойлгож, өгөгдөлд шинжилгээ хийх чадвартай болно. Энэ нийтлэлээрээ жишээний хамт товч танилцуулъя.

1. Суурь ойлголтууд

Өгөгдлийн төрөл

R-д хэд хэдэн төрлийн өгөгдөл байдаг:

  • Numeric: Тоон өгөгдөл (e.g., 3.14, 42)
  • Integer: Бүхэл тоо (e.g., 1L, 2L)
  • Character: Тэмдэгт мөр (e.g., “Hello, World!”)
  • Logical: Логик утга (TRUE, FALSE)
  • Factor: Категорийн өгөгдөл
x <- 42           # Numeric
y <- 1L           # Integer
z <- "Hello"      # Character
a <- TRUE         # Logical
b <- factor(c("red", "green", "blue"))  # Factor

Вектор

Вектор нь нэг төрлийн өгөгдлийн дарааллыг илэрхийлдэг.

vec <- c(1, 2, 3, 4, 5)  # Numeric vector
chars <- c("A", "B", "C")  # Character vector

Матриц

Матриц нь хоёр хэмжээст вектор бөгөөд нэг төрлийн өгөгдлүүдийг агуулна.

mat <- matrix(1:9, nrow = 3, ncol = 3)

Өгөгдлийн хүрээ (Data Frame)

Өгөгдлийн хүрээ нь багана бүр нь вектороос бүрдэх, олон төрлийн өгөгдөл агуулж болох хоёр хэмжээст бүтэц юм.

df <- data.frame(Name = c("Alice", "Bob", "Charlie"), Age = c(25, 30, 35), Score = c(90, 85, 95))

Жагсаалт

Жагсаалт нь төрөл бүрийн өгөгдлүүдийг нэгтгэх боломжтой бүтэц юм.

lst <- list(Name = "Alice", Age = 25, Scores = c(90, 85, 95))

2. Үндсэн үйлдлүүд

Туслах функцууд

R-д олон төрлийн туслах функцууд байдаг.

# Векторын урт
length(vec)

# Хамгийн бага ба хамгийн их утга
min(vec)
max(vec)

# Дундаж утга
mean(vec)

Индексжүүлэлт

R-д индексжүүлэлт нь вектор, матриц, өгөгдлийн хүрээ гэх мэт өгөгдлийн бүтэцтэй ажиллахад хэрэглэгддэг.

# Векторын хоёр дахь элемент
vec[2]

# Матрицын хоёр дахь мөр, гурав дахь багана
mat[2, 3]

# Өгөгдлийн хүрээний 'Name' багана
df$Name
df[["Name"]]

График дүрслэл

R-д өгөгдлийг дүрслэх олон функцууд байдаг.

# Энгийн баганан график
barplot(table(df$Name))

# Дэлгэрэнгүй график (ggplot2 багц ашиглана)
install.packages("ggplot2")
library(ggplot2)
ggplot(df, aes(x = Name, y = Score)) + geom_bar(stat = "identity")

3. Функц тодорхойлох

R-д өөрийн функцыг тодорхойлон ашиглаж болно.

# x, y хоёр тоог нэмэх функц
add <- function(x, y) {
  return(x + y)
}

# Функцыг дуудах
result <- add(5, 3)  # Output: 8

4. Багц ашиглах

R-д олон төрлийн нэмэлт функцуудыг багцын тусламжтайгаар ашиглах боломжтой байдаг.

# dplyr багц суулгах ба ашиглах
install.packages("dplyr")
library(dplyr)

# Өгөгдлийн хүрээн дээр ажиллах
df_filtered <- filter(df, Age > 25)
df_summarized <- summarize(df, avg_score = mean(Score))

Эдгээр ойлголтуудыг эзэмшсэнээр та өгөгдлийг боловсруулах, анализ хийх болон дүрслэх чадвартай болно. Хэрвээ та видео хичээл бүхий цогц сургалтанд хамрагдахыг хүсвэл “Дата Анализ R” сургалтанд хамрагдаарай.

Холбоотой нийтлэлүүд

Энэхүү нийтлэлээр Windows болон MacOS үйлдлийн систем дээр R болон RStudio-г суулгах зааварчилгааг тайлбарлая. 1. R-г суулгах Алхам 1: R-г...
  • R
  • 6 сар 26, 2024
Энэхүү нийтлэлээрээ R дээр хэрхэн газрын зураг байгуулах тухай үзье. Газрын зураг байгуулахын тулд “ggplot2” болон “sf” (simple features) гэсэн...
  • R
  • 5 сар 11, 2024
dplyr нь R дээр дата боловсруулахад хамгийн их ашиглагддаг багц бөгөөд жишээгээр хэрхэн ашиглахыг энэ нийтлэлээр орууллаа.
  • R
  • 9 сар 13, 2020