متغیرها و انواع دادهها در R
در زبان برنامهنویسی R، متغیرها برای ذخیرهسازی مقادیر مختلف استفاده میشوند و انواع دادهها نشاندهنده نوع اطلاعاتی هستند که یک متغیر میتواند ذخیره کند. در این بخش، با نحوه تعریف متغیرها و انواع دادههای رایج در R آشنا میشویم.
۱. تعریف متغیرها در R
در R، برای تعریف یک متغیر از عملگر <- یا = استفاده میشود. به طور پیشفرض، متغیرها به طور پویا تایپ میشوند، به این معنی که R به طور خودکار نوع داده متغیر را بر اساس مقداری که به آن اختصاص میدهید تشخیص میدهد.
نمونههای تعریف متغیرها:
y = "سلام" # تعریف یک متغیر متنی با مقدار "سلام"
z <- TRUE # تعریف یک متغیر منطقی با مقدار TRUE
همچنین میتوانید از دستور ()assign برای اختصاص مقدار به یک متغیر استفاده کنید:
۲. انواع دادهها در R
در R، انواع دادهای مختلفی وجود دارد که برای انجام محاسبات و ذخیرهسازی اطلاعات مختلف مورد استفاده قرار میگیرند. مهمترین انواع دادهها عبارتند از:
🔹 ۱. عددی (Numeric)
این نوع داده شامل اعداد اعشاری و صحیح میشود. در R، اعداد اعشاری به صورت Numeric ذخیره میشوند، حتی اگر عدد اعشاری نباشد.
نمونه:
y <- 3.14 # عدد اعشاری
🔹 ۲. صحیح (Integer)
نوع داده Integer برای اعداد صحیح استفاده میشود. در R برای مشخص کردن یک عدد صحیح باید از علامت L در انتهای عدد استفاده کنید.
نمونه:
🔹 ۳. منطقی (Logical)
نوع داده Logical دو مقدار ممکن دارد: TRUE و FALSE. این نوع دادهها معمولا در دستورات شرطی و حلقهها استفاده میشوند.
نمونه:
y <- FALSE # مقدار منطقی FALSE
🔹 ۴. کاراکتری (Character)
نوع داده Character برای ذخیرهسازی متنی استفاده میشود. هر مقداری که داخل کوتیشنها (" " یا ' ') قرار بگیرد، به صورت رشته (string) در نظر گرفته میشود.
نمونه:
greeting <- 'سلام' # متغیر حاوی یک رشته
🔹 ۵. پیچیده (Complex)
نوع داده Complex برای اعداد مختلط استفاده میشود. اعداد مختلط شامل یک بخش حقیقی و یک بخش موهومی هستند.
نمونه:
۳. ساختارهای داده در R
R علاوه بر انواع دادهی اولیه، ساختارهای دادهای پیچیدهتری مانند وکتورها (Vectors)، ماتریسها (Matrices)، لیستها (Lists)، فریمهای داده (Data Frames) و فاکتورها (Factors) را نیز پشتیبانی میکند.
🔹 ۱. وکتور (Vector)
وکتور مجموعهای از مقادیر یکسان است که در آنها یک نوع داده به طور یکنواخت وجود دارد (مثل مجموعهای از اعداد یا رشتهها).
نمونه:
s <- c("a", "b", "c") # وکتور از رشتهها
🔹 ۲. ماتریس (Matrix)
ماتریس مجموعهای از مقادیر است که در قالب سطرها و ستونها ذخیره میشود. ماتریسها باید مقادیر یکسانی از نظر نوع داده داشته باشند.
نمونه:
🔹 ۳. لیست (List)
لیستها میتوانند شامل مقادیر با انواع مختلف داده (عددی، رشتهای، منطقی و غیره) باشند و میتوانند پیچیدهتر از وکتورها باشند.
نمونه:
🔹 ۴. فریم داده (Data Frame)
فریمهای داده یک ساختار داده جدولی هستند که مشابه به پایگاه دادهها عمل میکنند و هر ستون میتواند نوع دادهای متفاوتی داشته باشد (مثلاً یک ستون عددی و دیگری رشتهای).
نمونه:
🔹 ۵. فاکتور (Factor)
فاکتورها برای ذخیرهسازی دادههای دستهای (Categorical Data) استفاده میشوند که میتوانند مقادیر مختلف را به صورت سطح (Levels) داشته باشند.
نمونه:
۴. تبدیل انواع دادهها در R
گاهی نیاز به تبدیل یک نوع داده به نوع دیگری داریم. R ابزارهایی برای تبدیل انواع دادهها فراهم کرده است:
- تبدیل به عدد: ()as.numeric
- تبدیل به رشته: ()as.character
- تبدیل به منطقی: ()as.logical
- تبدیل به فاکتور: ()as.factor
نمونه:
y <- as.numeric(x) # تبدیل رشته به عدد
جمعبندی
در R انواع مختلفی از دادهها وجود دارد که هرکدام برای مقاصد خاصی استفاده میشوند. عدد، منطقی، کاراکتری، مختلط و ساختارهای پیچیدهتر مانند وکتورها، ماتریسها، لیستها و فریمهای داده به شما امکان تحلیلهای مختلف دادهای را میدهند.
