Veri Bilimcisi

Makine Öğrenmesi, Derin Öğrenme, Veri Madenciliği, Veri Analizi

R 101

İÇERİK

  1. Yardım Alma√
  2. Paket Kullanımı√
  3. Dosyalarla Calışma√
  4. Vektörler
  5. Programlama
  6. Veri Okuma ve Yazma
  7. Veri Tipleri
  8. Matematik Fonksiyonları
  9. Değişken Atama ve Çevre
  10. Matrisler
  11. Listeler
  12. Veri Çerçeveleri
  13. Diziler
  14. Faktörler
  15. İstatistik ve Dağılım
  16. Çizim

Başlamadan önce, kullanılan IDE RStudio ve R versiyonu 3.2.2 (2015-12-10). RStudio’yu başlattıktan sonra yeni bir R Script oluşturup devam edelim.

Yardım Alma

İlk olarak, daha önceden tanımlanan değişkenlerimizi silelim.

# temizlik
rm(list = ls())

Herhangi bir konuda bilgi almak için, ‘?’ kullanabiliriz.

?mean

veya

help.search('median')

Sağ tarafta Help sekmesi altında ilgili konu ile ilgili bilgilere ulaşabilirsiniz.

Bir paket bulmak için,

help(package = 'readr')

Bir nesne hakkında bilgi sahibi olmak için,

str(iris)
class(iris)

yazılabilir.

Paket Kullanımı

Bir paketi indirmek için,

installed.packages('readr)

Paketi yüklemek için,

library(readr)

Paketten sadece bir fonksiyona erişmek isterseniz,

readr::parse_integer(x="2")

Hazır bir veri setini yüklemek için:

data(iris)

Dosyalarla Calışma

Bulunduğunuz çalışma alanının tam adresine erişmek için,

getwd()

Çalışmanı alanını değiştirmek için,

setwd('buraya_yeni/path/gelmeli')

Vektörler

Yeni vektör oluşturmak için,

# yeni vektor yaratma
v1 = c(1,2,3,4,5,6,7,8,9)
# integer dizisi
v2 = 2:6
# kompleks dizi
v3 = seq(1,10,by=1)
# vektor tekrari
v4 = rep(1:2, times=4)
# vektorun elemanlarinin tekrari
v5 = rep(1:4, each=3)

Vektör fonksiyonları:

# vektor fonksiyonlari
sort(v4) # elemanlari siralar
table(v1) # elemanlarin kac kere gectigi
rev(v1) # vektoru ters cevirir
unique(v5) # vektordeki benzersiz elemanlar

Vektörden eleman seçmek için,

# vektorden eleman secme
vektor = c(1,2,3,4,5,6,7,8,9,10)
# pozisyona gore
vektor[5] # 5. eleman
vektor[-3] # 3. eleman haric, hepsi
vektor[1:5] # 1. elemandan 5. elemana kadar
vektor[-(1:5)] # 1. elemandan 5. eleman haric
vektor[c(5,6)] # 5. ve 6. eleman
# degere gore
vektor[vektor==5] # 5 e esit olan eleman
vektor[vektor>3] # 3 den buyuk olan elemanlar

Programlama

## programlama
# For
for (sayi in 1:10){
 print(sayi)
}
# While
i <- 0
while(i<-3){
 print(i)
 i <- i + 1 } # If if(i >= 5){
 print("bes")
}else{
 print("bes degil")
}
# Function
ornek_fonksiyon <- function(sayi){
 return(sayi + sayi)
}
ornek_fonksiyon(5)

Veri Okuma ve Yazma

# Veri Okuma ve Yazma
tablo <- read.table("dosya.txt")
write.table(tablo, "cikti.txt")
# veya
csv <- read.csv("dosya.txt")
write.csv(csv, "cikti.txt")
# veya
load("dosya.RData")
save(tablo, file = "cikti.RData")

Veri Tipleri

# veri tipleri
as.logical
as.numeric
as.character
as.factor

Matematik Fonksiyonları

# matematik fonksiyonlari
log(2)
exp(1)
max(1,2,3)
round(12.55555555,5)
signif(5.6666666,3)
cor(c(1,2,3),c(4,5,6))
sum(1:100)
mean(1:100)
median(1:100)
quantile(1:100)
rank(1:100)
var(1:100)
sd(1:100)

Değişken Atama ve Çevre

# degisken atama ve cevre
a <- 'ornek'
a = 'ornek'
ls()
rm(a)

Matrisler

# matris
x = c(1:10)
matris <- matrix(x,nrow = 2,ncol = 5)
matris[2,] # satir secimi
matris[,3] # kolon secimi
matris[1][1] # eleman secimi
t(matris) # transpoz

Listeler

# liste
liste <- list(x=1:10,y=c('s','b'))
print(liste)
#$x
# [1] 1 2 3 4 5 6 7 8 9 10
#$y
#[1] "s" "b"
liste[[1]] # [1] 1 2 3 4 5 6 7 8 9 10
liste[2]
# $y
# [1] "s" "b"
liste$y
# [1] "s" "b"
liste['x']
#$x
# [1] 1 2 3 4 5 6 7 8 9 10

Veri Çerçeveleri

# veri cercevesi
cerceve <- data.frame(x=1:3,y=c('a','b','c'))
cerceve[,2]
#[1] a b c
#Levels: a b c
cerceve[2,]
# x y
# 2 2 b
cerceve[2,2]
#[1] b
#Levels: a b c
nrow(cerceve) # 3
ncol(cerceve) # 2
dim(cerceve) # 3 2

Diziler

# diziler
s1 = "string1"
s2 = "string2"
paste(s1,s2,sep = " ") # "string1 string2"
paste(s1,s2,collapse = " ")# "string1 string2"
grep("tri",s1) # 1
toupper(s1) # STRING1"
tolower(s2) # string2
nchar(s1) # 7

Faktörler

# faktorler
factor(x=c('a','b'))
cut(x=(1:10),breaks = 2)

İstatistik ve Dağılım

</pre>
# istatistik
lm(y ~ x, data = df) # lineer model
glm(y ~ x, data = df) # genellestirilmis lineer model
summary() # model ile ilgili bilgi
# testler
t.test
pairwise.t.test
prop.test
aov

# dagilim
rnorm()
rpois()
rbinom()
runif()
dnorm()
dpois()
dbinom()
dunif()
pnorm()
ppois()
pbinom()
punif()
qnorm()
qpois()
qbinom()
qunif()

Çizim

# plot
plot()

 

%d blogcu bunu beğendi: