Auzef Web Analitiği Ve Zekâsı 2025-2026 Vize Soruları
https://lolonolo.com/2026/05/06/web-analitigi-ve-zekasi-2025-2026-vize-sorulari/
https://lolonolo.com
Show More Show Less View Video Transcript
0:00
Herkese merhaba. Bu derinlemesine
0:02
incelememize hoş geldiniz. Bugün sizinle
0:04
gerçekten heyecan verici bir serüvene
0:06
çıkıyoruz. Bir web sitesindeki basit bir
0:08
tıklamanın makine öğrenmesi
0:10
algoritmalarını besleyen o kusursuz
0:12
pürüzsüz yakıta dönüşme yolculuğuna adım
0:14
adım tanık olacağız. Verinin o ham
0:17
halinden alıp R programlamayla arka
0:19
planda neler yaptığımıza detaylıca
0:21
bakacağız. Hazırsanız başlayalım.
0:24
Bugünkü yol haritamız oldukça net. Önce
0:27
web analitiği süreçleri diyeceğiz.
0:29
Ardından R programlama temellerine
0:31
gireceğiz. Sonrasında veri çerçevelerini
0:34
yani data frame'leri nasıl yönettiğimize
0:36
bakıp finali veri ön işleme ile
0:38
yapacağız. Dört kritik adımımız var. O
0:42
zaman hiç vakit kaybetmeyelim ve hemen
0:44
birinci bölüme web analitiği süreçlerine
0:46
dalalım. Gerçek dünyadan dijital
0:48
pazarlamanın tam kalbinden bir
0:50
senaryoyla işe koyulalım. Şimdi diyelim
0:53
ki sitemize gelen trafiğe bakıyoruz ve
0:55
ziyaretçilerimizin %41'inin organik
0:59
arama motorlarından geldiğini görüyoruz.
1:01
Geri kalanlarda sosyal medya, doğrudan
1:03
giriş ve e-posta şeklinde dağılıyor.
1:06
Veri biliminde ve aslında dijital
1:07
pazarlamada altın bir kural vardır
1:10
bilirsiniz. En çok trafiği ve dönüşümü
1:12
neresi getiriyorsa yatırımı oraya yapın.
1:14
Yani bu tabloya baktığımızda aklımıza
1:16
gelen ilk ve en rasyonel strateji
1:19
şüphesiz arama motoru optimizasyonuna
1:22
yani SEO'ya öncelik vermek oluyor. Peki
1:25
bu trafik analizlerini yaparken aslında
1:27
hangi dili konuşuyoruz? İşte tam bu
1:29
noktada iki hayati kavramımız var.
1:31
Metrikler ve boyutlar. Metrikler bize o
1:34
hep aradığımız kaç tane veya ne kadar
1:37
sorularının nicel cevaplarını verir.
1:39
Mesela toplam ziyaretçi sayınız veya
1:41
hemen çıkma oranınız. Boyutlar ise işte
1:43
bu sayıları alır ve anlamlı nitel
1:46
gruplara ayırır. Bu ziyaretçiler hangi
1:48
şehirden bağlanıyor ya da hangi
1:50
tarayıcıyı kullanıyorlar gibi soruların
1:52
cevabıdır. Yani kısacası metrikler
1:55
sayar, boyutlar kategorize eder. Olay
1:57
aslında bu kadar basit. Mesela hepimizin
2:00
bildiği en kritik metriklerden biri olan
2:03
hemen çıkma oranını yani bounce rate'i
2:05
düşünelim. Bu sitenize girip hiçbir şeye
2:08
tıklamadan, başka hiçbir sayfaya
2:10
geçmeden çıkıp giden kullanıcıların
2:12
oranıdır. Bunun yüksek olması genelde
2:15
eyvah açılış sayfamız beklentiyi
2:17
karşılamıyor demektir. Peki ama bu hemen
2:20
çıkıp giden kullanıcıların hangi işletim
2:23
sistemini veya tarayıcıyı kullandığı
2:25
gibi teknik boyutları nereden biliyoruz?
2:27
İşte o arka planda çalışan sunucu
2:29
loglarındaki kullanıcı aracısı yani o
2:33
meşhur user agent parametresi sayesinde.
2:36
Bu parametre kullanıcının adeta dijital
2:38
parmak izini sistemimize fısılıyor.
2:41
Evet, verilerimizin web üzerinden nasıl
2:44
toplandığını ve ne ifade ettiğini
2:46
gördük. Şimdi ikinci bölümümüze
2:48
geçiyoruz. Bu verileri yoğuracağımız o
2:51
harika araca yani R programlama
2:53
dünyasına giriş yapıyoruz. Eğer daha
2:56
önce Python ya da C gibi dillerle
2:58
uğraştıysanız ara geçtiğinizde
3:00
karşılaşacağınız çok dramatik hatta ilk
3:02
başta şaşırtıcı bir fark var.
3:04
İndeksleme. R dilinde bir vektörün
3:07
içindeki elemanları saymaya 0dan değil
3:10
direkt olarak 1'den başlarız. Yani
3:12
elinizde 0 1 2 3 4 5 diye giden bir
3:16
vektör varsa ve siz ikinci pozisyondaki
3:19
elemanı isterseniz Rize 1 değerini
3:22
döndürür. İnanın bana bu küçük ama
3:24
hayati detay ileride saç baş yolmanızı
3:27
engelleyecek en temel kuraldır. Gelelim
3:30
Ram'ın o meşhur zorlama yani cojion
3:33
kuralına. Şunu unutmayın. RA dilinde
3:36
vektörler gerçekten çok titizdir.
3:38
İçlerinde aynı anda sadece tek bir veri
3:40
tipi barındırmak isterler. Düşünün ki
3:42
bir vektörün içine bir sayı, true gibi
3:45
mantıksal bir değer ve bir de elif gibi
3:47
bir metin koymaya çalıştınız. Ra bunu
3:50
gördüğü an veri kaybını önlemek için
3:52
hemen olaya müdahale eder. Gider
3:54
hiyerarşik olarak en kapsayıcı ve esnek
3:56
olan metin formatını seçer ve içerideki
3:58
her şeyi tırnak içinde karaktere
4:00
dönüştürür. Veliyi R için aldıktan sonra
4:03
anlamlandırmak için gruplandırmalar
4:05
yapmamız şart. İşte burada aggregate
4:07
fonksiyonu tam bir can kurtarandır.
4:09
Şuradaki kısa kod aslında bize şunu
4:11
söylüyor. Oturum gelirlerini al. Bunları
4:13
kullanıcı segmentlerine göre bir güzel
4:15
grupla ve sonra her segmentin
4:17
ortalamasını hesapla. Sağ taraftaki fan
4:20
kısmına yazdığımız min tam olarak bu
4:22
ortalama alma işini yapıyor. Sadece tek
4:25
satırda inanılmaz hızlı ve etkili bir
4:27
veri özeti çıkarmış oluyoruz. Diyelim ki
4:30
sitenize bağlanan en nadir cihazı bulmak
4:32
istiyorsunuz ama sadece bir rakam değil
4:35
doğrudan cihazın adını görmek
4:37
istiyorsunuz. Bu iş için üçlü bir
4:39
kombinasyon kullanıyoruz. Önce table ile
4:42
hangi cihazdan kaç tane var diye bir
4:44
frekans tablosu çıkarıyoruz. Sonra which
4:47
min ile frekansı en düşük olanın yerini
4:49
tespit ediyoruz ve son olarak names
4:52
fonksiyonuyla bu cihazın adı ne
4:54
sorusunun cevabını çekip alıyoruz.
4:57
Gördüğünüz gibi tek satırlı kusursuz bir
4:59
operasyon. Temel fonksiyonların
5:01
mantığını oturttuğumuza göre artık asıl
5:03
oyun alanımıza geçebiliriz. 3ün
5:06
bölümümüz veri çerçevelerinin yani data
5:08
frame'lerin yönetimi. Data frame
5:11
dediğimiz şey satır ve sütunlardan
5:13
oluşan şu klasik bildiğimiz iki boyutlu
5:15
tablo yapısı. Ama burada kesin bir kural
5:17
var. Tabloda farklı sütunlar, farklı
5:20
veri tipleri tutabilir. Mesela yaş
5:22
sütunu sayılardan, cinsiyet sütunu
5:24
metinlerden oluşabilir. Bunda bir sorun
5:26
yok. Ama dikey eksende baktığınızda bir
5:29
sütunun kendi içindeki tüm değerler
5:31
kesinlikle aynı veri tipinde olmak
5:33
zorundadır. Sütunlar kendi aralarında
5:35
farklı olabilir evet ama kendi içlerinde
5:37
tamamen homojen kalmak zorundadır. Peki
5:41
elinizde binlerce satırlık devasa bir
5:43
tablo varsa ve benim elimde tam olarak
5:46
ne var diye hızlıca yapısına bakmak
5:48
isterseniz ne yapacaksınız? İngilizce
5:51
structure kelimesinden gelen o küçücük
5:53
stronk işte burada devreye giriyor. Bunu
5:56
çalıştırdığınız anda ekranda beliren o
5:59
100 obs of 15 variables yazısı bize
6:01
verinin 100 gözlemden yani 100 satırdan
6:04
ve 15 değişkenden yani 15 sütundan
6:06
oluştuğunu saniyeler içinde özetliyor.
6:09
Tabii her şey her zaman bu kadar
6:11
kusursuz değil. Bazen verilerde
6:13
eksikler, boşluklar olur. Şimdi sizi
6:16
biraz düşünmeye davet ediyorum.
6:18
Tablonuzda bir hücre boş kalırsa veya
6:21
veriye ulaşılamazsa o çok güvendiğimiz,
6:24
üzerine titrediğimiz sütun yapımıza ne
6:26
olur? Tablomuz tamamen çöker mi? İşte
6:29
tam bu noktada sistemi çakıştan kurtaran
6:32
kahramanımız sahneye çıkıyor. Na yani
6:35
not available. Lütfen NA'yı sıradan bir
6:38
matematiksel sıfır ya da silinmiş bir
6:40
boşluk olarak düşünmeyin. Aslında o
6:43
eksik değeri temsil eden, yer tutan özel
6:46
bir yapıdır. Kendini otomatik olarak
6:48
sildirmez. Yerini inatla korur ve
6:50
böylece o sütunun, o vektörün yapısal
6:53
bütünlüğünün bozulmasını engeller.
6:55
Gerçekten harika bir koruyucu. Yalnız
6:58
ufak bir detay var. Nain bu koruyucu,
7:01
inatçı yapısı, ortalama gibi
7:03
matematiksel işlemler yaparken sorun
7:05
çıkarır. Çünkü içinde bilinmeyen bir
7:07
değer olan sütunun ortalamasını öylece
7:09
alamazsınız. R size anında hata
7:11
fırlatır. Bunu aşmak için ortalama
7:14
fonksiyonumuzun içine n. RM = true
7:17
argümanını ekliyoruz. Aslında R'ye
7:20
diyoruz ki sen bu ortalamayı hesapla ama
7:22
işlemi yaparken şu na yer tutucularını
7:25
bir zahmet görmezden gel. Kesin ve
7:27
güvenli çözüm. Veri temizliğinden madem
7:30
bahis açtık devam edelim. Tablodaki o
7:32
can sıkıcı mükerrer satırlardan
7:34
kurtulmak için mantıksal bir ters
7:36
çevirme yapıyoruz. Sadece ünlem
7:38
işaretini yani değil operatörünü alıp
7:41
duplicated fonksiyonunun önüne
7:43
koyuyoruz. Böylece tekrar edenleri at,
7:46
tekrar etmeyen benzersiz olanları tut
7:48
demiş oluyoruz. ve veri çerçevemiz bir
7:50
anda tertemiz eşsiz satırlardan oluşan o
7:53
pürüzsüz formuna kavuşuyor. Temizlenmiş,
7:56
hatalardan arınmış harika bir verimiz
7:59
var. Artık makine öğrenmesi
8:00
algoritmalarıyla verimiz arasındaki o
8:02
son köprüyü kurmaya hazırız. 4.
8:05
bölümümüz veri ön işleme. Yapay zeka ve
8:09
makine öğrenmesi modellerini en çok
8:10
yanıltan, kafasını karıştıran şeyler
8:12
aykırı değerlerdir. Uçuk kaçık veriler
8:15
yani. Ekranda gördüğünüz bu formüllerin
8:17
zihinsel bir fotoğrafını çekmenizi
8:19
kesinlikle tavsiye ederim. Bu
8:20
istatistiksel bir standart olan
8:22
çeyrekler arası aralık yani IQR
8:24
yöntemidir. Alt ve üst sınır
8:27
formüllerini hesaplayarak bu normal
8:28
aralığın dışında kalan tüm o sinsi
8:30
aykırı noktaları kolayca yakalayıp izole
8:33
edebilirsiniz. Algoritmalar çok zekidir.
8:35
Evet. Ama insanların anladığı
8:37
harflerden, kelimelerden hiç anlamazlar.
8:39
Tamamen sayılarla, matematiksel
8:41
denklemlerle çalışırlar. İşte burada
8:44
dumy coding yani yapay kodlama dediğimiz
8:46
işlem mükemmel bir tercüman gibi devreye
8:49
girer. Gider kadın, erkek veya İstanbul,
8:52
Ankara gibi kategorik metinsel verileri
8:54
alır ve bunları yapay zekanın sorunsuz
8:57
hesaplayabileceği 0 ve 1 gibi ikili
8:59
sayısal kolonlara çevirir. Tam bir
9:01
çevirmenlik işi. Makine öğrenmesi için
9:04
bir diğer olmazsa olmazımız da verileri
9:07
aynı dile, aynı ölçeğe çekmektir. Buna
9:10
normalizasyon diyoruz. Ardaki o meşhur
9:13
carit paketini kullanarak bir preprocess
9:15
işlemi yapıyoruz. Metot kısmına range
9:18
yazdığımızda bu komut sihirli bir
9:20
şekilde sayısal verimizin orijinal
9:22
dağılımını hiç bozmadan onu 0 ile 1
9:25
aralığına mükemmel bir şekilde
9:26
sıkıştırıyor. Min max normalizasyonunun
9:29
en pratik yolu budur. Ve işte böylece
9:31
sürecin sonuna geldik. Bir veri
9:33
noktasının baştan hoca yolculuğuna
9:35
birlikte şahit olduk. Sorumuzu sorduk.
9:37
Web kaynaklarından veriyi çektik. R ile
9:40
temizledik. ön işlemeden geçirdik ve
9:42
algoritmalar için hazır hale getirdik.
9:44
Ama şunu unutmamak lazım. Veri analitiği
9:47
bir kere yapılıp biten düz bir çizgi
9:48
değildir. Sürekli dönen, bitmek bilmeyen
9:51
bir çarktır. Sizi şu düşünceyle baş başa
9:53
bırakmak istiyorum. Tüm bu meşakkatli
9:55
sürecin sonunda bulduğunuz o ilk net
9:57
cevap acaba verilerinizin
9:59
derinliklerinde saklı olan hangi devasa
10:01
yeni soruyu günüzüne çıkaracak? Bu
10:03
analizde bana katıldığınız için çok
10:05
teşekkürler. Bir sonraki veri keşfimizde
10:07
görüşmek üzere.
#Jobs & Education

