Auzef Makine Öğrenmesi 2024-2025 Vize Soruları (Bahar)
https://lolonolo.com/2026/03/08/makine-ogrenmesi-2024-2025-vize-sorulari-bahar/
https://lolonolo.com
Show More Show Less View Video Transcript
0:00
Makine öğrenmesi kulağa biraz karmaşık
0:02
gelebilir, değil mi? Ama aslında öyle
0:03
değil. Gelin bu konuyu günlük hayattan
0:05
basit bir örnekle hep birlikte çözelim.
0:07
Devasa verilerin nasıl olup da anlamlı
0:09
bilgilere dönüştüğünü adım adım
0:11
göreceğiz. Hazırsanız haydi başlayalım.
0:14
İşte bugünkü temel problemimiz tam
0:16
olarak bu. Düşünün. Elinde milyonlarca
0:18
müşterisi olan bir e-ticaret şirketi var
0:21
ve bu şirketin elinde dağ gibi bir veri
0:23
var. Ama bu veri yığını tek başına
0:25
hiçbir şey ifade etmiyor. Değil mi? İşte
0:27
asıl soru bu. Bu ham veriden işe yarar
0:30
anlamlı sonuçları nasıl çıkaracağız?
0:33
Herhangi bir öğrenme olayına girmeden
0:35
önce ilk yapmamız gereken şey elimizdeki
0:38
ham maddeyi yani verinin ta kendisini
0:41
anlamak. Bunu devasa bir yapboz gibi
0:43
düşünebilirsiniz. Yapbozu çözmeye
0:45
başlamadan önce ne yaparsınız? Tabii ki
0:47
önce parçaları bir tanırsınız,
0:49
ayırırsınız. İşte o yakbozdaki ilk
0:52
adımımız bu. Parçaları ayırmak.
0:54
Elimizdeki bu karışık parçaları yani
0:56
veri türlerini bir tanımamız lazım.
0:58
Çünkü makineye neyle çalıştığını
1:00
söylemezseniz ondan bu parçaları alıp
1:02
anlamlı gruplara ayırmasını falan
1:04
bekleyemezsiniz. Mümkün değil. Bakın en
1:07
temelde veriyi ikiye ayırıyoruz. Bir
1:09
yanda sayılarla ifade ettiğimiz şeyler
1:11
var. Bunlara sayısal veri diyoruz. Diğer
1:13
yanda ise etiketler, gruplar var.
1:15
Bunlara da kategorik veri diyoruz.
1:17
Yapacağımız her şeyin temeli işte bu.
1:18
İki ayrıma dayanıyor. Şimdi sayısal
1:21
verilerin de alt türleri var. Mesela
1:23
ayrık veri. Bunlar adı üstünde
1:26
sayabildiğimiz tam sayılar. Şöyle
1:28
düşünün. Bir çağrı merkezine gelen
1:30
aramalar. Hiç yarım arama gelir mi?
1:33
Gelmez değil mi? Ya bir arama gelir, ya
1:35
2, ya 10. İşte bu yüzden bu klasik bir
1:37
ayrık veri örneğidir. Kategorik
1:39
verilerde de durum ilginçleşiyor. Mesela
1:42
sıralı verilere bakalım. Küçük, orta,
1:44
büyük gibi etiketler. Bunlar sadece
1:46
birer isim değil. Aralarında doğal bir
1:48
sıra bir hiyerarşi var. Yani büyüğün
1:51
küçükten daha büyük olduğunu hepimiz
1:53
biliyoruz. İşte bu yüzden onlara sıralı
1:55
veri diyoruz ve bu sıra makine için çok
1:57
anlamlı. Tamamdır. Artık verilerimizi
2:00
tanıyoruz. Neyin ne olduğunu anladık,
2:02
düzenledik. Harika. Şimdi bir sonraki ve
2:06
belki de en heyecanlı adıma geçebiliriz.
2:08
Makineye bu verilerden nasıl bir şeyler
2:11
öğreneceğini söylemek. Yani bir oyun
2:13
planı, bir strateji belirlemek. Burada
2:16
karşımıza iki ana strateji çıkıyor.
2:18
Birincisi danışmanlığı öğrenme. Bunu
2:20
cevapları arkasında yazan bilgi
2:22
kartlarıyla ders çalışmaya
2:24
benzetebilirsiniz. Yani makineye hem
2:26
soruyu veriyorsunuz hem de doğru cevabı.
2:28
Diğeri ise danışmansız öğrenme. Bu da
2:31
daha çok elinizde hiçbir talimat olmadan
2:34
bir kutu Lego'yu kendi kendinize
2:36
renklerine ya da şekillerine göre
2:37
ayırmaya benziyor. Makine verideki doğal
2:40
grupları kendi başına keşfetmeye
2:42
çalışıyor. Peki pratikte bu ne işe
2:44
yarıyor? danışmanlığı öğrenmeyle mesela
2:46
bu e-posta spam mı değil mi gibi bir
2:48
sınıflandırma yapabiliriz ya da bu evin
2:50
fiyatı ne kadar olur gibi bir tahminde
2:52
bulunabiliriz. Danışmansız öğrenme ise
2:55
işte bizim örneğimizdeki gibi benzer
2:57
müşterileri bir araya toplamak yani
2:58
kümelemek için harika veya sistemdeki
3:01
bir sahtekarlığı yani olağan dışı bir
3:03
durumu tespit etmek için de kullanılır.
3:05
Şimdi bizim e-ticaret şirketimize geri
3:07
dönelim. Amacımız neydi? Müşterileri
3:10
önceden belirlenmiş etiketlere göre
3:11
değil, kendi davranışlarına göre doğal
3:14
gruplara ayırmak. Yani elimizde bir
3:16
cevap anahtarı yok. İşte bu yüzden
3:18
ihtiyacımız olan strateji çok net.
3:20
Danışmansız öğrenme. Stratejimiz tamam.
3:23
Danışmansız öğrenme. Peki şimdi bu
3:25
stratejiyi hayata geçirecek doğru aracı
3:27
seçme zamanı. Bu görev için
3:29
kullanacağımız aracın adı K ortalamalar
3:32
veya popüler adıyla K means algoritması.
3:35
Peki bu K ortalamalar ne yapıyor?
3:37
Aslında tam da bizim ihtiyacımız olan
3:39
şeyi yapıyor. Bütün veri noktalarını
3:41
alıyor ve birbirine en çok benzeyenleri
3:44
aynı gruba, aynı kümeye koyuyor.
3:46
E-ticaret firmaları için müşteri
3:47
segmentasyonu yapmak yani müşterileri
3:50
gruplara ayırmak için resmen biçilmiş
3:52
kaftan. Peki algoritma bu grupları nasıl
3:55
buluyor? Aslında süreç çok mantıklı
3:57
ilerliyor. İlk olarak siz makineye ben k
4:00
tane küme istiyorum diyorsunuz. Yani kaç
4:02
grup istediğinizi söylüyorsunuz. Sonra
4:04
her bir veri noktası kendisine en yakın
4:07
olan grubun bir parçası oluyor. Ama
4:09
durum bitmedi. Gruplar değiştikçe
4:11
grupların merkez noktaları da yeniden
4:13
hesaplanıyor ve bu işlem ta ki herkes en
4:16
doğru grubunu bulana yani sistem stabil
4:18
hale gelene kadar tekrar tekrar devam
4:20
ediyor. Hadi gelin bunu somut bir
4:23
örnekle görelim. Diyelim ki algoritmamız
4:25
çalıştı ve küme merkezlerini bu
4:27
tablodaki gibi belirledi. Her şey
4:29
harika. Şimdi sisteme yepyeni bir
4:32
müşteri geliyor. Veri noktası yani
4:34
koordinatları 3,6.
4:37
İşte kritik soru. Bu yeni müşteri hangi
4:39
gruba dahil olmalı? Cevap aslında
4:42
oldukça basit. K ortalamalar algoritması
4:45
bu yeni müşterinin her bir küme
4:47
merkezine olan matematiksel uzaklığını
4:50
tek tek hesaplıyor. Ve sonuç ne çıkıyor
4:54
dersiniz? 3,6 noktası en çok küme 2'nin
4:58
merkezi olan 2,5'e yakın. Ve işte bu
5:02
kadar. Yeni müşterimiz artık resmen küme
5:04
2'nin bir üyesi. Harika. Kümeleri
5:07
oluşturduk ama işimiz bitti mi? Hayır.
5:10
Daha yeni başlıyor. Bu gruplar ne anlama
5:13
geliyor? Asıl önemli olan bu. Sonuçları
5:15
yorumlamak, onlara bir anlam vermek, en
5:18
az kümeleri oluşturmak kadar önemli.
5:20
Belki küme 1 fırsat avcıları, küme 2 ise
5:23
sadık müşterilerdir. İşte bunu anlamamız
5:26
lazım. Bu sonuçları anlamak için
5:28
kullanacağımız çok güçlü bir araç var.
5:30
Kutu grafiği yani Boxplat. Bu grafik
5:33
sayesinde oluşturduğumuz her bir kümenin
5:36
mesela harcama alışkanlıklarının
5:38
dağılımını çok net bir şekilde
5:39
görebiliyoruz. Belki bir grup sürekli
5:42
küçük harcamalar yapıyordur. Diğer grup
5:44
ise nadinen ama çok büyük alışverişler
5:46
yapıyordur. Ve daha da önemlisi bu
5:49
grafikler grubun geri kalanından çok
5:51
farklı davranan aykırı müşterileri şak
5:53
diye ortaya çıkarır. Şimdi e-ticaret
5:56
örneğimizi bir saniyeliğine kenara
5:58
bırakalım. Farz edelim ki görevimiz
6:00
müşterileri gruplamak değil de bir
6:02
müşterinin kredi riskinin düşük mü yoksa
6:04
yüksek mi olacağını tahmin etmek. Bu
6:06
artık bir sınıflandırma problemi değil
6:08
mi? Peki o zaman modelimizin ne kadar
6:10
başarılı olduğunu nasıl ölçerdik? İşte
6:12
tam bu noktada kontenjans tablosu
6:15
devreye giriyor. Bu tablo modelin
6:17
tahminleriyle gerçek sonuçları
6:18
karşılaştırıyor ve bize adeta bir karne
6:21
veriyor. Bu hayali risk tahmini
6:23
senaryomuzda tablodaki en kritik yerler
6:26
modelin doğru tahmin yaptığı kutucuklar.
6:29
Gelin özellikle şu 10 rakamına bir
6:31
odaklanalım. Bu 10 sayısı ne demek
6:33
biliyor musunuz? Şu demek. Gerçekte
6:35
düşük riskli olan ve bizim modelimizin
6:38
de doğru bir şekilde düşük riskli olarak
6:40
etiketlediği müşteri sayısı. Yani bu tam
6:43
bir başarı. Genelde tablodaki bu çapraz
6:45
çizgi yani köşegen bize modelin
6:48
nerelerde doğruyu bulduğunu net bir
6:50
şekilde gösterir. Gördüğünüz gibi bir
6:52
yığın ham veriden yola çıktık.
6:54
Müşterileri anlamlı gruplara ayırdık.
6:56
Hatta bir tahmin modelinin başarısını
6:58
nasıl ölçebileceğimizi bile gördük. İşte
7:01
makine öğrenmesinin gücü tam olarak bu.
7:03
Peki madem makineların bu kadar etkili
7:06
bir şekilde örüntü bulmasını
7:07
sağlayabiliyoruz, o zaman onlardan bir
7:09
sonraki adımda insanlık için daha hangi
7:12
büyük problemleri çözmelerini
7:13
istemeliyiz? İşte bu üzerinde düşünmeye
7:16
değer bir soru.

