Auzef Büyük Veri 2023-2024 Final Soruları
https://lolonolo.com/2026/04/23/buyuk-veri-2023-2024-final-sorulari/
https://lolonolo.com
Show More Show Less View Video Transcript
0:00
Merhaba. Büyük verinin derinliklerine
0:02
daldığımız bu analize hoş geldiniz.
0:04
Şimdi bir üniversite final sınavından
0:06
ilham alarak bu devasa konunun temel
0:08
kavramlarını ve sırlarını birlikte
0:09
aralayacağız. Önümüzde beş adımlık bir
0:12
yol haritası var. Önce temel fikri
0:14
anlayacağız. Sonra veriyi nasıl
0:15
koruduğumuza bakacağız. Ardından gerçek
0:17
hayattan örneklere dalacağız. Bu işin
0:19
mutfağına yani makine dairesine ineceğiz
0:22
ve en sonunda da tüm parçaları
0:23
birleştirip büyük resmi göreceğiz.
0:25
Hazırsanız başlayalım. Tamam. Hadi en
0:28
temelden başlayalım. Büyük veri
0:30
dediğimiz şey bildiğimiz performans
0:32
kurallarını nasıl oluyor da altüst
0:34
ediyor? Gelin bu sorunun peşine düşelim.
0:37
İşte bu hepimizin aklına gelen ilk soru
0:39
değil mi? Ama cevap hiç de o kadar basit
0:41
değil. Aslında her şey elinizdeki
0:44
araçlara bağlı. Yani doğru aletle evet
0:47
daha fazlası daha iyi ama yanlış aletle
0:50
felaket olabilir. İşin ilginçleştiği yer
0:52
de tam olarak burası. İşte bakın bu
0:55
tablo büyük veri ile ilgili en büyük
0:57
efsanelerden birini yıkıyor. Geleneksel
1:00
yani klasik algoritmalar belli bir
1:02
miktar veriden sonra tıkanıp kalıyor.
1:04
Daha iyileşmiyor. Ama derin öğrenme
1:07
modelleri onlar tam tersi. Veriye adeta
1:10
aç. Ne kadar çok veri verirseniz
1:12
performansları o kadar artıyor. Roket
1:15
gibi yükseliyor. Çünkü bu modeller tıpkı
1:17
insan beyni gibi veriden sürekli yeni
1:20
şeyler öğreniyor ve kendini
1:21
geliştiriyor. Ve sanılanın aksine bu
1:24
teknoloji gökten zembille inmedi.
1:26
Kökleri aslında çok daha eskiye
1:28
bildiğimiz istatistik bilimine
1:30
dayanıyor. Yani yüzlerce yıllık bir
1:32
bilgelik bugünün inanılmaz işlem gücüne
1:35
sahip bilgisayarlarıyla buluşuyor. Olay
1:38
aslında bu. İyi. Güzel. Elimizde
1:40
böylesine muazzam bir güç var. Peki bu
1:43
gücü kontrol altında tutmazsak ne olur?
1:45
İşte bu noktada dijital dünyanın
1:47
koruyucuları yani veri güvenliği ve
1:50
mahremiyet devreye giriyor. Bütün veri
1:52
güvenliği dünyası aslında üç temel sütun
1:55
üzerine kurulu. Gizlilik, bütünlük ve
1:58
erişilebilirlik.
1:59
Sektörde buna cıı üçlüsü deniyor ama
2:02
merak etmeyin istihbarat teşkilatıyla
2:04
hiçbir ilgisi yok. Bu üçü bir arada
2:06
olmadığında veri kalemiz en zayıf
2:08
halkasından kopar. Anonimleştirmenin
2:11
asıl amacı veriyi bir kasaya kilitlemek
2:13
değil. Tam tersi verinin üzerindeki
2:16
kimlik etiketlerini söküp atarak ona bir
2:19
nevi görünmezlik pelerini giydirmek.
2:21
Böylece o veri hem kimsenin
2:23
mahremiyetini ihlal etmeden özgürce
2:25
dolaşıp analiz edilebilir hem de
2:27
içindeki değerli bilgiyi sunmaya devam
2:29
eder. İşte Türkiye'deki kişisel verileri
2:33
koruma kanunu yani KVKK gibi
2:35
düzenlemeler de bu dijital kalemizi
2:38
korumak için çok katmanlı bir savunma
2:40
hattı kurulmasını istiyor. saldırı
2:42
tespit sistemleri, yetki kontrolleri, ağ
2:45
güvenliği, sızma testleri, bunların
2:48
hepsi o kalenin duvarlarını
2:50
sağlamlaştırmak için var. Ve işte belki
2:53
de en sık yapılan hata amaç veriyi
2:56
analizden korumak asla değil. Amaç
2:58
analizi güvenli hale getirmek, veri
3:01
üzerindeki analizi tamamen engellemek,
3:03
okyanusun ortasında bir hazine haritası
3:05
bulup tehlikeli olabilir diye okumayı
3:08
reddetmekle aynı şey. E o zaman büyük
3:10
verinin ne anlamı kalır ki? Peki
3:12
yeterince teorik konuştuk. Gelin şimdi
3:15
sahaya inelim. Bu teknoloji istihbarat
3:17
operasyonlarından hastane koridorlarına
3:19
kadar dünyamızı somut olarak nasıl
3:22
değiştiriyor ona bakalım. Bir anlana
3:24
düşünün. Milyonlarca telefon görüşmesi,
3:26
e-posta, finansal işlem. Bu veri
3:29
okyanusunun içinde bir yerlerde saklanan
3:31
o kritik ipucunu nasıl bulursunuz? İşte
3:33
büyük verinin çözmeye çalıştığı devasa
3:35
problem tam da bu. Samanlıkta iğne
3:37
aramak gibi ama samanlık gezegen
3:39
boyutunda. Bu alandaki en gizemli ve en
3:42
güçlü oyunculardan biri de Palandir.
3:44
Gothan ve Metropolis gibi filmlerden
3:46
fırlamış isimlere sahip yazılımlarıyla
3:48
birbirinden tamamen alakasız görünen
3:50
veri kaynaklarını bir araya getirip
3:52
analistlerin önüne anlamlı bir resim
3:53
koyuyorlar. Özel sektörde ise sınırlar
3:56
çok daha net. Mesela Enerjisan'ın kendi
3:58
10 milyon müşterisinin verisini tek bir
3:59
çatı altında toplaması, veriyi
4:01
temizlemesi gayet normal bir iş süreci.
4:04
Ama bu veriyi alıp tamamen alakasız olan
4:06
Milli Eğitim Bakanlığı verisiyle
4:07
birleştirmesi bu hem yasal olarak
4:09
imkansız hem de mantıksal olarak elmayla
4:12
armudu toplamaya çalışmak gibi bir şey
4:13
olurdu. Sağlık sektörünü düşünelim. Veri
4:16
her yerden akıyor. MR cihazlarından,
4:19
doktorun yazdığı notlardan hatta bizim
4:22
randeva alma alışkanlıklarımızdan bile.
4:24
İşte bu üç farklı kaynaktan gelen
4:26
veriler birleştiğinde salgınları önceden
4:29
tahmin etmekten tutun da kişiye özel
4:31
kanser tedavileri geliştirmeye kadar
4:33
inanılmaz bir potansiyel ortaya çıkıyor.
4:36
Tabii bu kadar hassas bir verinin
4:38
ortalıkta dolaşması düşünülemez. Bu
4:40
yüzden Türkiye Sağlık Bakanlığı, Sağlık
4:43
Bilişim Ağı yani kısaca ESBA adında özel
4:46
bir dijital otoyol kurmuş. Bu kapalı
4:49
devre sistem sayesinde hastaneler ve
4:51
diğer sağlık kuruluşları arasındaki veri
4:53
akışı hem çok hızlı hem de çok güvenli
4:56
bir şekilde sağlanıyor. Peki bu devasa
4:59
veri gemisini yürüten motorlar ne?
5:02
Makine dairesinde hangi teknolojiler,
5:04
hangi mimariler çalışıyor? Gelin şimdi
5:07
biraz da işin tekniğine bakalım.
5:09
Karşımıza çıkan ilk ilginç kavram
5:11
ontoloji. Kulağa çok felsefi gelse de
5:13
aslında yaptığı iş çok pratik. Makineler
5:15
için bir nevi gramer kitabı yazıyor.
5:18
Yani bir bilgisayara Ankara'nın bir
5:20
şehir olduğunu, şehrin bir yerleşim yeri
5:23
olduğunu öğreterek veriler arasında
5:25
anlamlı bağlantılar kurmasını sağlıyor.
5:28
Günümüzün en popüler veri işleme
5:30
araçlarından Apachi Spark'a baktığımızda
5:33
ise mükemmel bir iş bölümü görüyoruz.
5:35
Bir küme yöneticisi var. adeta bir hava
5:38
trafik kontrolörü gibi ana programdan
5:41
gelen iş talebini alıyor ve bunu en
5:43
uygun işçi düğümlerine dağıtarak her
5:46
şeyin düzenli ve hızlı bir şekilde
5:48
ilerlemesini sağlıyor. Python gibi
5:51
dillerle çalışanlar için PE Park
5:53
kütüphanesi ise bu devasa işlemleri
5:55
çocuk oyuncağına çeviriyor. Düşünsenize
5:58
milyarlarca satırlık bir verinin içinden
6:00
sadece ilk 10 satırı görmek için tek 10
6:03
yazmanız yeterli. Ya da bir metindeki
6:06
bütün kelimeleri saymak için reduce by
6:08
key gibi basit bir komut
6:09
kullanabiliyorsunuz. Eskiden günler
6:12
süren işler şimdi birkaç saniyede hall
6:14
oluyor. Tamam makine dairesinden çıktık.
6:17
Şimdi geminin güvertesine çıkıp ufka
6:21
yani büyük resme bakma zamanı. Bu
6:23
teknolojiler toplumları ve şirketleri
6:26
nereye götürüyor? Mesela açık veri
6:28
kavramı. Buradaki amaç sadece devletin
6:31
daha şeffaf olması değil. Asıl amaç o
6:34
veriyi alıp yeni bir şeyler üretecek
6:36
insanları yani inovasyonu tetiklemek.
6:39
Devlet trafik yoğunluğu verisini halka
6:41
açtığında bir girişimci çıkıp bundan
6:43
harika bir navigasyon uygulaması
6:45
yaratabiliyor. İnovasyon tam olarak
6:47
böyle bir şey. Bir kurumun bu alandaki
6:50
başarısını ölçerken de bulduğu sonuçlara
6:52
yani tuttuğu balığa bakmamak lazım. Asıl
6:55
bakılması gereken şey o balığı tutma
6:57
kapasitesi. Yani veri yönetimi nasıl,
7:00
analitik çözümleri ne durumda? Ve en
7:02
önemlisi bütün bunları destekleyen bir
7:04
kurumsal stratejisi var mı? Başarı
7:06
burada gizli. Ve sonuç olarak tüm bu
7:08
konuştuklarımız bizi tek bir kritik
7:10
soruya getiriyor. Tüm bu temeller
7:12
ışığında siz ya da çalıştığınız kurum bu
7:14
veri devriminin neresindesiniz? Kenardan
7:17
izleyenlerden mi yoksa sahaya inip
7:19
oyunun kurallarını yeniden yazanlardan
7:21
mı?

