Auzef Büyük Veri 2024-2025 Vize Soruları
https://lolonolo.com/2026/02/27/ata-aof-fitness-uygulamalari-2024-2025-vize-sorulari/
Bu kaynaklar, 2024-2025 eğitim dönemi Büyük Veri vize sınavı hazırlığı için oluşturulmuş kapsamlı soru ve çalışma rehberlerinden oluşmaktadır. Metinlerde veri mahremiyeti, anonimleştirme ve açık veri gibi temel güvenlik ve paylaşım ilkeleri detaylıca açıklanmaktadır. Ayrıca büyük verinin yapısal sınıflandırması, tarihsel gelişimi ve semantik web teknolojisinin unsurları gibi teknik konulara dair akademik bilgiler sunulmaktadır. Sınavda çıkabilecek kavramsal farkları vurgulayan bu dokümanlar, data mart ve bilgi piramidi gibi organizasyonel ve teorik modelleri de içermektedir. Son olarak, büyük veri ekosisteminde kullanılan analiz araçları ve etik kaygılar üzerinden öğrencilere kapsamlı bir ders özeti sunulmaktadır.
https://lolonolo.com
Show More Show Less View Video Transcript
0:00
Herkese merhaba, hoş geldiniz. Bugün
0:02
aslında hepimizin içinde yaşadığı devasa
0:05
bir hikayeyi konuşacağız. Büyük veri.
0:08
Ama durun hemen korkmayın. Bu konuyu
0:10
öyle sıkıcı, teknik bir terim gibi değil
0:13
de hayatımızı nasıl şekillendirdiğini
0:15
gösteren heyecanlı bir macera gibi ele
0:18
alacağız. Şimdi dürüst olalım. Büyük
0:20
veri kelimesini duyunca aklınıza ne
0:22
geliyor? Şöyle gözünüzün önüne gelen şey
0:24
devasa kontrol edilemez bir kaos mu
0:27
yoksa içinde müthiş fırsatlar barındıran
0:29
bir hazine mi? İşte bu sunumda bu
0:31
karmaşık görünen dünyayı alıp en
0:33
temelinden başlayarak herkesin
0:35
anlayabileceği kristal gibi berrak bir
0:37
hale getireceğiz. Peki büyük demeden
0:40
önce gelin önce verinin kendisini bir
0:42
anlayalım. Yani bu veri dediğimiz şey
0:45
neye benziyor? Aslında onu maddenin üç
0:48
hali gibi düşünebilirsiniz. Katı, sıvı
0:51
ve gaz. Hepsi farklı bir formda. İşte o
0:55
üç hal tam olarak burada. Bakın en solda
0:58
yapısal veri var. Bu bildiğiniz düzenli
1:00
Excel tablosu gibi. Her şey yerli
1:02
yerinde. Sütunlar, satırlar. Sonra
1:05
ortada yarı yapısal veri. Mesela bir
1:08
e-posta. Kimden geldiği konusu belli ama
1:10
içindeki metin biraz daha serbest. Ve en
1:13
sağda da yapısal olmayan veri var ki
1:16
işte bu tam bir curcuna. Bir aile
1:18
videosu. Sosyal medyadaki bir fotoğraf.
1:20
Yani günümüzdeki verinin aslan payını
1:23
oluşturan o harika, yaratıcı karmaşa iyi
1:26
de bu kadar farklı türde veri varken
1:28
yani bu veri okyanusunda boğulmadan
1:30
yolumuzu nasıl bulacağız? İşte bu kaosu
1:32
evcilleştirmek için sistemler kuruyoruz.
1:34
Gözünüzde devasa bir dijital süpermarket
1:37
canlandırın. Süpermarket benzetmesinden
1:39
devam edelim. Şimdi bütün süpermarketin
1:41
kendisi yani her şeyin olduğu yer bizim
1:43
veri ambarımız. Ama diyelim ki siz
1:46
sadece ekmek almak istiyorsunuz. Bütün
1:48
markette dolaşır mısınız? Hayır,
1:50
doğrudan unlu mamuller reyonuna
1:51
gidersiniz. İşte datamart ya da bizim
1:54
deyişimizde veri reyonu tam olarak bu.
1:57
Sadece pazarlama veya sadece finans
1:59
departmanının ihtiyacı olan verilerin
2:00
toplandığı özel bir bölüm. Çok daha
2:02
hızlı, çok daha verimli. Tamam, veriyi
2:05
topladık, düzenledik. E sonra bu verinin
2:08
bir anlam kazanması, bir işe yaraması
2:10
lazım, değil mi? İşte bu noktada
2:11
karşımıza bilgi piramidi çıkıyor. En
2:14
altta ham veriler var. Yani anlamsız
2:16
sayılar ve semboller. Bir üst basamakta
2:18
bu verileri işleyip bağlam
2:20
kazandırıyoruz ve enformasyon elde
2:22
ediyoruz. Sonra bu enformasyonu kendi
2:24
deneyimlerimizle birleştirince bilgiye
2:26
ulaşıyoruz ve en tepede bu bilgiyi
2:29
kullanarak doğru kararlar verdiğimizde
2:31
işte o zaman bilgeliğe erişmiş oluyoruz.
2:33
Yani ham rakamlardan akıllıca kararlara
2:36
uzanan bir yolculuk bu. Veriyi topladık,
2:38
anlamlandırdık. Artık bilgece kararlar
2:40
verebiliyoruz. Harika. Ama burada çok
2:43
ama çok önemli bir soru ortaya çıkıyor.
2:45
Bir yanda verinin paylaşılmasıyla elde
2:48
edilecek kamu yararı var. Diğer yandaysa
2:50
hepimizin kişisel mahremiyeti. İşte bu
2:53
ikisi arasında sürekli bir çekişme
2:55
yaşanıyor. Bakın bu iki kavram adeta zıt
2:58
kutuplar gibi. Sol tarafta açık veri
3:01
var. Onun amacı ne? Şeffaflık, paylaşım.
3:04
Diyor ki, "Bilgiyi erişilebilir kılalım
3:06
ki herkes faydalansın, yenilik artsın."
3:09
adeta duvarları yıkmaya çalışıyor. Sağ
3:12
tarafta verim mahremiyeti var. O da
3:14
diyor ki, "Dur bakalım. Bireylerin
3:16
kişisel bilgilerini kontrol etme hakkı
3:18
her şeyden önemli. O da bizi korumak
3:21
için çitler örüyor. İşte bu ikisi
3:23
arasındaki dengeyi bulmak zorundayız.
3:25
Veri mahremiyetini konuşurken sıkça
3:27
şöyle bir ideal ortaya atılır.
3:29
Anonimleştirme sırasında kesinlikle
3:31
sıfır veri kaybı olmalı. Yani hem
3:34
kimlikleri tamamen gizleyelim hem de
3:36
verinin kendisinden zerre kadar eksilme
3:38
olmasın. Kulağa harika geliyor değil mi?
3:41
Ama acaba bu gerçek hayatta mümkün mü?
3:44
İşte acı ama gerçek. Hayır mümkün değil.
3:47
Gerçek dünya bir mahremiyet
3:49
kullanışlılık ödünleşimi üzerine kurulu.
3:51
Yani birinden bir miktar feraget etmek
3:53
zorundasınız. Düşünün bir veriyi o kadar
3:56
çok anonimleştirirseniz ki kimseye ait
3:58
olduğu anlaşılamaz hale gelirse o veri
4:00
aynı zamanda işe yaramaz hale de
4:02
gelebilir. Bu bir denge sanatı. Bu
4:04
alanda çalışanlar veya sınavlara
4:06
hazırlananlar için küçük bir not. Adeta
4:09
bir sınav tiosu diyelim. Bakın
4:10
terminoloji ne kadar önemli. Statik veri
4:13
maskeleme diye doğru bir yöntem var ama
4:15
sınavlarda sizi tuzağa düşürmek için
4:17
buna çok benzeyen durağan veri maskeleme
4:19
diye bir şık koyuyorlar. Bu tamamen
4:21
uydurma bir terim. Böyle bir yöntem yok.
4:24
Bu bile bize gösteriyor ki bu alanda her
4:26
kelimenin ne anlama geldiğini net bir
4:28
şekilde bilmek çok kritik. Peki tüm bu
4:31
veri işleme analiz etme işlerini nasıl
4:33
yapıyoruz? Kullandığımız araçlar sanki
4:35
son 10 yılda ortaya çıkmış gibi
4:37
gelebilir ama aslında bu hikayenin
4:39
kökleri çok daha derinlerde. Yüzyıllar
4:42
öncesine dayanan fikirler var işin
4:43
içinde ve tabii ki günümüzün güçlü
4:45
dijital motorları. Bakın, yolculuk
4:48
1663'te başlıyor. John Grant adında bir
4:51
adam Londra'daki ölüm kayıtlarını alıp
4:54
analiz ediyor ve modern istatistiğin
4:57
temellerini atıyor. Resmen büyük verinin
4:59
ilk tohumları. Yıllar sonra 1959'a
5:02
geldiğimizde ise Arthur Samuel bir IBM
5:05
bilgisayarına dam oynamayı öğretiyor.
5:08
Ama ne öğretmek? Bilgisayar oynadıkça
5:11
Samuel'den daha iyi oynamaya başlıyor.
5:13
İşte o an makine öğrenimi terimi
5:15
doğuyor. Gelelim bugüne. Elimizde bir
5:18
sürü araç var ama her alet her işi
5:20
yapmaz. Değil mi? Çekiçle vida sıkmaya
5:22
çalışmak gibi bir şey olur. Bakın veri
5:25
işleme için map reduce doğru.
5:27
Görselleştirme için Google Charts
5:29
kesinlikle. Peki ya sorgu dili olarak
5:32
tablo? İşte bu en sık yapılan hatalardan
5:35
biri. Tablo bir sorgu dili değildir. O
5:38
elinizdeki veriyi alıp insanların
5:40
anlayacağı harika grafiklere dönüştüren
5:42
bir görselleştirme aracıdır. Bu ayrım
5:44
çok önemli. Araçlar inanılmaz derecede
5:47
güçlendi ama bu güçle birlikte devasa
5:50
sorumluluklar da geliyor. Artık sadece
5:52
teknik meseleleri değil işin insani ve
5:55
etik yönünü de konuşmamız gerekiyor.
5:57
Neden mi? Çünkü bu kararlar, bu
6:00
algoritmalar hepimizin hayatına doğrudan
6:02
dokunuyor. Bakın büyük verideki asıl
6:05
endişe kaynağı verinin büyük olması
6:07
değil. O teknik bir zorluk çözülür. Asıl
6:09
kaygılarımız şunlar. Benim kişisel
6:11
bilgilerimi kim ne için kullanıyor?
6:14
Verilerim siber saldırılara karşı
6:15
güvende mi? Ve belki de en önemlisi
6:18
hakkımda karar veren algoritmalar bana
6:20
karşı önyargılı olabilir mi? İşte bunlar
6:23
işin insani boyutunu oluşturan gerçek ve
6:25
büyük kaygılar. Ve sonunda her şey gelip
6:28
şu can alıcı soruya dayanıyor. Veriyle
6:31
şekillenen bu geleceği biz insanlar mı
6:33
kontrol edeceğiz yoksa yazdığımız
6:36
algoritmalar mı? İşte bu yüzden büyük
6:38
veriyi anlamak sadece mühendislerin,
6:40
veri bilimcilerin işi değil. Bu dijital
6:42
çağda yaşayan her bilinçli vatandaşın
6:44
sorumluluğu. Vakit ayırıp dinlediğiniz
6:47
için çok teşekkürler.
#Education

