Auzef İstatistik Analiz 2024-2025 Bütünleme Soruları,
Auzef İşletme
https://lolonolo.com
Show More Show Less View Video Transcript
0:00
Hep duyarız veriler konuşur diye. Peki
0:02
ama o verileri konuşturmak için doğru
0:04
soruları nasıl sorarız? İşte bu bölümde
0:07
istatistiksel analizin temel araçlarını
0:09
keşfedeceğiz ve o rakam yığınlarının
0:11
ardındaki sırları birlikte açığa
0:12
çıkalacağız. Hadi başlayalım. Şöyle bir
0:15
düşünün. Yeni bir reklam kampanyasına
0:18
ciddi bir bütçe ayırdınız. Peki
0:20
harcadığınız paranın size gerçekten de
0:23
satış olarak geri döndüğünden ne kadar
0:25
eminsiniz? Bu sadece bir his mi yoksa
0:28
bunu kanıtlayabilir misiniz? İşte asıl
0:31
soru bu ve cevabı da verilerin içinde
0:34
gizli. Amacımız da tam olarak bu
0:36
aslında. Size verilerin içindeki o
0:38
değerli hikayeleri bulmanızı sağlayacak
0:40
bir alet çantası sunmak. Bu analiz
0:42
boyunca o aletlerin nasıl
0:43
kullanacağınızı ve rakamların ötesinin
0:46
nasıl göreceğinizi adım adım
0:47
öğreneceğiz. Yonculuğumuza ilk olarak
0:50
sayılar arasındaki o gizli bağlantıları
0:52
arayarak başlıyoruz. Mesela reklam
0:55
harcamalarınızla satışlarınız arasında
0:57
bir bağ var mı? Yani reklama daha çok
0:59
para harcayınca satışlar gerçekten
1:01
artıyor mu? Artıyorsa bu artış ne kadar
1:04
güçlü? İşte bu bağlantının gücünü ölçen
1:07
çok havalı bir aracımız var. Belirginlik
1:09
katsayısı ya da herkesin bildiği adıyla
1:12
R²are. R²are bize çok basit bir şey
1:15
söyler. satışlarınızdaki o
1:17
hareketliliğin yüzde kaçı reklamlarınız
1:19
sayesinde oldu. Tıpkı bir karnedeki
1:22
başarı notu gibi düşünebilirsiniz.
1:24
Mesela şu iki duruma bir bakalım. Eğer
1:27
R²are değeriniz 048 ise bu harika bir
1:30
haber. Demek ki satışlarınızdaki artışın
1:33
neredeyse yarısını reklamlarınıza
1:35
borçlusunuz. Arada güçlü bir bağ var.
1:37
Ama eğer bu değer 017 gibi düşük bir
1:40
rakamsa o zaman durup düşünmek lazım.
1:43
Reklamlar satışları pek de etkilemiyor
1:44
gibi görünüyor. Ama hikaye burada
1:47
bitmiyor. R²are 048 ise peki satışları
1:50
etkileyen diğer %52'lik kısım nerede?
1:53
İşte ona da belirsizlik katsayısı
1:55
diyoruz. Yani bizim modelimizin
1:57
açıklayamadığı resmin dışındaki
1:59
faktörler. Belki mevsim, belki rakibin
2:02
hamleleri, belki de bambaşka bir şey. R
2:04
kare bize sadece nereye bakmamız
2:06
gerektiğini değil, nereye daha yakından
2:08
bakmamız gerektiğini de gösterir. Evet.
2:11
Şimdi çok önemli bir yol ayrımındayız.
2:13
Analize dalmadan önce bir durup
2:16
elimizdeki veriye bakmamız lazım. Ne tür
2:19
bir veriyle uğraşıyoruz? Çünkü unutmayın
2:22
her kilit her kapıyı açmaz. Her veri
2:24
türü için kullanmamız gereken doğru bir
2:27
istatistiksel araç var. Veri analizinde
2:30
genelde iki ana yolumuz var. Bir yanda
2:32
satış rakamları, kilo, boy gibi sayısal
2:35
ölçülebilen veriler var. Bunlar için
2:37
parametrik testler dediğimiz güçlü
2:39
araçları kullanırız. Ama bu araçların
2:41
bazı şartları var. Mesela verinin
2:43
dengeli dağılması gibi. Diğer yanda ise
2:45
kadın, erkek, evli, bekar gibi
2:47
kategorilere ayrılmış veriler var. İşte
2:49
bu tür veriler için de daha esnek olan,
2:52
parametrik olmayan testlere
2:54
başvuruyoruz. Yani kural aslında çok
2:56
basit. Elinizdeki verinin kimliği hangi
2:59
alet çantasını açacağınızı size söyler.
3:01
Önce veriyi tanı, sonra aracı seç.
3:04
Diyelim ki bekarlar arasında kadınların
3:07
oranıyla erkeklerin oranı arasında bir
3:09
fark var mı diye merak ediyorsunuz.
3:11
Bakın burada iki kategoriyi
3:12
karşılaştırıyoruz. Cinsiyet ve medeni
3:14
durum. İşte tam da bu tür sorular için
3:17
özel bir aracımız var ki kare testi.
3:20
Peki bu araçları sadece ilişkileri
3:22
anlamak için mi kullanıyoruz? Tabii ki
3:24
hayır. Bazen de amacımız farklı grupları
3:27
karşılaştırmak ve aralarında anlamlı bir
3:29
fark olup olmadığını bulmaktır. Mesela
3:32
yeni eğitim metodumuz eski metoda göre
3:34
gerçekten daha mı başarılı? Hadi
3:36
bulalım. İşte ilk senaryomuz. Kadın ve
3:38
erkek öğrencilerin sınav notlarını
3:40
karşılaştırıyoruz. Bu iki grup
3:42
birbirinden tamamen ayrı, tamamen
3:44
bağımsız. Sorumuz şu: İki grubun
3:46
ortalama puanları arasındaki fark kayda
3:48
değer bir fark mı yoksa sadece şans
3:50
eseri ortaya çıkmış küçük bir oynama mı?
3:53
İşte tam da bu tür birbirinden bağımsız
3:56
iki grubu yani kadınlar ve erkekler gibi
3:59
iki ayrı dünyayı karşılaştırmak için
4:01
kullandığımız testin adı bağımsız
4:03
örneklem Testi. Bu test iki grubun
4:06
ortalamasını adil bir şekilde
4:07
kıyaslamamızı sağlıyor. Peki ya
4:10
karşılaştırdığımız gruplar bağımsız
4:12
değilse? Mesela aynı kişilerin 3 aylık
4:15
bir diyet programından önceki ve sonraki
4:17
kilolarını ölçtüğümüzü hayal edin.
4:19
Burada artık iki farklı grup yok. Aynı
4:21
grubun iki farklı zaman dilimindeki hali
4:23
var. Bu durumda devreye başka bir test
4:26
giriyor. Bağımlı örneklem Testi. Adından
4:29
da anlaşılacağı gibi verilerimiz aynı
4:31
kaynaktan yani birbirine bağımlı
4:33
kişilerden geliyor. Bir ilacın öncesi
4:35
sonrası etkisini ölçmek için biçilmiş
4:37
kaftan. Şimdi istatistiğin belki de en
4:40
sihirli kısmına geldik. Bütünü anlamak
4:42
için ufacık bir parçasını kullanma
4:44
sanatı. Düşünsenize bir ülkedeki bütün
4:47
seçmenlerle konuşmak imkansız ama doğru
4:50
seçilmiş küçük bir grupla konuşarak
4:52
bütün ülke hakkında şaşırtıcı derecede
4:53
isabetli tahminler yapabiliriz. Yalnız
4:56
bu sihrin çalışması için bir altın kural
4:58
var. Tesadüfilik. Eğer örneklemenizi
5:01
seçerken o büyük gruptaki herkesin
5:03
seçilmek için eşit bir şansı yoksa
5:05
elinizdeki resim bütünün bir yansıması
5:08
olmaz. Sizi fena halde yanıltabilir.
5:10
Mesela bir margarin fabrikasını
5:12
düşünelim. Üretim bandından tamamen
5:14
rastgele seçilen bir grup margarinin
5:16
ortalama ağırlığı 249 gram çıkmış. Peki
5:19
bu 249 gram bize ne söylüyor? Aslında
5:23
çok şey. Bu rakam o fabrikada öğretilen
5:26
milyonlarca margarinin ortalama
5:28
ağırlığına dair elimizdeki en iyi tek
5:31
tahmin. Buna nokta tahmini diyoruz. Yani
5:35
okyanus hakkında bir damladan fikir
5:37
yürütmek gibi bir şey. Tüm bu araçları
5:40
öğrendik. Artık yolculuğumuzun
5:41
zirvesine, en heyecanlı kısmına geldik.
5:44
Bir iddiayı bilimsel olarak test etme
5:46
aşaması. Yani bir fikrimiz var ve
5:49
verilerin bu fikri destekleyip
5:51
desteklemediğini kanıtlamak istiyoruz.
5:53
Bu süreci tıpkı bir mahkeme gibi
5:55
düşünebiliriz. Önce bir iddia ortaya
5:57
atılır. Sonra biz bu iddianın tam
5:59
tersini yani sıfır hipotezini savunuruz.
6:02
Bu tıpkı suçu ispatlanana kadar herkes
6:05
masumdur demek gibi bir şey. Sonra
6:07
kanıtları yani verileri toplarız ve bir
6:09
karara varırız. Bu masumiyet karinesini
6:11
çürütmek için elimizde yeterince güçlü
6:13
kanıt var mı yok mu? Tabii iddianızın ne
6:16
olduğu da önemli. Mesela yeni bir pilin
6:18
ömrü standart 12 saatten farklı mı
6:21
diyorsanız hem daha uzun hem de daha
6:24
kısa olma ihtimalini düşünmelisiniz.
6:26
Buna çift taraflı test denir. Ama
6:28
iddianız pilin ömrü 12 saatten uzundur
6:31
şeklindeyse o zaman tek bir yöne
6:33
odaklanırsınız. İşte R kare ile başlayıp
6:37
farklı test türleri ve hipotezlerle
6:38
devam eden bu yolculukta aslında tek bir
6:40
şey öğrendik. Verilerin dilini
6:42
konuşabilmek için gereken temel gramer
6:45
kurallarını. Artık bu dili anlıyor ve
6:47
konuşabiliyoruz. Evet, artık alet
6:50
çantanız temel istatistik araçlarıyla
6:52
dolu. Bu araçlarla kendi verilerinizin
6:54
derinliklerini inip gizli hikayeleri siz
6:56
de ortaya çıkarabilirsiniz. O zaman soru
6:59
şu: Bir sonraki büyük kararınızı alırken
7:02
bu yeni gücünüzü, verileri konuşturmak
7:04
için nasıl kullanmayı düşünüyorsunuz?
#Education
#Statistics

