IST2018 İşletme İstatistiği II

Dersi geçmek için bilmen gereken her şey burada. Hipotez testleri, Varyans Analizi ve Regresyon modelleri.

1. HAFTA

Anakütle Ortalaması Hipotez Sınamaları

Bir anakütle ortalamasının ($\mu$) belirli bir değere ($\mu_0$) eşit olup olmadığının test edilmesidir. Standart sapma biliniyorsa Z Testi, bilinmiyorsa ve n < 30 ise t Testi kullanılır.

Hipotezler

$H_0: \mu = \mu_0$ (Fark Yoktur)

$H_1: \mu \neq \mu_0$ (Fark Vardır - Çift Yönlü)

Test İstatistiği (Z)

$$ Z = \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}} $$
2. HAFTA

Anakütle Varyansı ve Oranı Hipotezleri

Oran Testi (Z Testi)

Bir kitlenin belirli bir oranının (P) iddia edilen değere ($P_0$) eşitliği test edilir. Örn: "Müşterilerin %40'ı memnundur" iddiası.

$$ Z = \frac{p - P_0}{\sqrt{\frac{P_0(1-P_0)}{n}}} $$

Varyans Testi ($\chi^2$ Testi)

Anakütle varyansının ($\sigma^2$) belirli bir değere eşitliği Ki-Kare dağılımı ile test edilir. Varyansın homojenliği varsayımı için önemlidir.

$$ \chi^2 = \frac{(n-1)s^2}{\sigma_0^2} $$
3. HAFTA

İki Anakütle Karşılaştırmaları

İki farklı grubun (A ve B şubesi, İlaç ve Plasebo grubu vb.) parametrelerinin karşılaştırılmasıdır.

  • İki Ortalama Farkı Testi: Bağımsız örneklemler için t-testi. $H_0: \mu_1 = \mu_2$.
  • İki Varyans Oranı Testi (F Testi): Varyansların eşitliği (homojenliği) test edilir. $H_0: \sigma_1^2 = \sigma_2^2$. Test istatistiği $F = s_1^2 / s_2^2$.
  • İki Oran Farkı Testi: İki grubun başarı oranları farkı test edilir. $H_0: P_1 = P_2$.
4. HAFTA

Parametrik Olmayan Testler

Veriler Normal dağılıma uymadığında veya veri seti çok küçük olduğunda kullanılan testlerdir. Ortalamalar yerine medyanlar ve sıralar kullanılır.

  • Dizilem (Runs) Testi: Bir serinin rastgele olup olmadığını test eder.
  • İşaret (Sign) Testi: Tek örneklemde medyan testi veya eşleşmiş örneklemlerde farkın yönü testi.
  • Mann-Whitney U Testi: İki bağımsız grubun farkı için t-testinin alternatifidir (Non-parametrik t-testi).
5. HAFTA

Tek Yönlü Varyans Analizi (ANOVA) & Kruskal-Wallis

Tek Yönlü ANOVA

3 veya daha fazla grubun ortalamalarını karşılaştırır. Temel mantık: Gruplar arası varyansın, gruplar içi varyansa oranlanmasıdır (F İstatistiği).

$H_0: \mu_1 = \mu_2 = \mu_3 = ...$

Kruskal-Wallis H Testi

ANOVA'nın parametrik olmayan alternatifidir. Normallik varsayımı sağlanmadığında 3+ grubu karşılaştırmak için kullanılır.

6. HAFTA

İki Yönlü Varyans Analizi

Bağımlı değişken üzerinde iki farklı faktörün etkisini inceler. Ayrıca bu iki faktörün birbirleriyle olan Etkileşim (Interaction) etkisini de ölçer.

Örnek Olay

Bir ürünün satışına (Bağımlı Değişken) hem "Ambalaj Renginin" (Faktör A) hem de "Raf Konumunun" (Faktör B) etkisi var mıdır? Ve renk ile konum birlikteyken farklı bir etki yaratıyor mu?

7. HAFTA

Ki-Kare ($\chi^2$) Uygunluk ve Bağımsızlık

Uygunluk Testi

Gözlemlenen verilerin teorik bir dağılıma (örn: Normal, Poisson) uyup uymadığını test eder.

Bağımsızlık Testi

İki kategorik değişken arasında ilişki olup olmadığını test eder. (Sigara kullanımı ile Kanser ilişkisi vb.)

$$ \chi^2 = \sum \frac{(O_i - E_i)^2}{E_i} \quad \text{(O: Gözlenen, E: Beklenen)} $$
8. HAFTA

Ara Sınav Haftası

Vize sınavında ilk 7 haftanın konularından (Hipotez testleri, ANOVA çeşitleri ve Ki-Kare) sorumlu olacaksınız.

9. HAFTA

Korelasyon Analizi

Değişkenler arasındaki ilişkinin yönünü ve kuvvetini ölçer. Nedensellik (sebep-sonuç) belirtmez, sadece birlikte değişimi gösterir.

Pearson Korelasyonu (r)

Normal dağılan, nicel veriler arası doğrusal ilişki için kullanılır. -1 ile +1 arasındadır.

Spearman Sıra Korelasyonu ($\rho$)

Veriler normal dağılmadığında veya sıralı ölçekte olduğunda kullanılır (Non-parametrik).

10. HAFTA

Basit Doğrusal Regresyon

Bir bağımlı değişkeni (Y), tek bir bağımsız değişkenle (X) açıklamaya çalışan modeldir.

$$ Y = \beta_0 + \beta_1 X + \epsilon $$

Modelin Anlamlılığı

  • F Testi (ANOVA): Modelin bütünüyle anlamlı olup olmadığına bakar. ($H_0: \beta_1 = 0$)
  • t Testi: $\beta_1$ katsayısının sıfırdan farklı olup olmadığna bakar.
  • Belirlilik Katsayısı ($R^2$): Bağımsız değişkenin bağımlı değişkeni ne kadar açıkladığını gösterir.
11. HAFTA

Çoklu Regresyon Analizi I

Bir bağımlı değişkenin (Y), birden fazla bağımsız değişken ($X_1, X_2, ...$) ile açıklandığı modellerdir.

Katsayıların Yorumu ($\beta_i$):

"Diğer değişkenler sabitken (Ceteris Paribus), $X_1$'deki 1 birimlik artışın Y üzerinde yarattığı değişimdir."

Modelin genel anlamlılığı için ANOVA tablosundaki Significance F (Anlamlılık F) değerine bakılır. Eğer p < 0.05 ise model anlamlıdır.

12. HAFTA

Çoklu Regresyon: Model Güvenilirliği

  • Düzeltilmiş $R^2$ (Adjusted $R^2$): Çoklu regresyonda değişkene sayısı arttıkça $R^2$ yapay olarak artar. Bu durumu cezalandıran ve daha gerçekçi bir açıklayıcılık oranı veren katsayıdır.
  • Standart Hata: Tahminlerin gerçek değerlerden ortalama sapmasını gösterir. Düşük olması iyidir.
13. HAFTA

Çoklu Regresyon: Değişken Seçimi

modele hangi değişkenlerin gireceğine karar verme yöntemleridir. Gereksiz değişkenler modeli bozar (Gürültü).

1. İleriye Doğru Seçim (Forward): Boş modelle başlar, en anlamlı değişkeni tek tek ekler.
2. Geriye Doğru Eleme (Backward): Tüm değişkenlerle başlar, anlamsız olanı tek tek atar.
3. Adımsal (Stepwise): Her adımda hem ekleme hem çıkarma değerlendirmesi yapar.
14. HAFTA

Modellerin Karşılaştırılması

Hangi modelin daha iyi olduğunu belirlemek için kullanılan kriterler:

  • En yüksek Düzeltilmiş $R^2$.
  • En düşük Standart Hata.
  • AIC (Akaike Bilgi Kriteri) ve BIC (Bayes Bilgi Kriteri): Düşük değerler daha iyi modeli gösterir.
15. HAFTA

Çoklu Regresyonda Uygulama Sorunları

  • Çoklu Doğrusal Bağlantı (Multicollinearity): Bağımsız değişkenlerin birbiriyle yüksek ilişkili olması sorunudur. (VIF değeri ile tespit edilir).
  • Değişen Varyans (Heteroscedasticity): Hata terimlerinin varyansının sabit olmaması sorunudur.
  • Otokorelasyon (Autocorrelation): Hata terimlerinin birbiriyle ilişkili olmasıdır (Genelde zaman serilerinde görülür). Durbin-Watson testi ile bakılır.
16. HAFTA

Ders Çalışma Haftası

Final sınavı öncesi tüm Hipotez Testleri ve Regresyon Modelleri üzerine genel tekrar.

17. HAFTA

Final Sınavı

Dönem boyunca işlenen tüm parametrik ve parametrik olmayan testler ile regresyon analizlerinden sorumlusunuz.

Başarılar!

İstatistiksel düşünme yeteneğinizi gösterme zamanı.