- Definicja
- Wzory i równania
- - Kurtoza zgodnie z prezentacją danych
- Dane nie są pogrupowane ani pogrupowane według częstotliwości
- Dane pogrupowane w przedziały
- Nadmiar kurtozy
- Do czego służy kurtooza?
- Wynagrodzenia 3 działów
- Wyniki egzaminu
- Przykład praktyczny kurtozy
- Rozwiązanie
- Krok 1
- Krok 2
- Krok 3
- Bibliografia
Kurtoza lub kurtoza to parametr statystyczny stosowany do scharakteryzowania rozkładu prawdopodobieństwa zmiennej losowej, wskazując stopień koncentracji wartości wokół centralnego stopniu. Nazywa się to również „najwyższą oceną”.
Termin pochodzi od greckiego „kurtos”, co oznacza łukowaty, dlatego kurtoza wskazuje na stopień spłaszczenia lub spłaszczenia rozkładu, jak pokazano na poniższym rysunku:

Rycina 1. Różne rodzaje kurtozy. Źródło: F. Zapata.
Prawie wszystkie wartości zmiennej losowej mają tendencję do skupiania się wokół wartości centralnej, takiej jak średnia. Jednak w niektórych rozkładach wartości są bardziej rozproszone niż w innych, co skutkuje bardziej płaskimi lub cieńszymi krzywymi.
Definicja
Kurtooza jest wartością liczbową typową dla każdego rozkładu częstości, które w zależności od koncentracji wartości wokół średniej dzieli się na trzy grupy:
- Leptokurtyczny: w którym wartości są bardzo skupione wokół średniej, więc rozkład jest dość ostry i smukły (rysunek 1, po lewej).
- Mesocúrtic: ma umiarkowane stężenie wartości wokół średniej (ryc. 1 w środku).
- Platicúrtica: ten rozkład ma szerszy kształt, ponieważ wartości są zwykle bardziej rozproszone (rysunek 1 po prawej).
Wzory i równania
Kurtooza może mieć dowolną wartość bez ograniczeń. Jego obliczenie odbywa się w zależności od sposobu dostarczenia danych. Zapis używany w każdym przypadku jest następujący:
-Współczynnik kurtozy: g 2
-Średnia arytmetyczna: X lub x ze słupkiem
-I-ta wartość: x i
-Odchylenie standardowe: σ
-Liczba danych: N
-Częstotliwość i-tej wartości: f i
-Marka klasy: mx i
W tym zapisie przedstawiamy niektóre z najczęściej używanych wzorów do znalezienia kurtozy:
- Kurtoza zgodnie z prezentacją danych
Dane nie są pogrupowane ani pogrupowane według częstotliwości

Dane pogrupowane w przedziały

Nadmiar kurtozy
Nazywany również współczynnikiem ukierunkowania Fishera lub miarą Fishera, służy do porównania badanego rozkładu z rozkładem normalnym.
Kiedy nadmiar kurtozy wynosi 0, mamy do czynienia z rozkładem normalnym lub dzwonem Gaussa. W ten sposób za każdym razem, gdy obliczana jest nadmierna kurtooza rozkładu, w rzeczywistości porównujemy ją z rozkładem normalnym.
Zarówno dla danych niezgrupowanych, jak i zbiorczych, współczynnik wskazania Fishera, oznaczony przez K, wynosi:
K = g 2 - 3
Teraz można wykazać, że kurtooza rozkładu normalnego wynosi 3, więc jeśli współczynnik wskazania Fishera wynosi 0 lub jest bliski 0 i istnieje rozkład mezokruktyczny. Jeśli K> 0, rozkład jest leptokurtyczny, a jeśli K <0, to jest platicúrtic.
Do czego służy kurtooza?
Kurtoza jest miarą zmienności używaną do scharakteryzowania morfologii rozkładu. W ten sposób można porównać rozkłady symetryczne o tej samej średniej i równym rozproszeniu (określonym przez odchylenie standardowe).
Posiadanie miar zmienności zapewnia, że średnie są wiarygodne i pomaga kontrolować zmiany w rozkładzie. Jako przykład spójrzmy na te dwie sytuacje.
Wynagrodzenia 3 działów
Załóżmy, że poniższy wykres przedstawia dystrybucję wynagrodzeń w 3 działach tej samej firmy:

Rysunek 2. Trzy rozkłady z różnymi kurtoozami ilustrują praktyczne sytuacje. (Przygotowane przez Fanny Zapata)
Krzywa A jest najcieńsza ze wszystkich, a z jej kształtu można wywnioskować, że większość wynagrodzeń tego działu jest bardzo zbliżona do średniej, dlatego większość pracowników otrzymuje podobne wynagrodzenie.
Ze swojej strony w dziale B krzywa płac ma rozkład normalny, ponieważ krzywa jest mezokurtyczna, w której zakładamy, że płace były rozłożone losowo.
I wreszcie krzywa C, która jest bardzo płaska, co oznacza, że w tym dziale rozpiętość wynagrodzeń jest znacznie szersza niż w pozostałych.
Wyniki egzaminu
Przypuśćmy teraz, że trzy krzywe na rysunku 2 reprezentują wyniki egzaminu przeprowadzonego na trzech grupach uczniów z tego samego przedmiotu.
Grupa, której oceny przedstawia krzywa leptokurtyczna jest dość jednorodna, większość uzyskała ocenę średnią lub bliską.
Możliwe jest również, że wynik wynikał z mniej więcej tego samego stopnia trudności pytań testowych.
Z drugiej strony wyniki grupy C wskazują na większą niejednorodność w grupie, która prawdopodobnie zawiera przeciętnych uczniów, część uczniów bardziej uprzywilejowanych i na pewno mniej uważnych.
Albo może to oznaczać, że pytania testowe miały bardzo różne stopnie trudności.
Krzywa B jest mezokutyczna, co wskazuje, że wyniki testu miały rozkład normalny. Zwykle jest to najczęstszy przypadek.
Przykład praktyczny kurtozy
Znajdź współczynnik punktacji Fishera dla następujących stopni, uzyskanych na egzaminie z fizyki dla grupy uczniów, w skali od 1 do 10:
Rozwiązanie
Poniższe wyrażenie zostanie użyte dla danych niepogrupowanych, podanych w poprzednich sekcjach:

K = g 2 - 3
Ta wartość pozwala poznać typ dystrybucji.
Aby obliczyć g 2, wygodnie jest to zrobić w uporządkowany sposób, krok po kroku, ponieważ trzeba rozwiązać kilka operacji arytmetycznych.
Krok 1
Najpierw obliczana jest średnia ocen. Istnieje N = 11 danych.
Krok 2
Zostaje znalezione odchylenie standardowe, dla którego stosuje się to równanie:

σ = 1,992
Lub możesz również zbudować tabelę, która jest również wymagana w następnym kroku i w której zapisany jest każdy termin sumowań, które będą potrzebne, zaczynając od (x i - X), a następnie (x i - X) 2 a następnie (x i - X) 4 :

Krok 3
Wykonaj sumę wskazaną w liczniku wzoru na g 2 . W tym celu używany jest wynik z prawej kolumny poprzedniej tabeli:
∑ (x i - X) 4 = 290,15
A zatem:
g 2 = (1/11) x 290,15 / 1,992 4 = 1,675
Współczynnik wskazujący Fishera to:
K = g 2 - 3 = 1,675 - 3 = -1,325
Interesujący jest znak wyniku, który jako ujemny odpowiada rozkładowi platicúrtycznemu, co można interpretować tak, jak zostało to zrobione w poprzednim przykładzie: być może jest to niejednorodny kurs z uczniami o różnym stopniu zainteresowania lub pytania egzaminacyjne zostały o różnych poziomach trudności.
Użycie arkusza kalkulacyjnego, takiego jak Excel, znacznie ułatwia rozwiązywanie tego typu problemów, a także oferuje opcję wykresu dystrybucji.
Bibliografia
- Levin, R. 1988. Statystyka dla administratorów. 2nd. Wydanie. Prentice Hall.
- Marco, F. Curtosis. Odzyskany z: Economipedia.com.
- Oliva, J. Asymmetry and kurtosis. Odzyskany z: statisticaucv.files.wordpress.com.
- Spurr, W. 1982. Podejmowanie decyzji w zarządzaniu. Limusa.
- Wikipedia. Kurtoza. Odzyskane z: en.wikipedia.org.
