- Wzory i równania
- Ważne zmienne statystyczne
- Model i właściwości
- Główne właściwości rozkładu hipergeometrycznego
- Aproksymacja przy użyciu rozkładu dwumianowego
- Przykład 2
- Rozwiązane ćwiczenia
- Ćwiczenie 1
- Rozwiązanie
- Ćwiczenie 2
- Rozwiązanie
- Ćwiczenie 3
- Rozwiązanie
- Rozwiązanie c
- Bibliografia
Rozkład hipergeometryczny jest dyskretną funkcją statystyczną, odpowiednią do obliczania prawdopodobieństwa w losowych eksperymentach z dwoma możliwymi wynikami. Warunkiem koniecznym do jej zastosowania jest to, że są to małe populacje, w których wycofania nie są zastępowane, a prawdopodobieństwa nie są stałe.
Dlatego też, gdy wybierany jest element populacji, aby poznać wynik (prawdziwy lub fałszywy) pewnej cechy, ten sam element nie może zostać wybrany ponownie.

Rysunek 1. W takiej populacji śrubek z pewnością istnieją wadliwe okazy. Źródło: Pixabay.
Z pewnością następny wybrany element ma zatem większe szanse na uzyskanie prawdziwego wyniku, jeśli poprzedni element miał wynik ujemny. Oznacza to, że prawdopodobieństwo zmienia się w miarę wyodrębniania pierwiastków z próbki.
Główne zastosowania rozkładu hipergeometrycznego to: kontrola jakości w procesach o małej populacji oraz obliczanie prawdopodobieństw w grach losowych.
Jeśli chodzi o funkcję matematyczną definiującą rozkład hipergeometryczny, składa się ona z trzech parametrów, którymi są:
- Liczba elementów populacji (N)
- Wielkość próbki (m)
- Liczba zdarzeń w całej populacji z korzystnym (lub niekorzystnym) wynikiem badanej cechy (n).
Wzory i równania
Wzór na rozkład hipergeometryczny podaje prawdopodobieństwo P, że wystąpią x korzystne przypadki określonej cechy. Sposób zapisu matematycznego na podstawie liczb kombinatorycznych to:

W poprzednim wyrażeniu N, n i m są parametrami, a x jest samą zmienną.
- Całkowita populacja to N.
-Liczba pozytywnych wyników pewnej binarnej cechy w odniesieniu do całej populacji wynosi n.
-Ilość pierwiastków w próbce to m.
W tym przypadku X jest zmienną losową przyjmującą wartość x, a P (x) wskazuje na prawdopodobieństwo wystąpienia x korzystnych przypadków badanej cechy.
Ważne zmienne statystyczne
Inne zmienne statystyczne dotyczące rozkładu hipergeometrycznego to:
- Średnia μ = m * n / N
- Wariancja σ ^ 2 = m * (n / N) * (1-n / N) * (Nm) / (N-1)
- Odchylenie standardowe σ, które jest pierwiastkiem kwadratowym z wariancji.
Model i właściwości
Aby dojść do modelu rozkładu hipergeometrycznego, zaczynamy od prawdopodobieństwa uzyskania x korzystnych przypadków w próbie o wielkości m. Ten przykład zawiera elementy, które są zgodne z badaną właściwością i elementy, które nie są zgodne.
Przypomnijmy, że n reprezentuje liczbę korzystnych przypadków w całej populacji elementów N. Wtedy prawdopodobieństwo byłoby obliczone w ten sposób:
Wyrażając powyższe w postaci liczb kombinatorycznych, uzyskuje się następujący model rozkładu prawdopodobieństwa:

Główne właściwości rozkładu hipergeometrycznego
Są one następujące:
- Próba musi być zawsze mała, nawet jeśli populacja jest duża.
- Elementy próbki są ekstrahowane jeden po drugim, bez ponownego włączania ich do populacji.
- Badana właściwość jest binarna, to znaczy może przyjmować tylko dwie wartości: 1 lub 0, albo prawda lub fałsz.
Na każdym etapie ekstrakcji pierwiastka prawdopodobieństwo zmienia się w zależności od poprzednich wyników.
Aproksymacja przy użyciu rozkładu dwumianowego
Inną właściwością rozkładu hipergeometrycznego jest to, że można go przybliżyć rozkładem dwumianowym oznaczonym jako Bi, o ile populacja N jest duża i co najmniej 10 razy większa niż próbka m. W tym przypadku wyglądałoby to tak:
Prawdopodobieństwo, że x = 3 śruby w próbce są wadliwe, wynosi: P (500, 5, 60, 3) = 0,0129.
Ze swej strony prawdopodobieństwo, że x = 4 śruby z sześćdziesięciu próbek są wadliwe, wynosi: P (500, 5, 60; 4) = 0,0008.
Ostatecznie prawdopodobieństwo, że x = 5 śrub w tej próbce jest uszkodzonych, wynosi: P (500, 5, 60; 5) = 0.
Ale jeśli chcesz poznać prawdopodobieństwo, że w tej próbce jest więcej niż 3 wadliwe śruby, to musisz otrzymać skumulowane prawdopodobieństwo, dodając:
Ten przykład ilustruje rysunek 2, uzyskany przy użyciu GeoGebra, bezpłatnego oprogramowania szeroko używanego w szkołach, instytutach i na uniwersytetach.

Rysunek 2. Przykład rozkładu hipergeometrycznego. Opracował F. Zapata we współpracy z GeoGebra.
Przykład 2
Talia hiszpańska składa się z 40 kart, z których 10 jest w złocie, a pozostałe 30 nie. Załóżmy, że z tej talii losuje się 7 kart, które nie są ponownie włączane do talii.
Jeśli X jest liczbą złotych obecnych w 7 wylosowanych kartach, to prawdopodobieństwo, że będziesz mieć x sztuk złota w 7-kartowym losowaniu, określa rozkład hipergeometryczny P (40,10,7; x).
Zobaczmy to w ten sposób: aby obliczyć prawdopodobieństwo posiadania 4 sztuk złota w 7-kartowym losowaniu, używamy wzoru na rozkład hipergeometryczny z następującymi wartościami:

Wynik to: prawdopodobieństwo 4,57%.
Ale jeśli chcesz poznać prawdopodobieństwo otrzymania więcej niż 4 kart, musisz dodać:
Rozwiązane ćwiczenia
Poniższy zestaw ćwiczeń ma na celu zilustrowanie i przyswojenie pojęć przedstawionych w tym artykule. Ważne jest, aby czytelnik spróbował rozwiązać je samodzielnie, zanim spojrzy na rozwiązanie.
Ćwiczenie 1
Fabryka prezerwatyw odkryła, że na 1000 prezerwatyw wyprodukowanych przez daną maszynę 5 jest uszkodzonych. W celu kontroli jakości pobiera się losowo 100 prezerwatyw, a partia jest odrzucana, jeśli jest co najmniej jedna lub więcej wadliwych. Odpowiedź:
a) Jaka jest możliwość, że wiele 100 zostanie odrzuconych?
b) Czy to kryterium kontroli jakości jest skuteczne?
Rozwiązanie
W takim przypadku pojawią się bardzo duże liczby kombinatoryczne. Obliczenia są trudne, chyba że masz odpowiedni pakiet oprogramowania.
Ale ponieważ jest to duża populacja, a próbka jest dziesięciokrotnie mniejsza niż cała populacja, możliwe jest zastosowanie przybliżenia rozkładu hipergeometrycznego przez rozkład dwumianowy:
W powyższym wyrażeniu C (100, x) jest liczbą kombinatoryczną. Następnie prawdopodobieństwo posiadania więcej niż jednej usterki zostanie obliczone w następujący sposób:
Jest to doskonałe przybliżenie w porównaniu z wartością uzyskaną przy zastosowaniu rozkładu hipergeometrycznego: 0,4102
Można powiedzieć, że z 40% prawdopodobieństwem należy wyrzucić partię 100 preparatów profilaktycznych, co nie jest zbyt wydajne.
Ale ponieważ jest trochę mniej wymagający w procesie kontroli jakości i odrzuca partię 100 tylko wtedy, gdy są dwie lub więcej wad, prawdopodobieństwo odrzucenia partii spadłoby do zaledwie 8%.
Ćwiczenie 2
Wibroprasa działa w ten sposób, że z każdych 10 sztuk jedna wychodzi zdeformowana. W przypadku próbki składającej się z 5 sztuk, jakie jest prawdopodobieństwo, że tylko jeden element jest uszkodzony?
Rozwiązanie
Ludność: N = 10
Liczba n wad dla każdego N: n = 1
Wielkość próbki: m = 5

Dlatego istnieje 50% prawdopodobieństwo, że w próbce liczącej 5 sztuk blok zostanie zdeformowany.
Ćwiczenie 3
W spotkaniu młodych maturzystów jest 7 pań i 6 panów. Wśród dziewcząt 4 studiują nauki humanistyczne i 3 ścisłe. W grupie chłopców 1 studiuje nauki humanistyczne i 5 ścisłe. Oblicz następujące:
a) Losowy wybór trzech dziewczyn: jakie jest prawdopodobieństwo, że wszystkie one studiują nauki humanistyczne?
b) Jeśli trzech uczestników spotkania przyjaciół zostanie wybranych losowo: Jaka jest możliwość, że trzech z nich, bez względu na płeć, studiuje wszystkie trzy przedmioty ścisłe lub humanistyczne?
c) Teraz wybierz losowo dwóch przyjaciół i nazwij x zmienną losową „liczbą studentów humanistycznych”. Pomiędzy dwoma wybranymi określ średnią lub oczekiwaną wartość x i wariancję σ ^ 2.
Rozwiązanie
Wartości do użycia teraz to:
-Ludność: N = 14
-Ilość, którą bada litery to: n = 6 i
-Wielkość próbki: m = 3.
-Liczba znajomych studiujących nauki humanistyczne: x
Zgodnie z tym, x = 3 oznacza, że wszystkie trzy nauki humanistyczne, ale x = 0 oznacza, że nikt nie studiuje nauk humanistycznych. Prawdopodobieństwo, że wszystkie trzy badają to samo, daje suma:
P (14, 6, 3, x = 0) + P (14, 6, 3, x = 3) = 0,0560 + 0,1539 = 0,2099
Wtedy mamy 21% prawdopodobieństwo, że trzech losowo wybranych uczestników spotkania będzie badać to samo.
Rozwiązanie c
Tutaj mamy następujące wartości:
N = 14 łączna populacja znajomych, n = 6 łączna liczba w populacji humanistycznej, liczebność próby m = 2.
Mam nadzieję, że:
E (x) = m * (n / N) = 2 * (6/14) = 0,8572
I wariancja:
σ (x) ^ 2 = m * (n / N) * (1-n / N) * (Nm) / (N-1) = 2 * (6/14) * (1-6 / 14) * ( 14-2) / (14-1) =
= 2 * (6/14) * (1-6 / 14) * (14-2) / (14-1) = 2 * (3/7) * (1-3 / 7) * (12) / ( 13) = 0,4521
Bibliografia
- Dyskretne rozkłady prawdopodobieństwa. Odzyskany z: biplot.usal.es
- Statystyka i prawdopodobieństwo. Rozkład hipergeometryczny. Odzyskany z: projectdescartes.org
- CDPYE-UGR. Rozkład hipergeometryczny. Odzyskany z: ugr.es
- Geogebra. Klasyczna geogebra, rachunek prawdopodobieństwa. Odzyskany z geogebra.org
- Spróbuj łatwo. Rozwiązane problemy rozkładu hipergeometrycznego. Odzyskany z: probafacil.com
- Minitab. Rozkład hipergeometryczny. Odzyskany z: support.minitab.com
- Uniwersytet w Vigo. Główne rozkłady dyskretne. Odzyskany z: anapg.webs.uvigo.es
- Vitutor. Statystyka i kombinatoryka. Odzyskany z: vitutor.net
- Weisstein, Eric W. Hypergeometric Distribution. Odzyskany z: mathworld.wolfram.com
- Wikipedia. Rozkład hipergeometryczny. Odzyskany z: es.wikipedia.com
