- Formuła i równania
- Różnice w rozkładzie dwumianowym
- Przykłady
- Praktyczne zastosowania
- Przybliżenie rozkładu dwumianowego z rozkładem Poissona
- Rozwiązane ćwiczenia
- Ćwiczenie 1
- Rozwiązanie c)
- Ćwiczenie 2
- Rozwiązanie)
- Bibliografia
Rozkład Poissona jest dyskretnym rozkładem prawdopodobieństwa, dzięki któremu można poznać prawdopodobieństwo, że w przypadku dużej próby iw pewnym przedziale wystąpi zdarzenie, którego prawdopodobieństwo jest małe.
Często rozkład Poissona można zastąpić rozkładem dwumianowym, o ile spełnione są następujące warunki: duża próbka i małe prawdopodobieństwo.

Rysunek 1. Wykres rozkładu Poissona dla różnych parametrów. Źródło: Wikimedia Commons.
Siméon-Denis Poisson (1781-1840) stworzył tę dystrybucję noszącą jego imię, bardzo przydatną, jeśli chodzi o nieprzewidywalne wydarzenia. Poisson opublikował swoje wyniki w 1837 r., Będącym dziełem śledztwa dotyczącym prawdopodobieństwa wystąpienia błędnych wyroków karnych.
Później inni badacze dostosowali rozkład w innych obszarach, na przykład liczbę gwiazd, które można znaleźć w określonej objętości kosmosu lub prawdopodobieństwo, że żołnierz umrze z powodu kopnięcia konia.
Formuła i równania
Matematyczna postać rozkładu Poissona jest następująca:

- μ (czasami oznaczany jako λ) to średnia lub parametr rozkładu
- liczba Eulera: e = 2,71828
- Prawdopodobieństwo uzyskania y = k wynosi P
- k to liczba sukcesów 0, 1,2,3 …
- n to liczba testów lub zdarzeń (wielkość próby)
Dyskretne zmienne losowe, jak sama nazwa wskazuje, zależą od przypadku i przyjmują tylko dyskretne wartości: 0, 1, 2, 3, 4…, k.
Średni rozkład jest określony przez:

Wariancja σ, która mierzy rozprzestrzenianie się danych, jest kolejnym ważnym parametrem. Dla rozkładu Poissona jest to:
σ = μ
Poisson ustalił, że gdy n → ∞ i p → 0, średnia μ - nazywana również wartością oczekiwaną - dąży do stałej:
- Rozważane zdarzenia lub zdarzenia są od siebie niezależne i występują losowo.
-Prawdopodobieństwo P pewnego zdarzenia w określonym czasie jest bardzo małe: P → 0.
-Prawdopodobieństwo wystąpienia więcej niż jednego zdarzenia w przedziale czasowym wynosi 0.
-Średnia wartość jest zbliżona do stałej określonej wzorem: μ = np (n to wielkość próbki)
-Ponieważ dyspersja σ jest równa μ, ponieważ przyjmuje większe wartości, zmienność również staje się większa.
-Zdarzenia muszą być równomiernie rozłożone w stosowanym przedziale czasu.
-Zestaw możliwych wartości zdarzenia y to: 0,1,2,3,4….
-Suma i zmiennych, które są zgodne z rozkładem Poissona, jest również inną zmienną Poissona. Jego średnia wartość jest sumą średnich wartości tych zmiennych.
Różnice w rozkładzie dwumianowym
Rozkład Poissona różni się od rozkładu dwumianowego na następujące ważne sposoby:
-Na rozkład dwumianowy ma wpływ zarówno wielkość próby n, jak i prawdopodobieństwo P, ale na rozkład Poissona wpływa tylko średnia μ.
-W rozkładzie dwumianowym możliwe wartości zmiennej losowej y wynoszą 0,1,2,…, N, podczas gdy w rozkładzie Poissona nie ma górnej granicy dla tych wartości.
Przykłady
Poisson początkowo zastosował swoją słynną dystrybucję do spraw sądowych, ale na poziomie przemysłowym jednym z jego najwcześniejszych zastosowań było warzenie piwa. W tym procesie do fermentacji wykorzystywane są kultury drożdży.
Drożdże składają się z żywych komórek, których populacja jest zmienna w czasie. Przy produkcji piwa konieczne jest dodanie niezbędnej ilości, dlatego konieczne jest poznanie ilości komórek przypadających na jednostkę objętości.
Podczas II wojny światowej rozkład Poissona wykorzystano, aby dowiedzieć się, czy Niemcy faktycznie celowali w Londyn z Calais, czy po prostu strzelali przypadkowo. Było to ważne dla aliantów, aby ustalić, jak dobra była technologia dostępna dla nazistów.
Praktyczne zastosowania
Zastosowania rozkładu Poissona zawsze odnoszą się do zliczeń w czasie lub zliczeń w przestrzeni. A ponieważ prawdopodobieństwo wystąpienia jest małe, nazywane jest również „prawem rzadkich zdarzeń”.
Oto lista wydarzeń należących do jednej z tych kategorii:
-Rejestracja cząstek podczas rozpadu radioaktywnego, który, podobnie jak wzrost komórek drożdży, jest funkcją wykładniczą.
-Liczba odwiedzin określonej witryny internetowej.
-Przyjazd ludzi do linii, aby zapłacić lub wziąć udział (teoria kolejki).
-Liczba samochodów, które przejeżdżają przez określony punkt na drodze w określonym przedziale czasu.

Rysunek 2. Liczba samochodów przejeżdżających przez punkt jest mniej więcej zgodna z rozkładem Poissona. Źródło: Pixabay.
-Mutacje doznane w pewnym łańcuchu DNA po ekspozycji na promieniowanie.
-Liczba meteorytów o średnicy większej niż 1 m spadła w ciągu roku.
-Uszkodzenia na metr kwadratowy tkaniny.
-Ilość krwinek w 1 centymetrze sześciennym.
- Połączenia na minutę do centrali telefonicznej.
-Czekoladki obecne w 1 kg ciasta.
-Liczba drzew zakażonych przez danego pasożyta na 1 hektarze lasu.
Zwróć uwagę, że te zmienne losowe reprezentują liczbę przypadków, w których zdarzenie występuje w określonym przedziale czasu (połączenia na minutę z centralą telefoniczną) lub w danym obszarze przestrzeni (wady tkaniny na metr kwadratowy).
Zdarzenia te, jak już ustalono, są niezależne od czasu, który minął od ostatniego zdarzenia.
Przybliżenie rozkładu dwumianowego z rozkładem Poissona
Rozkład Poissona jest dobrym przybliżeniem do rozkładu dwumianowego, o ile:
- Wielkość próby jest duża: n ≥ 100
-Prawdopodobieństwo p jest małe: p ≤ 0,1
- μ jest rzędu: np ≤ 10
W takich przypadkach rozkład Poissona jest doskonałym narzędziem, ponieważ rozkład dwumianowy może być trudny do zastosowania w takich przypadkach.
Rozwiązane ćwiczenia
Ćwiczenie 1
Badanie sejsmologiczne wykazało, że w ciągu ostatnich 100 lat na świecie miały miejsce 93 duże trzęsienia ziemi, co najmniej 6,0 w skali Richtera - logarytmicznej -. Załóżmy, że w tym przypadku odpowiednim modelem jest rozkład Poissona. Odnaleźć:
a) Średnie występowanie dużych trzęsień ziemi w ciągu roku.
b) Jeśli P (y) jest prawdopodobieństwem wystąpienia trzęsień ziemi w losowo wybranym roku, znajdź następujące prawdopodobieństwa:


Jest to znacznie mniej niż P (2).
Wyniki przedstawiono poniżej:
P (0) = 0,395, P (1) = 0,367, P (2) = 0,171, P (3) = 0,0529, P (4) = 0,0123, P (5) = 0,00229, P (6) = 0,000355, P (7) = 0,0000471.
Na przykład, możemy powiedzieć, że istnieje 39,5% prawdopodobieństwo, że w danym roku nie wystąpi żadne większe trzęsienie ziemi. Albo że jest 5,29% z 3 dużych trzęsień ziemi występujących w tym roku.
Rozwiązanie c)
c) Częstotliwości są analizowane, mnożąc przez n = 100 lat:
39,5; 36,7; 17,1; 5,29; 1,23; 0,229; 0,0355 i 0,00471.
Na przykład:
- Częstotliwość 39,5 wskazuje, że w ciągu 39,5 na 100 lat wystąpiło 0 dużych trzęsień ziemi, możemy powiedzieć, że jest to dość zbliżone do rzeczywistego wyniku 47 lat bez żadnego poważnego trzęsienia ziemi.
Porównajmy inny wynik Poissona z rzeczywistymi wynikami:
- Uzyskana wartość 36,7 oznacza, że w okresie 37 lat nastąpi 1 wielkie trzęsienie ziemi. Rzeczywisty wynik jest taki, że w ciągu 31 lat miało miejsce 1 duże trzęsienie ziemi, co jest dobrym wynikiem do modelu.
- Spodziewane jest 17,1 roku z 2 dużymi trzęsieniami ziemi i wiadomo, że w ciągu 13 lat, co jest wartością bliską, rzeczywiście miały miejsce 2 duże trzęsienia ziemi.
Dlatego model Poissona jest akceptowalny w tym przypadku.
Ćwiczenie 2
Jedna firma szacuje, że liczba komponentów, które ulegają awarii przed osiągnięciem 100 godzin pracy, jest zgodna z rozkładem Poissona. Jeśli średnia liczba awarii w tym czasie wynosi 8, znajdź następujące prawdopodobieństwa:
a) że element ulegnie awarii w ciągu 25 godzin.
b) Awaria mniej niż dwóch elementów w ciągu 50 godzin.
c) Co najmniej trzy komponenty ulegają awarii w ciągu 125 godzin.
Rozwiązanie)
a) Wiadomo, że średnia awarii na 100 godzin wynosi 8, dlatego w ciągu 25 godzin spodziewana jest jedna czwarta awarii, czyli 2 awarie. Będzie to parametr μ.
Prawdopodobieństwo awarii 1 składnika jest wymagane, zmienną losową jest „składniki, które uległy awarii przed 25 godzinami”, a jej wartość wynosi y = 1. Podstawiając w funkcji prawdopodobieństwa:

Jednak pytanie brzmi, czy mniej niż dwa komponenty ulegną awarii w ciągu 50 godzin, a nie, że dokładnie 2 komponenty ulegną awarii w ciągu 50 godzin, dlatego musimy dodać prawdopodobieństwa, że:
-Żadna porażka
- Tylko awaria 1

Parametr μ rozkładu w tym przypadku to:
μ = 8 + 2 = 10 awarii w ciągu 125 godzin.
P (3 lub więcej komponentów zawodzi) = 1 - P (0) - P (1) - P (2) =

Bibliografia
- MathWorks. Rozkład Poissona. Odzyskany z: es.mathworks.com
- Mendenhall, W. 1981. Statystyka zarządzania i ekonomii. 3. wydanie. Grupo Editorial Iberoamérica.
- Stat Trek. Naucz się statystyk. Rozkład Poissona. Odzyskany z: stattrek.com,
- Triola, M. 2012. Statystyki podstawowe. 11th. Ed. Pearson Education.
- Wikipedia. Rozkład Poissona. Odzyskane z: en.wikipedia.org
