- Wielkość próbki
- Przypadek 1: wielkość populacji jest nieznana
- Poziomy ufności i odpowiadające im wartości Z.
- Przypadek 2: wielkość populacji jest znana
- Przykłady
- Ankiety i kwestionariusze
- QA
- Korzyść
- Niedogodności
- Ćwiczenie rozwiązane
- Rozwiązanie
- Bibliografia
Losowe pobieranie próbek jest jak wybrać próbkę reprezentatywną statystycznie od danej populacji. Część zasady, że każdy element w próbie musi mieć takie samo prawdopodobieństwo, że zostanie wybrany.
Losowanie jest przykładem losowania losowego, w którym każdemu członkowi populacji uczestnika przypisuje się numer. Aby wybrać liczby odpowiadające nagrodom loterii (próbce), stosuje się jakąś przypadkową technikę, np. Wydobycie ze skrzynki pocztowej numerów zapisanych na identycznych kartach.
Rysunek 1. W przypadku losowego pobierania próbek próbka jest pobierana z populacji w sposób losowy przy użyciu techniki, która gwarantuje, że wszystkie elementy mają takie samo prawdopodobieństwo wyboru. Źródło: netquest.com.
Przy losowym doborze próby istotny jest odpowiedni dobór wielkości próby, ponieważ niereprezentatywna próba populacji może prowadzić do błędnych wniosków ze względu na wahania statystyczne.
Wielkość próbki
Istnieją wzory na określenie właściwej wielkości próbki. Najważniejszym czynnikiem do rozważenia jest to, czy znana jest wielkość populacji. Przyjrzyjmy się formułom określającym wielkość próbki:
Przypadek 1: wielkość populacji jest nieznana
Gdy wielkość populacji N jest nieznana, można wybrać próbkę o odpowiedniej wielkości n w celu ustalenia, czy dana hipoteza jest prawdziwa, czy fałszywa.
W tym celu stosuje się następujący wzór:
Gdzie:
-p to prawdopodobieństwo, że hipoteza jest prawdziwa.
-q jest prawdopodobieństwem, że tak nie jest, więc q = 1 - p.
-E jest względnym marginesem błędu, na przykład błąd 5% ma margines E = 0,05.
-Z ma związek z poziomem pewności wymaganym przez badanie.
W znormalizowanym (lub znormalizowanym) rozkładzie normalnym poziom ufności 90% ma Z = 1645, ponieważ prawdopodobieństwo, że wynik mieści się w zakresie od -1,645σ do + 1,645σ, wynosi 90%, gdzie σ jest odchyleniem standardowym .
Poziomy ufności i odpowiadające im wartości Z.
1. - poziom ufności 50% odpowiada Z = 0,675.
2. - poziom ufności 68,3% odpowiada Z = 1.
3.- Poziom ufności 90% odpowiada Z = 1,645.
4 - 95% poziom ufności odpowiada Z = 1,96
Poziom ufności 5–95,5% odpowiada Z = 2.
6. - 99,7% poziom ufności odpowiada Z = 3.
Przykładem zastosowania tej formuły byłoby badanie mające na celu określenie średniej masy kamyków na plaży.
Oczywiście nie jest możliwe zbadanie i zważenie wszystkich kamyków na plaży, dlatego zaleca się pobranie próbki możliwie jak najbardziej losowej iz odpowiednią liczbą pierwiastków.
Rysunek 2. Aby zbadać charakterystykę kamyków na plaży, należy wybrać losową próbkę z reprezentatywną ich liczbą. (Źródło: pixabay)
Przypadek 2: wielkość populacji jest znana
Gdy znana jest liczba N pierwiastków tworzących pewną populację (lub wszechświat), jeśli chcemy wybrać statystycznie istotną próbę o rozmiarze n za pomocą prostego losowego próbkowania, oto wzór:
Gdzie:
-Z jest współczynnikiem związanym z poziomem ufności.
-p to prawdopodobieństwo sukcesu hipotezy.
-q jest prawdopodobieństwem niepowodzenia hipotezy, p + q = 1.
-N to wielkość całej populacji.
-E jest względnym błędem wyniku badania.
Przykłady
Metodologia pobierania próbek zależy w dużej mierze od rodzaju badania, które należy przeprowadzić. Dlatego losowe pobieranie próbek ma nieskończoną liczbę zastosowań:
Ankiety i kwestionariusze
Na przykład w ankietach telefonicznych osoby do konsultacji są wybierane za pomocą generatora liczb losowych, obowiązującego w badanym regionie.
Jeśli chcesz zastosować ankietę do pracowników dużej firmy, możesz skorzystać z selekcji respondentów poprzez numer pracownika lub numer dowodu osobistego.
Liczbę tę należy również wybrać losowo, używając na przykład generatora liczb losowych.
Rysunek 3. Kwestionariusz można zastosować, losowo wybierając uczestników. Źródło: Pixabay.
QA
W przypadku, gdy badanie dotyczy części wytwarzanych przez maszynę, części należy wybierać losowo, ale z partii wyprodukowanych o różnych porach dnia lub w różne dni lub tygodnie.
Korzyść
Proste losowe pobieranie próbek:
- Pozwala obniżyć koszty badania statystycznego, ponieważ nie jest konieczne badanie całej populacji, aby uzyskać statystycznie wiarygodne wyniki, przy pożądanym poziomie ufności i wymaganym w badaniu poziomie błędu.
- Unikaj stronniczości: ponieważ wybór badanych pierwiastków jest całkowicie przypadkowy, badanie wiernie oddaje charakterystykę populacji, chociaż badano tylko jej część.
Niedogodności
- Metoda nie jest odpowiednia w przypadkach, gdy chcesz poznać preferencje w różnych grupach lub warstwach populacji.
W takim przypadku lepiej jest wcześniej określić grupy lub segmenty, na których ma być przeprowadzone badanie. Po zdefiniowaniu warstw lub grup, jeśli wygodnie jest dla każdej z nich zastosować próbkowanie losowe.
- Jest wysoce nieprawdopodobne, że zostaną uzyskane informacje o sektorach mniejszości, których czasami konieczne jest poznanie ich cech.
Na przykład, jeśli chodzi o kampanię na rzecz drogiego produktu, konieczne jest poznanie preferencji najbogatszych sektorów mniejszościowych.
Ćwiczenie rozwiązane
Chcemy zbadać preferencje populacji dla określonego napoju typu cola, ale nie ma żadnego wcześniejszego badania w tej populacji, którego wielkość jest nieznana.
Z drugiej strony próba musi być reprezentatywna z minimalnym poziomem ufności 90%, a wnioski muszą mieć błąd procentowy 2%.
-Jak określić wielkość n próbki?
- Jaka byłaby wielkość próby, gdyby margines błędu był bardziej elastyczny do 5%?
Rozwiązanie
Ponieważ liczebność populacji nie jest znana, do określenia liczebności próby stosuje się powyższy wzór:
n = (Z 2 p q) / (E 2 )
Zakładamy, że prawdopodobieństwo preferencji (p) dla naszej marki napoju bezalkoholowego jest takie samo, jak dla braku preferencji (q), więc p = q = 0,5.
Z drugiej strony, ponieważ wynik badania musi mieć błąd procentowy mniejszy niż 2%, to błąd względny E wyniesie 0,02.
Wreszcie, wartość Z = 1645 daje poziom ufności 90%.
Podsumowując, mamy następujące wartości:
Z = 1,645
p = 0,5
q = 0,5
E = 0,02
Na podstawie tych danych obliczana jest minimalna wielkość próby:
n = (1,645 2 0,5 0,5) / (0,02 2 ) = 1691,3
Oznacza to, że badanie z wymaganym marginesem błędu i przy wybranym poziomie ufności musi mieć próbę co najmniej 1692 osób, wybranych w drodze losowania prostego.
Jeśli przejdziesz od marginesu błędu 2% do 5%, to nowa wielkość próby to:
n = (1,645 2 0,5 0,5) / (0,05 2 ) = 271
Co oznacza znacznie mniejszą liczbę osobników. Podsumowując, wielkość próby jest bardzo wrażliwa na pożądany margines błędu w badaniu.
Bibliografia
- Berenson, M. 1985. Statystyka zarządzania i ekonomii, koncepcje i zastosowania. Od redakcji Interamericana.
- Statystyka. Próbkowanie losowe. Zaczerpnięte z: encyclopediaeconomica.com.
- Statystyka. Próbowanie. Odzyskany z: Estadistica.mat.uson.mx.
- Eksplorowalne. Próbkowanie losowe. Odzyskany z: explorable.com.
- Moore, D. 2005. Podstawowe statystyki stosowane. 2nd. Wydanie.
- Netquest. Próbkowanie losowe. Odzyskany z: netquest.com.
- Wikipedia. Statystyczne pobieranie próbek. Odzyskane z: en.wikipedia.org