Одна из наиболее типичных задач статистики — сделать
выводы о целом на основании данных о его части. Это целое называется
генеральной совокупностью. Генеральная совокупность может представлять
собой множество рыб в озере, множество изделий, выпущенных заводом за
последний год, множество жителей, имеющих право голоса на ближайших
выборах, или множество людей, страдающих от определенного заболевания.
Тщательное изучение генеральной совокупности возможно
крайне редко. Опросить всех избирателей, чтобы узнать, за кого они
будут голосовать на следующих выборах, нереально и также нереально
опросить всех, кто болеет определенной болезнью, чтобы узнать, как
подействовало новое лекарство. Конечно, если нас интересует прочность
изготовленных изделий, которую нельзя определить, не разрушив изделие,
то можно разрушить все произведенные изделия, чтобы определить прочность
каждого, но такой подход не выглядит самым разумным.
Вместо этого изучается часть генеральной
совокупности, которая называется выборкой. На основе результатов,
полученных при изучении выборки, оцениваются характеристики генеральной
совокупности. Правила вычисления вероятностей позволяют нам получить
информацию о качестве этой оценки с помощью ряда понятий, в частности
«доверительный интервал» и «предельная ошибка».
Очевидно, что наши выводы будут справедливы тогда и
только тогда, когда выборка будет репрезентативной. Если она не является
репрезентативной, то очевидно, что по ней нельзя будет сделать
какие-либо выводы о генеральной совокупности. В некоторых источниках
повышенное внимание уделяется математическим аспектам (так как
использование непонятных математических терминов — эффектный, хотя и
дешевый прием), а способ формирования выборки не указывается. Правильное
формирование выборки — достаточно дорогостоящий процесс, но этот аспект
крайне важен, так как именно он гарантирует корректность выводов.
Оценка параметров генеральной совокупности с помощью репрезентативной выборки. |