6. Много ошибок совершается при построении умозаключений на основе значений выборки, поскольку сознательно или нет, но эти значения могли бы быть отобраны так, чтобы не являться значимыми репрезентантами всей совокупности. Этот источник ошибки особенно часто встречается в тех случаях, где были взяты лишь несколько значений или где наше знание предмета и его релевантных факторов является недостаточным.
При сравнении различных групп всегда существует опасность получения нерепрезентативной выборки. Ответственный за набор рекрутов в армию убедит большинство людей в правоте следующего аргумента: уровень смертности в американских ВМС во время Испано-американской войны равнялся 9 из 1000, тогда как уровень смертности за то же самое время в Нью-Йорке равнялся 16 из 100; следовательно, безопаснее быть служащим ВМС во время войны, чем мирным жителем Нью-Йорка. Однако внимательное рассмотрение оснований для данного заключения демонстрирует, что в двух указанных уровнях смертности нет той кажущейся большой значимости. Уровень смертности в Нью-Йорке включает в себя смертность младенцев, стариков, людей, находящихся в больницах и приютах; при этом известно, что среди стариков, младенцев и больных уровень смертности сравнительно велик. ВМС, с другой стороны, укомплектованы мужчинами в возрасте от 18 до 35 лет, каждый из которых был освидетельствован на медицинском осмотре как здоровый. Из этого следует, что упомянутые два уровня смертности не приводят к заключению о том, что ВМС безопаснее Нью-Йорка. Для адекватного обоснования подобного заключения потребовалось бы сравнение двух групп, которые были бы однородными по возрасту, полу и состоянию здоровья.
Можно привести множество других примеров, содержащих данную ошибку. В одном из университетов было обнаружено, что студенты одного цвета кожи получали более высокие оценки, чем студенты другого цвета кожи. Можем ли мы из этого заключить, что одна раса более способна к обучению, чем другие расы? Подобное умозаключение было бы крайне необоснованным, особенно если при этом предполагается существование барьеров между расами. Различия в оценках могут с легкостью объясняться повышенными требованиями при поступлении, выдвигаемыми к представителям одной расы. Следовательно, студенты такой расы будут представлять более избранную группу и поэтому будут получать более высокие оценки. Сходным образом открытие того, что женатые мужчины в Италии требуют меньше медицинского внимания, чем неженатые, не доказывает того, что брак содержит какую-либо гигиеническую ценность. Указанное различие может происходить из нежелания хронически больных мужчин жениться, и в таком случае лучшее здоровье женатых мужчин будет объясняться именно способом отбора исследуемого материала.
http://coollib.com/b/231744/read#t117 § 5. Опасности и ошибки при использовании статистических методов
Несмотря на свою большую ценность, статистические данные могут быть неправильно использованы и неверно проинтерпретированы, если не учтены допущения, требующиеся для их использования. Поэтому мы должны предостеречь читателя от приведенных ниже элементарных, но часто встречающихся ошибок.