В этой всемирно известной книге Дарелл Хафф рассказывает о различных способах злоупотребления статистикой в целях обмана аудитории и манипулирования ее мнением. Каждый день на вас пытаются повлиять, чтобы сподвигнуть на покупку какого-то «нужного» продукта или на выбор «правильного» кандидата: «Благодаря пасте “Чистые зубы” образование кариеса снижается на 23 %!»; «Политика N поддерживает 85 % граждан»… Как понять, насколько достоверны те или иные данные? Каким образом происходят подсчеты? Что учитывается, а что остается за кадром? Автор раскрывает секретные инструменты статистиков и вооружает читателя знаниями, которые помогут разобраться во всех хитросплетениях этой науки и не позволят ввести в заблуждение.
Статистика, действительно, коварная и хитрая вещь, особенно в умелых руках. На первый взгляд, книга Дарелла Хаффа «Как лгать при помощи статистики» — инструкция по применению для мошенников, которые хотят ввести в заблуждение доверчивых читателей. Но на самом деле — наоборот.
Сам автор пишет: «Полагаю всё же, что смогу оправдать её в манере бывшего грабителя, опубликовавшего мемуары, в сущности представляющие собой учебный курс на тему о том, как подобрать отмычку к замку. Жуликам и ворам все эти трюки давно известны, а порядочные люди должны узнать о них, чтобы уметь защитить свой дом от непрошенных гостей».
Хотя книга написана в далеком 1954 году, актуальности своей она не потеряла, также как и коварные приемы, описываемые в ней. Расскажу о трех, которые описывает Хафф.
Необъективная выборка
Чтобы данные выборочного исследования имели ценность, они должны основываться на репрезентативной выборке, из которой исключены все возможные источники предвзятости.
Вот пример нерепрезентативной выборки, который приводит Хафф. Один психиатр заявил, что практически любой человек — неврастеник. Но спросим себя: что послужило основой для такого вывода? Каких именно людей наблюдал данный психиатр? Оказывается, он пришел к такому поучительному выводу, изучая своих пациентов, а они более чем неподходящие кандидатуры на роль выборки из всего населения. Если человек вполне нормален, то у психиатра нет никаких шансов увидеть его у себя на приеме.
Другой — уже хрестоматийный — пример связан с выборами президента США. Журнал Literary Digest в 1936 году, опросив своих подписчиков, предсказал триумфальную победу республиканца Альфреда Лэндона над демократом Франклином Рузвельтом. В журнале забыли учесть, что его подписчики — это в основном богатые и зажиточные американцы, чаще всего сторонники республиканской партии. Победу на выборах одержал Рузвельт.
Грамотно выбранное среднее или Чиновники едят мясо, я — капусту. В среднем, мы едим голубцы. ©
Термин «среднее» имеет очень расплывчатое толкование. В цитате, приведенной выше, это среднее арифметическое. Помимо него существуют мода и медиана.
Во многих случаях все три средних показателя настолько близки по значению, что нет никакой необходимости делать различие между ними. Но если речь идет о доходах, то разница между тремя средними — огромная.
«Если вам попадается заявление владельца компании, где говорится, что у его сотрудников средняя зарплата достаточно высока, это может означать нечто конкретное, а может и не означать ничего. Если упомянутый средний показатель представляет собой медиану, то он укажет на то, что половина сотрудников зарабатывает больше указанной суммы, а другая половина — меньше. Но если перед вами среднее арифметическое (а можете мне поверить, так оно и бывает, если вид среднего не уточняется), то эта цифра не даст вам никакой полезной информации», — пишет Дарелл Хафф. Что касается моды, то это самое часто встречающееся значение из множества и, возможно, оно лучше всего характеризует уровень заработной платы в компании.
Неправильная причинно-следственная связь
После — не всегда значит вследствие! И Дарелл Хафф доказывает это на конкретных примерах и призывает быть бдительными.
«Отстают ли в учебе студенты-курильщики от некурящих студентов. Согласно одному исследованию — да, отстают. Очень многим это пришлось по душе, они пошли дальше и сделали вывод — курение пагубно влияет на умственные способности, — пишет Хафф. — Вышеупомянутое исследование, как мне верится, было проведено по всем правилам: объем выборки был достаточно велик, подобрали ее добросовестно и тщательно, величина корреляции оказалась значимой. Но в нем делается неоправданное предположение, что курение и есть причина плохой успеваемости. Но разве всё это нельзя с таким же успехом перевернуть наоборот? Может быть, именно скверные оценки заставили студентов искать утешения в курении? Если уж на то пошло, данный вывод столь же вероятен и не хуже подкреплен фактами».
Часто бывает так: взаимосвязь существует, но нельзя сказать, какая из переменных выступает причиной, а какая следствием. Гораздо коварнее, когда ни одна из переменных не оказывает воздействия на другую, но корреляция между ними всё равно есть, причем существенная.
Вот пример такой фиктивной корреляции. По словам Хаффа, уровень самоубийств достигает максимума в июне. Тогда же насчитывается наибольшее количество новобрачных. В чем дело? Самоубийства порождают такое количество свадеб? Или свадьбы провоцируют отвергнутых женихом или невестой свести счеты с жизнью? Более убедительным, но тоже недоказанным объяснением будет следующее. Некто отчаявшийся всю зиму борется с депрессией в надежде, что весной тучи рассеются. Но он окончательно сдается, когда наступает лето, выглядывает солнце, а никакого просвета нет…
В общем, смотрите в оба и помните, что существует три вида лжи: ложь, наглая ложь и статистика. Отличная книга, рекомендую.
Источник
Статистика, действительно, коварная и хитрая вещь, особенно в умелых руках. На первый взгляд, книга Дарелла Хаффа «Как лгать при помощи статистики» — инструкция по применению для мошенников, которые хотят ввести в заблуждение доверчивых читателей. Но на самом деле — наоборот.
Сам автор пишет: «Полагаю всё же, что смогу оправдать её в манере бывшего грабителя, опубликовавшего мемуары, в сущности представляющие собой учебный курс на тему о том, как подобрать отмычку к замку. Жуликам и ворам все эти трюки давно известны, а порядочные люди должны узнать о них, чтобы уметь защитить свой дом от непрошенных гостей».
Хотя книга написана в далеком 1954 году, актуальности своей она не потеряла, также как и коварные приемы, описываемые в ней. Расскажу о трех, которые описывает Хафф.
Необъективная выборка
Чтобы данные выборочного исследования имели ценность, они должны основываться на репрезентативной выборке, из которой исключены все возможные источники предвзятости.
Вот пример нерепрезентативной выборки, который приводит Хафф. Один психиатр заявил, что практически любой человек — неврастеник. Но спросим себя: что послужило основой для такого вывода? Каких именно людей наблюдал данный психиатр? Оказывается, он пришел к такому поучительному выводу, изучая своих пациентов, а они более чем неподходящие кандидатуры на роль выборки из всего населения. Если человек вполне нормален, то у психиатра нет никаких шансов увидеть его у себя на приеме.
Другой — уже хрестоматийный — пример связан с выборами президента США. Журнал Literary Digest в 1936 году, опросив своих подписчиков, предсказал триумфальную победу республиканца Альфреда Лэндона над демократом Франклином Рузвельтом. В журнале забыли учесть, что его подписчики — это в основном богатые и зажиточные американцы, чаще всего сторонники республиканской партии. Победу на выборах одержал Рузвельт.
Грамотно выбранное среднее или Чиновники едят мясо, я — капусту. В среднем, мы едим голубцы. ©
Термин «среднее» имеет очень расплывчатое толкование. В цитате, приведенной выше, это среднее арифметическое. Помимо него существуют мода и медиана.
Во многих случаях все три средних показателя настолько близки по значению, что нет никакой необходимости делать различие между ними. Но если речь идет о доходах, то разница между тремя средними — огромная.
«Если вам попадается заявление владельца компании, где говорится, что у его сотрудников средняя зарплата достаточно высока, это может означать нечто конкретное, а может и не означать ничего. Если упомянутый средний показатель представляет собой медиану, то он укажет на то, что половина сотрудников зарабатывает больше указанной суммы, а другая половина — меньше. Но если перед вами среднее арифметическое (а можете мне поверить, так оно и бывает, если вид среднего не уточняется), то эта цифра не даст вам никакой полезной информации», — пишет Дарелл Хафф. Что касается моды, то это самое часто встречающееся значение из множества и, возможно, оно лучше всего характеризует уровень заработной платы в компании.
Неправильная причинно-следственная связь
После — не всегда значит вследствие! И Дарелл Хафф доказывает это на конкретных примерах и призывает быть бдительными.
«Отстают ли в учебе студенты-курильщики от некурящих студентов. Согласно одному исследованию — да, отстают. Очень многим это пришлось по душе, они пошли дальше и сделали вывод — курение пагубно влияет на умственные способности, — пишет Хафф. — Вышеупомянутое исследование, как мне верится, было проведено по всем правилам: объем выборки был достаточно велик, подобрали ее добросовестно и тщательно, величина корреляции оказалась значимой. Но в нем делается неоправданное предположение, что курение и есть причина плохой успеваемости. Но разве всё это нельзя с таким же успехом перевернуть наоборот? Может быть, именно скверные оценки заставили студентов искать утешения в курении? Если уж на то пошло, данный вывод столь же вероятен и не хуже подкреплен фактами».
Часто бывает так: взаимосвязь существует, но нельзя сказать, какая из переменных выступает причиной, а какая следствием. Гораздо коварнее, когда ни одна из переменных не оказывает воздействия на другую, но корреляция между ними всё равно есть, причем существенная.
Вот пример такой фиктивной корреляции. По словам Хаффа, уровень самоубийств достигает максимума в июне. Тогда же насчитывается наибольшее количество новобрачных. В чем дело? Самоубийства порождают такое количество свадеб? Или свадьбы провоцируют отвергнутых женихом или невестой свести счеты с жизнью? Более убедительным, но тоже недоказанным объяснением будет следующее. Некто отчаявшийся всю зиму борется с депрессией в надежде, что весной тучи рассеются. Но он окончательно сдается, когда наступает лето, выглядывает солнце, а никакого просвета нет…
В общем, смотрите в оба и помните, что существует три вида лжи: ложь, наглая ложь и статистика. Отличная книга, рекомендую.
Источник
Мне приходилось много времени проводить за изучением статистической информации, собирать ее, анализировать и т.д. Таким образом, многое из написанного автором для меня секретом не было (да и для большинства населения никак не связанного со статистикой тоже). Единственный момент, на который я ранее не обращала внимание - это среднее, мода и медиана. Я как-то не задумывалась о том, какую среднюю используют авторы разнообразных статей (впрочем скорее всего это именно средняя арифметическая).
Основываясь на своем опыте скажу, что все что пишет Хафф в своей книге - правда. А с течением времени все написанное не менее актуально, чем пол века назад. За это время изменилась на мой взгляд лишь 3 основных фактора: упростился доступ простых обывателей к информации, упростился процесс сборки статистической информации, а также упростились методы и сократилось время, необходимое на проведение анализа статистических данных. В остальном же ничего нового не придумали. Люди также "ведутся" на нарисованный мешок денег, все также мелким шрифтом подписывают в рекламе, что исследования прошли 12 человек, а авторы статей продолжают обрезать и растягивать графики и "играются" с выборкой.
Немного успокаивает тот факт, что сейчас многие статистические данные может проверить даже обычный человек, если задастся этой целью и проведет за компьютером пару-тройку часов. Сейчас масса альтернативных источников начиная с нашего Росстата и статистики, которую предоставляют различные Министерства, заканчивая подсчетами, которые ведут иностранцы. На самом деле сейчас в открытом доступе предоставлено просто невероятное количество различного рода источников со статистическими данными.
Оценку я снизила за многочисленные повторения автором уже сказанных ранее вещей. За то, что к середине книге, лично у меня, начал постепенно угасать интерес, а картинки в книге стали не столь интересными)) С одной стороны вроде бы написаны правильные, нужные вещи, а с другой... ну, наверное это кому-то действительно необходимо.
Так или иначе, каждому из нас приходится сталкиваться со статистикой. Она повсеместно встречается и в Интернете, и на телевидении, и в газетах, книгах, и порой даже на улице. А множеству людей приходится работать со статистическими материалами по учёбе и работе. В обоих случаях нужно уметь правильно анализировать информацию, чтобы не стать обманутым.
Дарелл Хафф именно этому нас и учит в своей книге. И это у него получается отменно! Книга крутейшая! Вы, конечно, можете подумать, что я преувеличиваю, но это так. Ведь только подумать, 60 лет назад был написан этот труд, который актуален до сих пор!
Чего здесь только нет! И проблема выборки, и особенности иллюстирования, и методики расчёта. Автор всё это подробно объясняет.
Нас дурачат на каждом шагу, а мы, округлив глаза, верим очень многому. Всегда нужно включать свой мозг и думать: что значит эта информация? Как она была получена? Стоит ли верить источнику? Ведь часто это приводит к множеству заблуждений, сопровождающих нас чуть ли не всю жизнь, примеры которых автор неоднократно приводит.
Книга понравится и тем, кто не хочет быть одураченым, и тем, кто хочет научиться дурачить (не надо так!). А также всем, кто интересуется статистикой. Информация донесена крайне доступно и просто, читается махом. А забавные рисунки добавляют приятных эмоций от чтения! Каждое умозаключение автор подтверждает лёгким примером, и даже то, что могло быть недопонятым, усваивается и надолго откладывается в голове.
Умный человек не будет верить во всё, что бы ему ни сказали или показали. Он сто раз проверит, вдумается, почитает альтернативные источники. Так давайте все так делать и читать такие полезные книги!
Каждый из вас, наверняка, хочет повысить своё благосостояние и в разы увеличить размер годового дохода. Единственное препятствие на вашем пути – вы не знаете как это сделать. Вы боретесь с ним, пытаетесь его разрушить, вместо того чтобы обойти. Я вас уверяю: «Получить годовой доход в размере 5.287.800₽ совсем несложно». И прочитав эту рецензию, вы получите готовый инструмент с помощью которого собственно и будете заниматься своим финансовым положением. Я распишу вам каждый шаг, чтобы уж точно вас не унесло в сторону от ваших денег. Но в начале, все же поговорим о книге. Хотя и то что было до, и то что будет после – всё книга.
Многие из вас скажут: «Алло, это книга 1954 года, она уже давно устарела, в ней нет ничего актуального». Возможно, я даже с этим немного соглашусь, за исключением одного «но»: в нашей стране ужасная финансовая безграмотность. И сведения из этой «устаревшей» книги для многих будут воистину полезными.
Конечно, автор не будет учить вас работать с кредитными ставками, азам инвестирования или пониманию фондового рынка. Ничего из вышеперечисленного в книге нет. Есть только статистика, понимание которой, облегчит (возможно!) вашу жизнь.
Что же, именно, предлагает нам автор?
1. Вычисление «среднего». Вы же знали, что среднее можно вычислить разными способами? Если знали, вы молодец, а если нет, вот вам лишний повод прочитать эту небольшую книжечку. Как прочитаете, попрактикуйтесь, посчитайте среднюю ежемесячную з/п россиян разными способами и определите тот способ, который даст сумму наиболее близкую к реальности.
2. Манипуляция графиками. Многие из нас просто не задумываются об этом, видят график и верят. А ведь там используются такие банальные и пошлые хитрости.
3. Как при помощи статистики преувеличить превосходство одного над другим. Это вам даже в жизни пригодится (с оглядкой на вашу деятельность, конечно). Вот, например, вы либерал, научитесь статистическим трюкам и будете показывать через сравнения с Западом, как в «рашке» все плохо. Или вы путинист – 146% верности государю из 84%, ваше православие на уровне ультраконсервативного и хоть интернетом вы, естественно, не пользуетесь, но это не помешает вам с помощью, все тех же трюков, доказать (завысить) рейтинг поддержки Путина (это фундаментальная дискуссия), показать людям «как реально в Украине», открыть глаза на истинный размер американского госдолга и провести целый ряд спец-интернет операций на позиции «укро-фашистов» и «либерал-предателей». Статистика, мать её.
4. Что такое корреляция и как вас с помощью неё обманывают? Кто-то из вас не знает даже такого термина, кто-то не знает даже обмана. Но тем не менее, тема важная. Вот я вам скажу: ориентация человека влияет на то «парит» он или нет. И подтвержу свои слова расчетами, например, спрошу у 10 вейперов: Вы геи? «Да», – ответят мне они. Всё, вывод: вейп и гомоэротизм сопутствуют друг другу, а значит ориентация влияет на выбор человека.
Но я вас обманул. А вы поверили. Не надо так. Вы сейчас увидели самый коварный случай ковариация (значение термина прочитайте в книге или найдите в поисковике) – когда ни одна из рассматриваемых переменных не оказывает никакого влияния на другую, но при этом корреляция между ними действительно подтверждается расчётами.
Это был лишь один пример, в книге их ещё море. Быстрее открывайте.
5. Как с помощью процентов доказать ваш тезис?
Смотрите, при абсолютно идентичных параметрах, сравнение чего-то с чем-то можно выставить как в положительном, так и в отрицательном смысле. Ещё можно доказать что ничего не меняется, но вы же не центрист, поэтому вам это не нужно.
Вот вам пример: в прошлом году было 20 видов гендеров и 5 «посадок» за репост. В этом году 10 гендеров были убраны из списка, но число посадок за репост – настолько же поднялось. Теперь решайте сами: улучшается жизнь или наоборот, ухудшается. А сами способы подсчета ищите в книге, ибо спойлеры - это зло. Это как сказать что в «Разочаровании» главная героиня оживила свою мать, а не Элфо. Ужас же. Как такое можно говорить.
Естественно, я озвучил далеко не все. Заинтересовало? Читайте. Нет? Не читайте. А мы, тем временем, переходим к увеличению вашего годового дохода. Готовы стать самым богатеньким в своём посёлке городского типа, м?
Итак, средний доход россиянина в 2017 году составляет 31475₽. Это получается 377.700₽ в год. 377.700₽ – средний годовой доход одного человека в стране (Не переживайте, нижеизложенный способ работает при любой средней з/п).
1. Что мы делаем? Женимся/выходим замуж. Заводим 12 детей.
2. Умножаем 377.700₽ на 14
3. Получаем годовой доход семьи в размере 5.287.800₽.
Конечно, этот доход у вас будет чисто статистическим, но он ведь будет, верно? Поэтому хватит жаловаться на страну, чёртов потенциальный миллионер!
Книга написана в 60 с лишним лет назад, но это совершенно не чувствуется. Казалось бы прошло столько времени и все должно было кардинально измениться, а способы манипулирования информации шагнуть далеко вперёд, но прочитав эту книжку, понимаешь, что новое -- это хорошо забытое старое. Рассказанные уловки до сих пор можно увидеть на каждом шагу. Можно сказать, это база того, как нечестные маркетологи, газетчики и прочие заинтересованные лица, вводят массы в заблуждение. Плюсом к практической пользе, Дарелл Хафф приводит множество на самом деле увлекательных примеров, а ещё текст сопровождают очень забавные карикатуры.
Если не получается доказать то, что вы хотите доказать, продемонстрируйте нечто другое и настаивайте, что это то же самое. В ошеломлении, которое всегда сопровождает столкновение статистики с человеческим разумом, едва ли хоть кто-нибудь заметит подмену. Привязать цифру, отражающую какой-то факт, к другому факту — прием известный и всегда сослужит вам добрую службу. Действует безотказно.
Каждому, кого спрашивали о шансах чернокожих на трудоустройство, попутно задавали несколько вопросов, чтобы определить, не имеет ли респондент сильного расового предубеждения. Оказалось, что респонденты с самыми сильными расовыми предрассудками на вопрос о возможностях трудоустройства чернокожих чаще всего давали ответ «Да». (Было установлено также, что около двух третей респондентов, благосклонно настроенных по отношению к чернокожим, не считают, что у тех шансы трудоустроиться такие же, как у белых. А около двух третей тех, кто выказал предубеждение против чернокожих, заявили, что чернокожим предоставляются такие же хорошие отпуска, как белым.) Очевидно, что из этого опроса мало что узнаешь об условиях трудоустройства чернокожих, зато можно почерпнуть много интересного о межрасовых отношениях.
Говорят, писатель Луис Бромфилд заготовил дежурный ответ на письма от особо придирчивых корреспондентов на те случаи, когда его почта переполнялась настолько, что он был не в состоянии содержательно ответить на каждое послание. Ответ этот, хотя и не выражал согласия ни с чем и никак не поощрял к дальнейшей переписке, тем не менее удовлетворял практически каждого. Ключевая фраза звучала так: «Допускаю, что в сказанном вами что-то есть».
...все социологические опросы в целом грешат предвзятостью ... Это крен в сторону людей более состоятельных, более образованных, более информированных и осторожных, с более пристойным внешним видом, общепринятым поведением и с более устоявшимися привычками, чем у того среднестатистического гражданина, представлять которого их выбрали.
Любую количественную величину несложно выразить множеством разнообразных способов. Вы можете, например, представить один и тот же факт, называя его доходностью продаж в 1 %, рентабельностью инвестиций в 15 %, десятимиллионной прибылью, ростом прибылей на 40 % (по сравнению со средним показателем за 1935–1939 гг.) или сокращением на 60 % по сравнению с предыдущим годом. Суть в том, чтобы выбрать формулировку, которая лучше всего подходит для текущих надобностей. А после остается уповать на то, что лишь единицы, читая эту информацию, сообразят, насколько она искажает реальное положение дел.