Рецензии на книгу «Как лгать при помощи статистики» Дарелл Хафф

В этой всемирно известной книге Дарелл Хафф рассказывает о различных способах злоупотребления статистикой в целях обмана аудитории и манипулирования ее мнением. Каждый день на вас пытаются повлиять, чтобы сподвигнуть на покупку какого-то «нужного» продукта или на выбор «правильного» кандидата: «Благодаря пасте “Чистые зубы” образование кариеса снижается на 23 %!»; «Политика N поддерживает 85 % граждан»… Как понять, насколько достоверны те или иные данные? Каким образом происходят подсчеты?...
varlashechka написал(а) рецензию на книгу
Оценка:

Существует три вида лжи: ложь, наглая ложь и статистика. ©

Статистика, действительно, коварная и хитрая вещь, особенно в умелых руках. На первый взгляд, книга Дарелла Хаффа «Как лгать при помощи статистики» — инструкция по применению для мошенников, которые хотят ввести в заблуждение доверчивых читателей. Но на самом деле — наоборот.

Сам автор пишет: «Полагаю всё же, что смогу оправдать её в манере бывшего грабителя, опубликовавшего мемуары, в сущности представляющие собой учебный курс на тему о том, как подобрать отмычку к замку. Жуликам и ворам все эти трюки давно известны, а порядочные люди должны узнать о них, чтобы уметь защитить свой дом от непрошенных гостей».

Хотя книга написана в далеком 1954 году, актуальности своей она не потеряла, также как и коварные приемы, описываемые в ней. Расскажу о трех, которые описывает Хафф.

Необъективная выборка
Чтобы данные выборочного исследования имели ценность, они должны основываться на репрезентативной выборке, из которой исключены все возможные источники предвзятости.

Вот пример нерепрезентативной выборки, который приводит Хафф. Один психиатр заявил, что практически любой человек — неврастеник. Но спросим себя: что послужило основой для такого вывода? Каких именно людей наблюдал данный психиатр? Оказывается, он пришел к такому поучительному выводу, изучая своих пациентов, а они более чем неподходящие кандидатуры на роль выборки из всего населения. Если человек вполне нормален, то у психиатра нет никаких шансов увидеть его у себя на приеме.

Другой — уже хрестоматийный — пример связан с выборами президента США. Журнал Literary Digest в 1936 году, опросив своих подписчиков, предсказал триумфальную победу республиканца Альфреда Лэндона над демократом Франклином Рузвельтом. В журнале забыли учесть, что его подписчики — это в основном богатые и зажиточные американцы, чаще всего сторонники республиканской партии. Победу на выборах одержал Рузвельт.

Грамотно выбранное среднее или Чиновники едят мясо, я — капусту. В среднем, мы едим голубцы. ©

Термин «среднее» имеет очень расплывчатое толкование. В цитате, приведенной выше, это среднее арифметическое. Помимо него существуют мода и медиана.

Во многих случаях все три средних показателя настолько близки по значению, что нет никакой необходимости делать различие между ними. Но если речь идет о доходах, то разница между тремя средними — огромная.

«Если вам попадается заявление владельца компании, где говорится, что у его сотрудников средняя зарплата достаточно высока, это может означать нечто конкретное, а может и не означать ничего. Если упомянутый средний показатель представляет собой медиану, то он укажет на то, что половина сотрудников зарабатывает больше указанной суммы, а другая половина — меньше. Но если перед вами среднее арифметическое (а можете мне поверить, так оно и бывает, если вид среднего не уточняется), то эта цифра не даст вам никакой полезной информации», — пишет Дарелл Хафф. Что касается моды, то это самое часто встречающееся значение из множества и, возможно, оно лучше всего характеризует уровень заработной платы в компании.

Неправильная причинно-следственная связь
После — не всегда значит вследствие! И Дарелл Хафф доказывает это на конкретных примерах и призывает быть бдительными.

«Отстают ли в учебе студенты-курильщики от некурящих студентов. Согласно одному исследованию — да, отстают. Очень многим это пришлось по душе, они пошли дальше и сделали вывод — курение пагубно влияет на умственные способности, — пишет Хафф. — Вышеупомянутое исследование, как мне верится, было проведено по всем правилам: объем выборки был достаточно велик, подобрали ее добросовестно и тщательно, величина корреляции оказалась значимой. Но в нем делается неоправданное предположение, что курение и есть причина плохой успеваемости. Но разве всё это нельзя с таким же успехом перевернуть наоборот? Может быть, именно скверные оценки заставили студентов искать утешения в курении? Если уж на то пошло, данный вывод столь же вероятен и не хуже подкреплен фактами».

Часто бывает так: взаимосвязь существует, но нельзя сказать, какая из переменных выступает причиной, а какая следствием. Гораздо коварнее, когда ни одна из переменных не оказывает воздействия на другую, но корреляция между ними всё равно есть, причем существенная.

Вот пример такой фиктивной корреляции. По словам Хаффа, уровень самоубийств достигает максимума в июне. Тогда же насчитывается наибольшее количество новобрачных. В чем дело? Самоубийства порождают такое количество свадеб? Или свадьбы провоцируют отвергнутых женихом или невестой свести счеты с жизнью? Более убедительным, но тоже недоказанным объяснением будет следующее. Некто отчаявшийся всю зиму борется с депрессией в надежде, что весной тучи рассеются. Но он окончательно сдается, когда наступает лето, выглядывает солнце, а никакого просвета нет…

В общем, смотрите в оба и помните, что существует три вида лжи: ложь, наглая ложь и статистика. Отличная книга, рекомендую.

Источник

Forane написал(а) рецензию на книгу
Оценка:

Мне приходилось много времени проводить за изучением статистической информации, собирать ее, анализировать и т.д. Таким образом, многое из написанного автором для меня секретом не было (да и для большинства населения никак не связанного со статистикой тоже). Единственный момент, на который я ранее не обращала внимание - это среднее, мода и медиана. Я как-то не задумывалась о том, какую среднюю используют авторы разнообразных статей (впрочем скорее всего это именно средняя арифметическая).

Основываясь на своем опыте скажу, что все что пишет Хафф в своей книге - правда. А с течением времени все написанное не менее актуально, чем пол века назад. За это время изменилась на мой взгляд лишь 3 основных фактора: упростился доступ простых обывателей к информации, упростился процесс сборки статистической информации, а также упростились методы и сократилось время, необходимое на проведение анализа статистических данных. В остальном же ничего нового не придумали. Люди также "ведутся" на нарисованный мешок денег, все также мелким шрифтом подписывают в рекламе, что исследования прошли 12 человек, а авторы статей продолжают обрезать и растягивать графики и "играются" с выборкой.

Немного успокаивает тот факт, что сейчас многие статистические данные может проверить даже обычный человек, если задастся этой целью и проведет за компьютером пару-тройку часов. Сейчас масса альтернативных источников начиная с нашего Росстата и статистики, которую предоставляют различные Министерства, заканчивая подсчетами, которые ведут иностранцы. На самом деле сейчас в открытом доступе предоставлено просто невероятное количество различного рода источников со статистическими данными.

Оценку я снизила за многочисленные повторения автором уже сказанных ранее вещей. За то, что к середине книге, лично у меня, начал постепенно угасать интерес, а картинки в книге стали не столь интересными)) С одной стороны вроде бы написаны правильные, нужные вещи, а с другой... ну, наверное это кому-то действительно необходимо.

lovely_reading написал(а) рецензию на книгу
Оценка:

Так или иначе, каждому из нас приходится сталкиваться со статистикой. Она повсеместно встречается и в Интернете, и на телевидении, и в газетах, книгах, и порой даже на улице. А множеству людей приходится работать со статистическими материалами по учёбе и работе. В обоих случаях нужно уметь правильно анализировать информацию, чтобы не стать обманутым.

Дарелл Хафф именно этому нас и учит в своей книге. И это у него получается отменно! Книга крутейшая! Вы, конечно, можете подумать, что я преувеличиваю, но это так. Ведь только подумать, 60 лет назад был написан этот труд, который актуален до сих пор!

Чего здесь только нет! И проблема выборки, и особенности иллюстирования, и методики расчёта. Автор всё это подробно объясняет.

Нас дурачат на каждом шагу, а мы, округлив глаза, верим очень многому. Всегда нужно включать свой мозг и думать: что значит эта информация? Как она была получена? Стоит ли верить источнику? Ведь часто это приводит к множеству заблуждений, сопровождающих нас чуть ли не всю жизнь, примеры которых автор неоднократно приводит.

Книга понравится и тем, кто не хочет быть одураченым, и тем, кто хочет научиться дурачить (не надо так!). А также всем, кто интересуется статистикой. Информация донесена крайне доступно и просто, читается махом. А забавные рисунки добавляют приятных эмоций от чтения! Каждое умозаключение автор подтверждает лёгким примером, и даже то, что могло быть недопонятым, усваивается и надолго откладывается в голове.

Умный человек не будет верить во всё, что бы ему ни сказали или показали. Он сто раз проверит, вдумается, почитает альтернативные источники. Так давайте все так делать и читать такие полезные книги!

Sukhnev написал(а) рецензию на книгу
Оценка:

Как получить годовой доход в размере 5.000.000₽?

Каждый из вас, наверняка, хочет повысить своё благосостояние и в разы увеличить размер годового дохода. Единственное препятствие на вашем пути – вы не знаете как это сделать. Вы боретесь с ним, пытаетесь его разрушить, вместо того чтобы обойти. Я вас уверяю: «Получить годовой доход в размере 5.287.800₽ совсем несложно». И прочитав эту рецензию, вы получите готовый инструмент с помощью которого собственно и будете заниматься своим финансовым положением. Я распишу вам каждый шаг, чтобы уж точно вас не унесло в сторону от ваших денег. Но в начале, все же поговорим о книге. Хотя и то что было до, и то что будет после – всё книга.
Многие из вас скажут: «Алло, это книга 1954 года, она уже давно устарела, в ней нет ничего актуального». Возможно, я даже с этим немного соглашусь, за исключением одного «но»: в нашей стране ужасная финансовая безграмотность. И сведения из этой «устаревшей» книги для многих будут воистину полезными.
Конечно, автор не будет учить вас работать с кредитными ставками, азам инвестирования или пониманию фондового рынка. Ничего из вышеперечисленного в книге нет. Есть только статистика, понимание которой, облегчит (возможно!) вашу жизнь.
Что же, именно, предлагает нам автор?
1. Вычисление «среднего». Вы же знали, что среднее можно вычислить разными способами? Если знали, вы молодец, а если нет, вот вам лишний повод прочитать эту небольшую книжечку. Как прочитаете, попрактикуйтесь, посчитайте среднюю ежемесячную з/п россиян разными способами и определите тот способ, который даст сумму наиболее близкую к реальности.
2. Манипуляция графиками. Многие из нас просто не задумываются об этом, видят график и верят. А ведь там используются такие банальные и пошлые хитрости.
3. Как при помощи статистики преувеличить превосходство одного над другим. Это вам даже в жизни пригодится (с оглядкой на вашу деятельность, конечно). Вот, например, вы либерал, научитесь статистическим трюкам и будете показывать через сравнения с Западом, как в «рашке» все плохо. Или вы путинист – 146% верности государю из 84%, ваше православие на уровне ультраконсервативного и хоть интернетом вы, естественно, не пользуетесь, но это не помешает вам с помощью, все тех же трюков, доказать (завысить) рейтинг поддержки Путина (это фундаментальная дискуссия), показать людям «как реально в Украине», открыть глаза на истинный размер американского госдолга и провести целый ряд спец-интернет операций на позиции «укро-фашистов» и «либерал-предателей». Статистика, мать её.
4. Что такое корреляция и как вас с помощью неё обманывают? Кто-то из вас не знает даже такого термина, кто-то не знает даже обмана. Но тем не менее, тема важная. Вот я вам скажу: ориентация человека влияет на то «парит» он или нет. И подтвержу свои слова расчетами, например, спрошу у 10 вейперов: Вы геи? «Да», – ответят мне они. Всё, вывод: вейп и гомоэротизм сопутствуют друг другу, а значит ориентация влияет на выбор человека.
Но я вас обманул. А вы поверили. Не надо так. Вы сейчас увидели самый коварный случай ковариация (значение термина прочитайте в книге или найдите в поисковике) – когда ни одна из рассматриваемых переменных не оказывает никакого влияния на другую, но при этом корреляция между ними действительно подтверждается расчётами.
Это был лишь один пример, в книге их ещё море. Быстрее открывайте.
5. Как с помощью процентов доказать ваш тезис?
Смотрите, при абсолютно идентичных параметрах, сравнение чего-то с чем-то можно выставить как в положительном, так и в отрицательном смысле. Ещё можно доказать что ничего не меняется, но вы же не центрист, поэтому вам это не нужно.
Вот вам пример: в прошлом году было 20 видов гендеров и 5 «посадок» за репост. В этом году 10 гендеров были убраны из списка, но число посадок за репост – настолько же поднялось. Теперь решайте сами: улучшается жизнь или наоборот, ухудшается. А сами способы подсчета ищите в книге, ибо спойлеры - это зло. Это как сказать что в «Разочаровании» главная героиня оживила свою мать, а не Элфо. Ужас же. Как такое можно говорить.
Естественно, я озвучил далеко не все. Заинтересовало? Читайте. Нет? Не читайте. А мы, тем временем, переходим к увеличению вашего годового дохода. Готовы стать самым богатеньким в своём посёлке городского типа, м?
Итак, средний доход россиянина в 2017 году составляет 31475₽. Это получается 377.700₽ в год. 377.700₽ – средний годовой доход одного человека в стране (Не переживайте, нижеизложенный способ работает при любой средней з/п).
1. Что мы делаем? Женимся/выходим замуж. Заводим 12 детей.
2. Умножаем 377.700₽ на 14
3. Получаем годовой доход семьи в размере 5.287.800₽.
Конечно, этот доход у вас будет чисто статистическим, но он ведь будет, верно? Поэтому хватит жаловаться на страну, чёртов потенциальный миллионер!

Isinca написал(а) рецензию на книгу
Оценка:

Книга написана в 60 с лишним лет назад, но это совершенно не чувствуется. Казалось бы прошло столько времени и все должно было кардинально измениться, а способы манипулирования информации шагнуть далеко вперёд, но прочитав эту книжку, понимаешь, что новое -- это хорошо забытое старое. Рассказанные уловки до сих пор можно увидеть на каждом шагу. Можно сказать, это база того, как нечестные маркетологи, газетчики и прочие заинтересованные лица, вводят массы в заблуждение. Плюсом к практической пользе, Дарелл Хафф приводит множество на самом деле увлекательных примеров, а ещё текст сопровождают очень забавные карикатуры.

Ari70750 написал(а) рецензию на книгу
Оценка:

«Надеюсь, вы не страдаете снобизмом, а я определенно не имею никакого отношения к рынку недвижимости. Но давайте считать, что вы все-таки сноб, а я – агент по продаже недвижимости и что вы как раз сейчас присматриваете земельный участок поблизости Калифорнийской долины, где я обитаю…»



Если бы я училась в университете, я бы хотела, чтобы статистику мне преподавал такой профессор как Дарелл Хафф. Книжка, даже не смотря на то, что относится к разделу non-fiction, читается на одном дыхании. Ты словно зашел в лекционный зал, отсидел сдвоенную пару введения в статистику и, с одной стороны, вроде бы и насмеялся вдоволь, а с другой - и знаний чуток приобрел. Я люблю математику и всегда с трепетом отношусь к людям, которые не равнодушны к цифрам. То, с какой легкостью Хафф говорит о вещах, связанных со счетом и подсчетом, сдабривая теорию яркими примерами из истории и толикой саркастического юмора, просто не может оставить равнодушным. Эта книга была написана почти пол века назад, и некоторые доводы с появлением Интернета уже несколько утратили свою актуальность, но бОльшая часть все еще применяется на практике и маркетологами, и статистиками и многими другими специалистами, которые предоставляют на наше обозрение красивые графики, серьезные циферки и железобетонные выводы, за которыми может крыться пустота. Любознательно, познавательно и очень увлекательно. Я бы сказала, что это книга про жуликов в мире цифр (или для жуликов в мире цифр, тут уж все зависит от уровня честности и сознательности каждого индивидуального читателя).

Karsakov написал(а) рецензию на книгу
Оценка:

Как не дать себя обмануть?

Книга написана полвека назад, но от этого изложенные идеи совершенно не теряют актуальности. В мире, где новостные заголовки и заявления рекламодателей насквозь пронизаны данными исследований важно разбираться в качестве озвучиваемых цифр. Например знали ли вы что «среднее значение» (средняя зарплата, средний размер семьи, средняя стоимость товаров) могут быть трех видов? Один и тот же массив данных можно подать разными способами:

- среднеарифметическое
- медиана
- мода

Простой пример манипуляции средним значением:

Руководитель предприятия при найме на работу менеджера по продажам может заявить, что его сотрудники зарабатывают в среднем больше 80 тыс. руб. в месяц, – ему выгодно назвать наиболее притягательную цифру. Если 10 сотрудников зарабатывает по 30 тыс., 5 по 80 тыс., а 2 руководителя группы зарабатывают по 350 тыс. руб – среднеарифметическое действительно будет больше 80 тыс., а вот мода и медиана будут равны 30 тыс. Налоговой службе такой руководитель вероятно назовет последнюю цифру.

Наша зубная паста на 15% лучше удаляет налет

Рекламодатели заявляя об ошеломительной эффективности продукта, относительно конкурентов, проводя исслеования предпочитают небольшие выборки. Если взятая для исследования группа, достаточно велика и правильно отобрана, то для большинства надобностей она будет вполне репрезентативной. В противном случае выборка даст вам значительно менее точное представление о целом, чем сколько-нибудь обоснованные прикидки, а ее единственным достоинством будет разве что иллюзорное впечатление научной точности.

Если простуду лечить, то она проходит за 7 дней...

Наш мозг так устроен, что все время пытается создавать причинно-следственные связи, а еще предпочитает простые ответы сложным – этим и пользуются различные любители манипуляций общественным мнением. Автор разбирает эту когнитивную ошибку на вере жителей островов Новые Гибриды в то, что вши приносят здоровью сплошную пользу – вшивость была нормальным состоянием всех членов племени. Когда же кто-то из членов племени заболевал лихорадкой, температура тела становилась слишком высокой для комфортного обитания вшей, и они покидали своего хозяина. Островитяне же считали, что человек заболевал вследствие покидания вшей. Это тот случай, когда причина и следствие поменялись местами, да еще и спутались.

Короткая и полезная книга, которая побуждает задавать больше вопросов при столкновении с результатами каких-то исследований и докапываться до сути.

shamko2005 написал(а) рецензию на книгу
Оценка:

Прививка от доверчивости.

Эта книга – самое настоящее лекарство от доверчивости. В ней раскрыты основные способы манипуляции статистическими данными, с целью предоставить их в наиболее выгодном свете, начиная от выбора неправильной средней и заканчивая визуальными махинациями. Правда мне показалось, что это скорее некое введение в курс дела, толчок к дальнейшему изучению вопроса. Большая часть материала слишком очевидна и поверхностна.

Даже я - человек “не в теме” ожидал большего, поэтому думаю, что те, кто более-менее знаком с искусством статистики ничего нового в данной книге не найдут. В добавок к этому в ней много воды (в книге маленького формата объемом 160 страниц!). Одну идею автор мусолит несколько страниц подряд.
Но, не смотря на все эти минусы, прочитать это пособие мне было полезно, своего рода напоминание, что не все то, что цифры следует принимать на веру. К тому же некоторые истории были действительно интересными. Написаны в духе "Фрикономики".

zim-is-dev написал(а) рецензию на книгу
Оценка:

Будь бдителен, всегда спрашивай и проверяй перед тем как поверить цифрам.

Несмотря на то что книга написана в 1954 году, многое до сих пор остается актуальным. Мы слепо верим цифрам, процентам и статистическим графикам. Рекламщики не дремлют и производитель не прочь повысить продажы приведя цифры и просто умолчав о выборке. Книга покажет на ярких примерах и картинках почему не стоит верить статистике, почему всегда нужно перепроверять данные, и, как лгать при помощи статистики.

riwula написал(а) рецензию на книгу
Оценка:

Хотите узнать, как нас обманывают продавцы недвижимости, почему нельзя доверять клиническим исследованиям, какие уловки используют СМИ и главное действительно ли все человечество страдает неврастенией? Если да, то вам определенно придется по вкусу эта маленькая (всего 161 страница) книжечка.

Все лгут, ну ладно не все, но статистики точно). Несколько манипуляций с цифрами и вот мы уже видим очередное громкое заявление -- с нашей зубной пастой образование кариеса снижается на 23% или цены по сравнению с прошлым годом выросли на 50%. Но можно ли доверять этой информации? По сути статистика не очень точная наука. В какой-то мере все зависит от случая и воли статистика.

При опросе охватили не все группы населения и уважаемый журнал, чьим прогнозам доверяла вся страна, ошибается в новом президенте. Неверно интерпретированы данные и вместо больших, вместительных домов, возводятся крошечные домики, на которые совсем нет спроса. Все это скорее примеры случайных ошибок, которые в первую очередь навредили самим специалистам. Но вот в попытках намеренного манипулирования нашим мнением статисты не знают себе равных. Одним из самых ярких примеров не постоянства статистики является информационная война, развернувшаяся в 40-х годах прошлого века между профсоюзами и заводами. Оперируя одними и теми же цифрами каждая сторона так ловко их интерпретировала в свою пользу, что журналу Time в обзорной статье пришлось накладывать полученные данные друг на друга, чтобы не принимать чью-либо сторону и показать что те и другие в общем-то правы. Если даже в таком серьезном деле, как распределение прибыли, можно перетянуть цифры на свою сторону, то что уж говорить о манипуляциях в рекламе. Маленькие выборки, небольшие случайности и в прессе уже появляются провокационные заголовки о менее вредных сигаретах и абсолютно не потеющих дамах.

Автор собрал большинство уловок, которые используют недобросовестные статистики и конечно же способы, как вывести их на чистую воду (одна из глав так и называется: как поставить статистика на место). Что примечательно, этот труд был написан еще в 50-х годах прошлого века, но свою актуальность не потерял до сих пор. В целом книга оставила только приятные впечатления: нет воды, простой язык, масса забавных примеров и иллюстраций и самое главное совсем не обязательно знать что такое мода, медиана, выборка, чтобы получить от нее удовольствие.

Кстати, по данным статистики, в мире продано 7 299 792 458 экземпляров этой книги. Как вы думаете, каким способом была получена эта информация?