Шеф-редактор «Статистики» в «Тинькофф-журнале» рассказывает, почему тяжело найти дата-журналиста, как работать с числами и что делать, если данные врут.
Как ты попал в «Тинькофф-журнал»?
Про «Т—Ж» я узнал от знакомой, когда работал на радио. Она поделилась в «Живом журнале» опытом работы с медиа и рассказала, что можно отправить заявку. Я отправил один текст, другой — и понеслось.
Первые статьи были про безопасность. Например, что сделать, чтобы квартиру не ограбили. Я писал от лица жертвы. Потом Саша Рай, который тогда был издателем, попросил написать статью про выбор сейфа. Я пришёл к своему товарищу, который ими торговал, и взял комментарии для материала.
Как произошёл переход из автора в редакторы?
Когда я написал и опубликовал для «Т—Ж» много статей как автор, решил попробовать себя в редактуре. На тот момент в журнале был один редактор — Максим Ильяхов. Через него проходили все статьи, но потом решили внедрить и промежуточную редактуру — до главреда. Я попросил Максима дать мне поредактировать тексты. Он разрешил, но у меня не вышло.
Тогда я продолжил работать автором. Через год повторил попытку, и на этот раз всё сложилось — я стал редактировать чужие материалы.
Как ты стал шеф-редактором «Статистики»?
Всё началось, когда Максим предложил написать статью про среднестатистического россиянина: составить собирательный портрет жителя страны. Нужно было найти много данных: о средней зарплате людей, их возрасте, местах работы, средней продолжительности жизни, частых причинах смерти. На тот момент редакции «Статистики» ещё не существовало. Статья залетела, и мы стали регулярно писать тексты на основе данных.
Сначала я был автором. Позже редактировал чужие статьи. Затем в «Т—Ж» появилась ставка дата-журналиста, на которую взяли постоянного автора. Мы начали делать материалы вместе.
За несколько лет статей накопилось много. Фактически редакция уже существовала, нам оставалось только назвать её, что мы и сделали. Так появилась «Статистика», а я стал шеф-редактором.
Какие навыки нужны, чтобы работать с большим объёмом данных?
Статистика — это голые цифры, которые нужно внимательно анализировать. В некоторых вузах есть магистратура дата-журналистики, например в ВШЭ. Там учат писать тексты на основе данных: брать некие цифры и превращать их в историю. Для России это относительно молодое направление.
Почти все наши авторы — дата-журналисты, которые занимались данными со студенчества. Но на рынке таких людей мало. Тяжело найти автора, который разбирается в цифрах. А человека, который разбирается в больших количествах цифр, — ещё сложнее. Должен быть универсальный специалист, который одновременно пишет текст, не боится таблиц на несколько десятков тысяч строк и знает, что с ними делать. Из данных нужно вытаскивать истории, факты, важно видеть аномалии и пытаться их объяснить.
Должен быть универсальный специалист, который одновременно пишет текст и не боится таблиц
Как правило, у людей, поступивших на журфак, не очень хорошо с цифрами. Я не хочу делить людей на гуманитариев и математиков, но когда я преподавал в университете, бо́льшая часть студентов шла в журналистику, потому что при поступлении не нужно было сдавать алгебру.
Сейчас мы хотим нанять ещё одного редактора, но долго и безуспешно его ищем. Дата-журналистов мало, и мы все друг друга знаем: есть примерно 30 известных человек. Дефицит кадров — моя боль.
Как редактору научиться работать с данными?
Прочтите книгу Александра Богачёва «Графики, которые убеждают всех» и «Как лгать при помощи статистики» Дарелла Хаффа. Последняя была написана ещё в 60-х годах и многократно переиздавалась. Это классика. В книгах рассказано в том числе про манипуляции данными.
Почитайте Скотта Беринато «Сделай наглядно! Как визуализировать данные понятно и убедительно». Это хорошая книга про визуализацию и работу с графиками.
У нас с Пашей Фёдоровым есть платная образовательная рассылка для начинающих «Данные на минималках». На неё можно подписаться и сразу вкатиться в тему.
Есть курсы дата-журналистики, например от «Нетологии». Но сама по себе дата-журналистика — не профессия, а инструмент. Если человек захочет стать дата-журналистом, он просто освоит ещё один важный навык, который будет применять в работе.
Можно обойтись без курсов и найти хорошего наставника, который всё расскажет и покажет: где найти статистику, как сортировать данные, как пользоваться сайтом Росстата. То же с визуализацией: можно научиться самому, потратив несколько десятков часов на одну задачу, но проще пойти к опытному человеку.
Какая цель у статей вашей редакции?
Хотим показать на цифрах, как живёт страна: что люди едят, пьют, как они работают, сколько зарабатывают, сколько денег тратят, на что. Мы рисуем усреднённый портрет россиянина.
Ещё стараемся сравнивать между собой регионы, чтобы человек мог идентифицировать себя по отношению к соотечественникам. Например, он мог бы определить: «Я живу лучше, потому что у меня нет столько кредитов, как у среднестатистического жителя страны». Это скорее вопрос самоидентификации: где я нахожусь относительно других.
Любой желающий может написать статью в «Статистику»?
У нас нет штатных авторов. Мы работаем с теми, кто пишет тексты, по договору оферты. Ограничений нет. Любой человек может предложить свою тему или выбрать из списка. Но получится написать статью или нет — другой вопрос. Постоянных авторов можно пересчитать по пальцам одной руки. Как правило, если человек написал 2−3 статьи, он будет писать и дальше.
В чём заключается твоя работа как шеф-редактора?
У нашей редакции есть годовой план. Он описывает шаги на уровне стратегии и тактики: какие новые форматы и проекты запустим, что для этого будем делать, в какую сторону хотим расти и прочее. Я планирую выпуски, вместе с командой ищу источники данных, анализирую статистику и редактирую тексты. Некоторые материалы пишу сам. В месяц мы выпускаем примерно 15 статей.
Где берёте данные?
В первую очередь пользуемся официальной статистикой, которой в России очень много. Также используем базы данных международных организаций — ВОЗ, ООН, ОЭСР и других. Анализируем обзоры рынков, маркетинговые исследования, научные публикации.
Получаем обезличенную статистику от банка. Мы не видим личные данные клиентов, но можем посмотреть, например, сколько в среднем люди тратят на красоту или как меняются траты на такси.
Некоторые исследования проводим сами. Например, в конце 2022 года мы выяснили, сколько зарабатывают авторы, редакторы и копирайтеры. Для этого собрали больше трёх тысяч анкет, что позволило сделать релевантные выводы по отрасли. В этом году мы решили повторить исследование, чтобы посмотреть, как изменилась ситуация с зарплатами за год.
Запрашиваете информацию у внешних источников?
Многое лежит в открытом доступе, но бывает запрашиваем. Мы плотно работаем с компаниями «Авито», «Хедхантер», «Эвотор» и «Дубль-гис»: у них много своих данных. Обычно с нами делятся статистикой без проблем, потому что она обезличена. Для бизнеса это пиар в крупном медиа, а для нас — бесценные данные.
Если не понимаем, как собрана официальная статистика, обращаемся к первоисточнику. Например, пишем в Росстат с просьбой пояснить тот или иной момент. Несколько раз обращались в Центробанк.
Также мы запрашиваем информацию в госслужбах, если данных в открытом доступе нет, но понимаем, что они быть должны. Так бывает, если есть некая информация за 10 лет подряд, но в этом временном ряду пропущен год. Мне кажется, при всей своей закрытости государство выкладывает данные по максимуму. Многие довольно быстро отвечают, и проблем не возникает.
Если нам нужны определённые данные, я примерно понимаю, где их найти. Например, «Эвотор» — компания, у которой есть банковские кассы. Её статистика поможет увидеть в цифрах, сколько люди тратили денег и на какие продукты. У государства нет такой информации.
Другой пример. Если нужно узнать среднюю зарплату по конкретной профессии, тоже есть нюансы: Росстат в торговлю записывает всех работников магазинов, включая водителей, бухгалтеров и уборщиков. А нам, скажем, нужны конкретно продавцы. Тогда мы пойдём в компании, которые занимаются вакансиями: в «Хедхантер» или «Авито». Возьмём у них срез предложений от работодателей и получим примерную среднюю зарплату.
Данные госструктур перепроверяете?
Да, но не всегда можно перепроверить. Например, Росстат часто обвиняют в неправильной методологии и манипуляции данными. Но нужно понимать, что по многим темам никто, кроме Росстата, не собирает данные. Другой статистики попросту нет. Поэтому мы предупреждаем читателя о спорности методологии либо пишем, что эту статистику критикуют.
Зацикливаться на конкретных числах из госстатистики не стоит, лучше изучать тренды. Например, мы можем без них сказать, на что человек стал тратить больше денег или на чём стал экономить. Сами по себе цифры ничего не значат — важны закономерности.
Зацикливаться на конкретных числах из госстатистики не стоит, лучше изучать тренды
Отличается ли международная статистика от российской?
У нас статистики меньше, чем за рубежом, потому что до 91-го года большинство данных были закрыты, и чиновники не привыкли ими делиться. Они считают, что это странно, страшно, а информация секретна.
В западных странах есть культура открытых данных: люди привыкли всё собирать и выкладывать. Плюс там намного больше показателей. Например, можно узнать, сколько люди едят картошки фри, или найти статистику по другим мелочам из жизни человека.
Что делать, если данные врут?
Если мы понимаем, что данные врут, перепроверяем их через другие источники. При расхождении информации говорим читателю, что один источник указал так, а другой — иначе. Бывает, сопоставив статистику, мы не понимаем, почему числа расходятся. Тогда можно только предположить, что их собирали разными методами.
Например, такая история произошла, когда мы писали материал про заработок медиков. По майским указам президента есть норматив: зарплата врача должна в два раза превышать среднюю зарплату по региону. Мы решили проверить реальные цифры.
Есть сайт «Работа в России» — это портал, куда все центры занятости складывают вакансии. А когда у бюджетной организации открывается вакансия, они первым делом отправляют её в центры занятости. Мы в редакции достали с сайта все вакансии врачей. Отфильтровали их и увидели, какую зарплату предлагают больницы и о какой отчитывается госстатистика. Данные реальных зарплат оказались ниже.
В бюджетной сфере есть манипуляции, когда человек работает на две ставки или полторы. Таким образом он догоняет норму, установленную майскими указами. Но если человек честно работает на одну ставку, зарплата намного ниже, чем требует государство.
Мы написали, что есть статистика Росстата, но если посмотреть на вакансии больниц, видна другая картина. Мы не говорили, что государство врёт, потому что есть вопросы именно к методологии: Росстат берёт фонд заработной платы больницы, делит на количество врачей и получает среднюю зарплату.
Теоретически государственную статистику можно перепроверить, но на это ни у кого не хватит ресурсов. Единственный способ получить абсолютно верные данные — подойти к каждому врачу в стране и узнать его средний заработок. Мы не можем провернуть это чисто технически: Россия — не Монако, где живёт всего несколько десятков тысяч человек.
Теоретически государственную статистику можно перепроверить, но на это ни у кого не хватит ресурсов
Были случаи, когда статью опубликовали, а информация в ней оказалась неверной?
Да, читатели приходили в комментарии и говорили: «Ребята, вы здесь всё перепутали». Встречались ошибки в нескольких местах, но не во всём материале.
Бывает, что читателю не нравятся данные, и он говорит: «Вы всё врёте, не существует таких зарплат». А бывает, что опубликованные числа не отражают реальность по вине тех, кто их собирал. Например, мы нашли отраслевой отчёт, где посчитаны все стадионы в России, и результат меньше, чем есть на самом деле. В таком случае читатель приходит и указывает: в таком-то регионе стадионов больше.
Что делать с устаревшими данными?
Наша редакция постоянно обновляет материалы — это отдельный процесс. Новая порция статистики выходит, к примеру, раз в год. Мы открываем старый текст, обновляем его и ставим отметку, что он отредактирован такого-то числа. В конце статьи закрепляем комментарий о том, что текст написан по новым данным. То есть не просто переделали материал, а обновили. В нём свежие цифры, потому что мы понимаем, что читателю в 2023 году неинтересно читать про среднестатистического россиянина 2019 года.
Как выбираете, какой материал обновлять?
Сначала смотрим, насколько реально обновить материал, потому что некоторые статьи написаны потом и кровью. Чтобы их переделать, нужно перелопатить очень много информации. Например, у нас была статья про машины такси в регионах. Мы доставали и сравнивали по каждому региону отдельные куски данных. Обновить такой текст трудозатратно, а по посещаемости он не принесёт миллион просмотров. При выборе материала мы прежде всего смотрим на его читаемость и трафик, который на него идёт.
Расскажите о самом интересном исследовании.
Мы в редакции «Статистики» написали текст на основе исследования Росстата про бюджет времени. Описали, сколько люди тратят на работу, еду, сон и чтение. Потом составили усреднённый режим дня.
Позже, когда я был в Питере, случайно попал на выставку, где тоже рассказывали про бюджет времени, но речь шла о 30-х годах прошлого века. На выставке я сфотографировал выдержки из статистических ежегодников со ссылками на издание и диаграммы.
Затем в новом материале мы сравнили, как изменилась жизнь нашего соотечественника за последние 90 лет. Оказалось, что затраты времени на работу те же, а вот учёбе мы посвящаем меньше времени. Было интересно посмотреть, как у человека менялось отношение к своей жизни на такой длинной дистанции.
Есть вещи, которые невозможно посчитать, но очень хочется?
Самое интересное — залезть в чек магазина и выяснить, сколько и что люди покупают. Но измерить совсем всё не получится: обычно можно узнать только категории товаров.
Ещё интересно залезть в тарелку. Например, по продажам мы можем посчитать, какой сахар люди покупают чаще. Но увидеть, сколько действительно они употребляют сахара, — нет, ведь он есть и в консервации, и в выпечке. Однако такие данные важно знать с медицинской точки зрения.
Увы, нельзя залезть в душу. Несмотря на то, что социологи пытаются измерить человеческое счастье и придумывают для этого индексы, затея очень спорная. Не получится точно оценить переживания человека: насколько он грустный или радостный.
Эмоции невозможно посчитать. Например, как международные исследовательские организации оценивают счастье? Вас спрашивают: «Если есть лестница из 10 ступенек, где первая — это абсолютное горе, а последняя — абсолютное счастье. На какой ступеньке вы находитесь?» Мы понимаем, что подход лукавый, ведь кто-то в момент опроса находится в депрессии, а кто-то влюблён, и у него гормоны на максимуме. Человек будет завышать или занижать оценку. В каком состоянии он находится на самом деле, мы не узнаем.