Простые шаги для лучшей аналитики

Вы прошли все курсы, необходимые для того, чтобы стать аналитиком данных. SQL? Проверять. Питон? Проверять. Вы недавно стали аналитиком данных или являетесь начинающим аналитиком.

Без сомнения, ваши технические навыки помогут вам в этой роли, но как вы можете стать еще более сильным аналитиком?

Год назад я получил диплом инженера-химика и получил должность аналитика данных в технологической компании. Я не знал, чего ожидать от своей первой роли в области анализа данных.

Вот несколько советов, которые мне хотелось бы знать до того, как я стал аналитиком данных, чтобы вам не пришлось заучивать их на собственном опыте.

Как аналитик данных, я отвечаю на вопросы бизнес-групп с анализом данных. Это звучит почти тривиально — аналитики данных просто отвечают на вопросы, верно?

Не совсем. Дьявол кроется в деталях.

То, как аналитик отвечает на вопрос, определяет качество аналитики.

Вот почему мои три совета

  • Знайте тип вопроса — и отвечайте соответствующим образом.
  • Знайте намерение вопроса — и не становитесь обезьяной-вопрошателем.
  • Расскажите истории данных.

Прежде чем перейти к ним, я сначала подытожу, чем занимается аналитик.

Роль аналитика

Часто информацию о данных лучше всего передавать с помощью чисел или диаграмм. Для этого я использую эти инструменты из своего набора инструментов.

  • SQL для извлечения данных из облака (моя компания использует BigQuery и PostgreSQL)
  • Tableau, Google Data Studio и Metabase – это инструментальные панели бизнес-аналитики (BI), с которыми заинтересованные стороны могут взаимодействовать.
  • Python и R для обработки и визуализации данных, особенно если требуются определенные пакеты.
  • Таблицы Google и Excel необходимы для представления небольших наборов данных.

Вот пример рабочего процесса.

  1. Заинтересованная сторона бизнеса обращается к аналитику с вопросом, на который можно ответить с помощью данных.
  2. Аналитик данных работает с заинтересованными сторонами, чтобы понять их намерения.
  3. Аналитик предоставляет идеи и рекомендации с данными — с надлежащими навыками повествования данных.
  4. Промыть и повторить.

Теперь, когда это не так, вот мои советы для начинающих и новых аналитиков данных, пока вы на работе.

1. Знайте тип вопроса — и отвечайте соответствующим образом.

Вопросы, на которые отвечает аналитик, могут исходить от разных команд (продаж, продуктов, маркетинга, операций, стратегии или инженерии). Эти вопросы можно разделить на шесть различных типов.

Описательный

  • например Кто наши самые активные пользователи?
  • Требует коротких и быстрых ответов.

Исследовательский

  • напр. Почему некоторые пользователи больше не активны?
  • Призывает исследовать несколько вероятных гипотез.

логический

  • напр. Является ли уменьшение числа активных пользователей результатом Covid?
  • Призывает к глубокому изучению одной гипотезы и поиску корреляций между различными наборами данных.

Предиктивный

  • напр. Кто из клиентов станет активным в будущем?
  • Призывает к использованию прогностических моделей, потенциально в форме регрессии.

причинный

  • напр. Приводит ли введение вознаграждений в приложении к причинению большей активности пользователей?
  • Призывает к использованию статистически значимых экспериментов (например, критерий хи-квадрат) на выборке пользователей.

механистический

  • напр. Как вознаграждения в приложении повышают активность пользователей?
  • Призывает к исследованию и связыванию нескольких связанных наборов данных.

Знание того, на какой тип вопроса вы отвечаете, обеспечивает основу для ответа на вопрос.

Подробнее читайте в бесплатной книге Art of Data Science Роджера Д. Пэна и Элизабет Мацуи. Это относительно быстрое чтение, которое я рекомендую.



2. Знайте цель вопроса — и не превращайтесь в обезьяну, занимающуюся вопросами.

Обезьяна запросов извлекает данные по запросу, не спрашивая, на какой вопрос отвечают эти данные. Часто цель запроса данных скрыта от глаз и обнаруживается только после некоторого исследования. Вот почему мне нравится думать о запросах данных как об айсберге.

Вы будете удивлены — иногда запрашивающий данные может даже не знать, зачем ему действительно нужны данные.

Вот почему понимание намерения помогает аналитику лучше отвечать на вопросы запрашивающего. Прежде чем приступить к извлечению или исследованию данных, я должен убедиться, что понимаю следующие 5W1H.

5W1H данных

  • Кто является конечным пользователем этих данных?
  • Каково влияние этой работы?
  • Когда соответствующий период?
  • Откуда я могу получить данные?
  • Зачем нам это надо?
  • Как будет использоваться анализ данных?

Это проливает больше света на то, какой набор данных нам нужно использовать, чтобы ответить на какие вопросы. Я более подробно рассказал о том, как мы можем понять цель запроса данных здесь:



Расскажите историю данных

Рассказывание историй о данных — это искусство использования повествовательной структуры для передачи информации о данных. Без надлежащего повествования данных ненужные детали и данные могут легко заглушить ключевые идеи.

Один из советов, который мне нравится использовать при передаче идей, — это использование прогрессивных раскрытий. Предложенный Tableau, он привлекает внимание аудитории к истории данных.

Представьте процесс:

  • Во-первых, объясните, что такое оси.
  • Затем покажите одну точку выборки данных.
  • Затем откройте больше точек данных.
  • Используйте цвета, чтобы показать различия в точках данных.
  • Добавьте анимацию, чтобы показать изменения с течением времени.

Мой любимый пример этой техники, безусловно, «200 стран, 200 лет, 4 минуты» Ганса Рослинга. Здесь Рослинг строит свою историю данных по одному элементу за раз, попутно вовлекая аудиторию.

Для получения дополнительных советов по рассказыванию историй я определенно рекомендую

Чтобы научиться рассказывать истории на основе данных, я рекомендую следующие ресурсы:

Закрытие

Знание этих советов в теории отличается от применения их в повседневной работе. Включив их в свою работу, я обнаружил, что могу лучше отвечать на вопросы конечных пользователей, и они также лучше понимают мою аналитику.

Если вам нравится это, вам также может понравиться:





Если вам нужен список курсов для изучения науки о данных, вот мои рекомендации.



Я регулярно публикую контент на Medium и LinkedIn, так что не стесняйтесь подписываться на меня на Medium и LinkedIn.