В течение последних нескольких лет я отсылал своих друзей и коллег к Откуда Spotify так хорошо вас знает?, написанной Софией Чокка. Хотя с 2017 года в блоге были некоторые обновления, есть некоторые новые технические и бизнес-движения, которые я хотел бы здесь затронуть.

Я расскажу об основных моментах в статье Чокки, чтобы вы были в курсе. Поднятый вопрос заключается в том, что Spotify вряд ли является первым сервисом потоковой передачи музыки или первым, кто использует алгоритмическое курирование. Так что же способствовало его успеху?

Вероятно, наиболее важным показателем успеха любой платформы перед IPO является количество активных пользователей в месяц. Начиная с 2015 года, число пользователей Spotify увеличивается почти каждый квартал, и в настоящее время, по данным Statista, число пользователей приближается к полумиллиарду. Сравните эти цифры со своим прямым конкурентом, Apple Music, чтобы обнаружить, что Spotify почти на 7 лет опережает его по привлечению слушателей.

Spotify как социальная сеть

Учитывая, что у всех основных потоковых сервисов есть миллионы лицензированных песен, количество пользователей действительно является тем, что отличает Spotify в отрасли. Это то, что позволяет использовать совместную фильтрацию, о которой Чиокка рассказывает в своей статье. Чем больше пользователей, тем больше потенциальных совпадений между этими пользователями, что позволяет Spotify принимать более обоснованные решения по курированию. Поэтому имеет смысл, что ваши рекомендации со временем станут лучше, даже если Spotify технически ничего не изменит.

Я считаю, что совместная фильтрация — это попытка Spotify стать социальной сетью, не позволяя нам получить доступ к самой сети. Нам показывают простую ленту «Активность друзей» в настольном приложении, а Spotify недавно добавил поддержку кураторских «смесей» между друзьями. Таким образом, Spotify действительно знает, кто наши друзья, а также знает, как поставить нас в неловкое положение перед нашими друзьями. Но мы не можем публиковать отдельные сообщения или отправлять прямые сообщения, как в наших традиционных приложениях для социальных сетей.

Тем не менее, пока мы говорим о социальных функциях, я должен особо отметить Spotify Wrapped, который, несмотря на то, что в этом году он немного отставал, нашел свое отражение во всех моих лентах в Instagram и Twitter.

Spotify как компания, занимающаяся искусственным интеллектом

Несмотря на эти модные функции, Spotify рассматривается не как приложение для социальных сетей, обнаруживающее дублирование контента (что само по себе является базовой техникой обработки данных), а скорее как приложение для курирования с интенсивным использованием ИИ. Конечно же, компания нанимает только лучших инженеров по данным/машинному обучению, и обычно только тех, кто имеет степень магистра или докторскую степень. Поэтому, когда дело доходит до масштабируемости естественного языка и обработки звука — опять же, широко охваченных Ciocca, — трудно конкурировать с лучшими в своем классе.

К сожалению, поскольку я не сотрудник, я не могу точно сказать, что за NLP и DSP происходит под капотом. Но как программист в этой области, я могу рассказать вам о некоторых последних отраслевых достижениях, над внедрением которых Spotify определенно будет усердно работать в этом году.

  • Преобразование речи в текст: как я писал в своей статье Обработка звука для обнаружения пиратства в TikTok, получение слов из аудио может быть намного сложнее для компьютеров, чем для людей. Эта проблема только усиливается при пении и рэпе, поскольку слова могут трансформироваться или произноситься по-новому. Musixmatch пытается решить эту проблему, предоставляя тексты песен, сгенерированные ИИ, которые могут помочь предоставить метаданные по запросу, когда артисты забывают. Но вы, наверное, заметили, что эти тексты не догнали людей на Genius.com.

  • Вокальная и инструментальная изоляция: Сплитер — лучший бесплатный вариант, который у нас есть для разделения звуковой дорожки на отдельные части. Ходят слухи, что Spotify пытались внедрить Режим караоке в 2021 году, но технология не совсем догнала продюсеров-людей, которым не нужны вычислительно затратные нейронные сети для выделения вокала.
  • Перекрестное затухание и диджеинг: Spotify имеет базовую функцию автоматического затухания дорожек, что уменьшает пустое пространство. Но, опять же, эта функция не идет ни в какое сравнение со способностями людей-ди-джеев, что является частью того, что делает приобретение Soundtrap — облачной цифровой звуковой рабочей станции (DAW) — таким интересным.

Все эти функции намекают на более широкую идею о том, что в конечном итоге составление музыки и создание будут одним и тем же. По мере развития ИИ приложения будут не только персонализировать контент для подгрупп пользователей, но и фактически генерировать живой контент для каждого человека. Персонализация действительно будет личной — возможно, нам просто придется немного подождать.

Spotify как приложение для подкастов

Тем временем Spotify, похоже, в основном сосредоточен на том, чтобы стать универсальным магазином музыкальных и подкастов, что в последние годы определенно сбивало инвесторов с толку. Несмотря на признание того, что подкасты не превзойдут интерес к музыке, генеральный директор Даниэль Эк придерживается своей стратегии в приобретении приложений для подкастов, таких как Anchor and Podz.

Многим такое рассуждение кажется странным, особенно если учесть, что Spotify уже сейчас лидирует в музыкальном потоковом вещании и вступает в некую жесткую конкуренцию с Apple и Google Podcasts. Что касается бизнес-стратегии, нам придется подождать и посмотреть, как это сработает, но как инженер данных и менеджер по продукту я понимаю, почему новый акцент на подкастах так привлекателен.

Подкасты не только увеличивают взаимодействие с приложениями на несколько часов в неделю на пользователя, они также демонстрируют немузыкальные интересы пользователей и могут дать представление о том, какие знаменитости и темпераменты наиболее ценны. Тот факт, что The Joe Rogan Experience возглавил чарты в 2022 году, ясно говорит об одном: пользователям Spotify нравятся споры, и, похоже, они не получают достаточного удовольствия от своей музыки.

Вот и новый год потокового вещания!