Как машинное обучение может помочь вам определить ваших целевых клиентов

Краткий обзор кластеризации k-средних.

Кластеризация K-средних — это тип неконтролируемого алгоритма машинного обучения, который можно использовать для идентификации групп точек данных, похожих друг на друга. Алгоритм работает, сначала случайным образом назначая каждую точку данных одному из K кластеров. Затем алгоритм итеративно обновляет центроиды кластера (т. е. среднее значение всех точек данных в кластере) и назначения точек данных до тех пор, пока центроиды перестанут изменяться. Окончательные назначения кластеров затем используются для определения групп похожих точек данных.

Обсуждение преимуществ использования машинного обучения для выявления целевых клиентов.

Кластеризация K-средних может использоваться для решения множества проблем в контексте встречи между премьер-министром Моди и президентом Байденом. Например, алгоритм можно использовать для выявления групп стран, имеющих схожие интересы в таких вопросах, как терроризм, изменение климата и экономика. Затем эту информацию можно использовать, чтобы помочь двум лидерам расставить приоритеты в своих обсуждениях и определить области, в которых они могут работать вместе.

Пример компании, которая использовала машинное обучение для определения целевых клиентов.

Машинное обучение можно использовать для определения целевых клиентов несколькими способами. Один из способов — использовать машинное обучение для анализа данных о клиентах, чтобы выявить закономерности и тенденции. Затем эту информацию можно использовать для создания профилей клиентов, которые можно использовать для целевых маркетинговых кампаний.

https://github.com/devWorldDivey/mediumposts_helper/blob/main/C1/targetcustomerbasedonincome.pdf

Важные моменты:

  1. Мы можем использовать метод локтя, чтобы определить количество кластеров, которые мы можем использовать.

Метод локтя — это эвристика, используемая для определения количества кластеров в наборе данных. Метод состоит в построении графика суммы квадратов внутри кластера (WCSS) в зависимости от количества кластеров и выборе изгиба кривой в качестве количества используемых кластеров.

inertias=[]
for i in range(1,10):
    kmeans=KMeans(n_clusters=i,random_state=0)
    kmeans.fit(points)
    inertias.append(kmeans.inertia_)
plt.plot(range(1,10),inertias)
plt.xlabel("Number of clusters")
plt.ylabel("Inertia")

Интуиция. Использование "локтя" или "колена кривой" в качестве точки отсечки — это обычная эвристика в математической оптимизации для выбора точки, в которой убывающая отдача больше не стоит дополнительных затрат. При кластеризации это означает, что нужно выбрать такое количество кластеров, чтобы добавление еще одного кластера не приводило к лучшему моделированию данных.