Squeak.ru - шаблоны программирования

Как запустить корреляции для каждого подмножества строк в Pandas?

Предположим, у меня есть вымышленный фрейм данных pandas df.

Предположим, что он имеет три столбца: gender, height и weight.

Есть ли встроенный или эффективный метод для получения корреляции height и weight для каждого gender?

Что я сделал до сих пор:

  1. Вручную отфильтровали фреймы данных для каждого пола, а затем выполнили
    корреляции для каждого из них.
  2. Это сработало в моем наборе образцов, но не работает в рабочем наборе, потому что у меня больше категорий, чем просто gender. У меня сотни.

Пример моего неоптимального кода:

df_m=df[(df['gender']=='male')]
df_m['height'].corr(df_m['weight'])
df_f=df[(df['gender']=='female')]
df_f['height'].corr(df_f['weight'])

Идеальный выход:

'gender' 'correlation'
'male' .9007876876 
'female' .8777687666
13.09.2018

Ответы:


1
df.groupby('gender').apply(lambda x: x.height.corr(x.weight)).rename('correlation').to_frame()

Последняя часть (rename и to_frame) предназначена только для того, чтобы получить желаемый результат.

Пример:

>>> df
   gender  height  weight
0    male       1       4
1    male       2       4
2    male       3       5
3  female       1       4
4  female       2       3
5  female       3       5

>>> df.groupby('gender').apply(lambda x: x.height.corr(x.weight)).rename('correlation').to_frame()
        correlation
gender             
female     0.500000
male       0.866025
13.09.2018
  • Красиво сработало! Для будущих читателей: если вы хотите поместить эти значения в новый фрейм данных, просто добавьте df_yourname= перед кодом. 14.09.2018
  • Новые материалы

    Угловая структура архитектуры
    Обратите внимание, что эта статья устарела, я решил создать новую с лучшей структурой и с учетом автономных компонентов: https://medium.com/@marekpanti/angular-standalone-architecture-b645edd0d54a..

    «Данные, которые большинство людей используют для обучения своих моделей искусственного интеллекта, поставляются со встроенным…
    Первоначально опубликовано HalkTalks: https://hacktown.com.br/blog/blog/os-dados-que-a-maioria-das-pessoas-usa-para-treinar-seus-modelos-de-inteligencia-artificial- ja-vem-com-um-vies-embutido/..

    Сильный ИИ против слабого ИИ: различия парадигм искусственного интеллекта
    В последние годы изучению и развитию искусственного интеллекта (ИИ) уделяется большое внимание и прогресс. Сильный ИИ и Слабый ИИ — две основные парадигмы в области искусственного интеллекта...

    Правильный способ добавить Firebase в ваш проект React с помощью React Hooks
    React + Firebase - это мощная комбинация для быстрого и безопасного создания приложений, от проверки концепции до массового производства. Раньше (знаете, несколько месяцев назад) добавление..

    Создайте API с помощью Python FastAPI
    Создание API с помощью Python становится очень простым при использовании пакета FastAPI. После установки и импорта вы можете создать приложение FastAPI и указать несколько конечных точек. Каждой..

    Веселье с прокси-сервером JavaScript
    Прокси-серверы JavaScript — это чистый сахар, если вы хотите создать некоторую общую логику в своих приложениях, чтобы облегчить себе жизнь. Вот один пример: Связь клиент-сервер Мы..

    Получить бесплатный хостинг для разработчиков | Разместите свой сайт за несколько шагов 🔥
    Статические веб-сайты — это веб-страницы с фиксированным содержанием и его постоянным содержанием. Но теперь статические сайты также обрабатывают динамические данные с помощью API и запросов...