Выявление расстройства аутистического спектра у детей с компьютерным зрением

Адаптация моделей распознавания лиц для выявления расстройства аутистического спектра

Компьютерное зрение (CV) помогло в области медицины диагностировать сломанные кости, тромбы и даже раковые опухоли. Его также можно использовать, чтобы помочь специалистам диагностировать аутизм.

Расстройство аутистического спектра (РАС) - это неврологическое расстройство и расстройство развития, которое начинается в раннем детстве и продолжается на протяжении всей жизни человека. Специалисты считают, что у людей с РАС есть отчетливые черты лица, которые можно использовать, чтобы помочь диагностировать РАС и даже коррелировать с тяжестью РАС. Эту корреляцию можно использовать для обучения модели CV для обнаружения РАС с использованием этих уникальных черт лица.

Цель состоит в том, чтобы предоставить бесплатный инструмент предварительной диагностики, который может помочь родителям в их решении продолжить тестирование на РАС. Для моделей, которые оказывают значительное влияние на реальный мир, важно ответственно представлять свои результаты и использовать байесовскую статистику для объяснения их значения.

Почему это важно

Примерно 25% детей с аутизмом не диагностированы. Диагностика РАС - это сложный и дорогостоящий процесс, через который может пройти не каждая семья. Направление подходящих детей к нужным специалистам имеет решающее значение для сокращения числа детей с недиагностированным диагнозом и уменьшения нагрузки на семьи.

Хочу подчеркнуть, что моя цель - не диагностировать РАС. Скорее, я хочу использовать возможности CV с обоснованием байесовской статистики, чтобы помочь родителям решить, следует ли им отводить своих детей к специалисту по РАС.

Реализация

Весь код доступен на GitHub, а данные доступны на Kaggle.





Данные

Версия 5 набора данных Kaggle содержит 2940 изображений, которые равномерно разделены на два класса: аутичные и не аутичные. Изображения разного размера, но они уже обрезаны, чтобы показать только лицо ребенка.

Возраст

Набор данных имеет возрастное распределение примерно от 2 до 14 лет, но большинство изображений относятся к детям младшего возраста в возрасте от 2 до 8 лет.

Пол

Гендерное соотношение близко к соответствующему населению. У мужчин аутизм диагностируется в 3 раза чаще, чем у женщин. Таким образом, распределение мужских и женских изображений в классе аутистов близко к 3: 1. В классе не аутистов это соотношение намного ближе к 1: 1.

Гонка

Соотношение белых и цветных детей составляет 10: 1. Это близко к реальному распределению в Америке 7: 1.

Модель

Модель будет основана на VGG Face, оксфордской модели глубокого распознавания лиц .

Трансферное обучение

Чтобы извлечь черты лица, необходимые для обнаружения аутизма, новая модель будет использовать ту же архитектуру и вес, что и VGG Face. Это пример обучения переносу представления объектов . Этот тип трансферного обучения используется, когда исходный и целевой домены ищут схожие функции, но делают разные выводы на основе этих функций.

Оксфордская модель обучена определять основные черты лица для распознавания уникальных лиц. Новая модель также хочет определить основные черты лица, но выявить аутизм.

Полученные результаты

Хотя точность использовалась для измерения производительности модели во время обучения, чувствительность и специфичность более важны для байесовских прогнозов.

"Кривая обучения"

Модель достигает точности 85% на проверочном наборе после 44 эпох. Модель начинает переобучаться примерно в 60-е годы.

Матрица путаницы

Изменить август 2020: в этой таблице есть ошибка. Ложноотрицательный результат должен иметь ложноположительное значение, а ложноположительный результат должен иметь ложноотрицательное значение. Все, что следует далее, по-прежнему является правильной информацией, но с неправильными числами.

Чувствительность и специфичность

Чувствительность и специфичность используются для количественной оценки того, как часто модель предсказывает ложноотрицательные и ложноположительные результаты.

Чувствительность - это истинно положительный показатель. Он измеряет, насколько часто бывает верным положительный прогноз.

Специфика - это истинно отрицательная оценка. Он измеряет, насколько часто бывает верным отрицательный прогноз.

Модель обеспечивает чувствительность 76% и специфичность 85%.

Воздействие: правило Байеса.

Правило Байеса имеет решающее значение для понимания результатов любой модели машинного обучения (ML).

Модели могут ошибаться

Важно помнить, что модели подвержены ошибкам. Положительный результат от модели не означает положительный результат в реальном мире. Вместо этого эту новую информацию, как и прогнозируемый положительный результат, следует использовать для обновления наших предыдущих знаний об этом событии.

Байесовские вычисления

Вероятность того, что случайный мужчина заболеет аутизмом, очень мала, около 2,7%. Это вероятность того, что мужчина страдает аутизмом до того, как узнает какую-либо другую информацию. Таким образом, это называется априорной вероятностью.

Прогноз модели предоставляет новую информацию, которую следует учитывать в сочетании с предшествующими знаниями при принятии решения.

Теорема Байеса может использоваться для количественной оценки того, насколько эта новая информация должна влиять на априорную вероятность. Эта обновленная вероятность называется апостериорной.

Используя чувствительность и специфичность модели, можно рассчитать апостериорную вероятность положительного прогноза. Для мужчин положительный результат увеличивает вероятность аутизма с 2,70% до 12,34%. Для женщин вероятность увеличивается с 0,66% до 3,27%.

Ограничения

Правдивое представление недостатков модели позволяет лучше вкладывать средства с открытым исходным кодом и в целом улучшить науку о данных.

Как всегда: лучшие данные, лучшая модель.

Возраст

Эта модель обучена на изображениях детей в основном в возрасте от 2 до 8 лет. Таким образом, тестирование детей за пределами этого диапазона даст менее точные результаты.

Гонка

Соотношение белых и цветных детей составляет 10: 1. Отсутствие данных для обучения цветных детей означает, что результаты для них будут менее точными.

Заключение

Диагностика аутизма - сложный и дорогостоящий процесс. К счастью, корреляция между чертами лица и аутизмом означает, что модель CV можно обучить его обнаруживать. Используя байесовскую статистику, можно ответственно сообщать о результатах этой модели, и родители могут принимать более обоснованные решения о здоровье своего ребенка.

Репозиторий проекта