Три причины, по которым вы НЕ должны использовать глубокое обучение

Для достижения высокой производительности глубокие сети требуют чрезвычайно больших наборов данных. Чем больше у нас помеченных данных, тем лучше работает наша модель. Получение хорошо аннотированных данных может быть как дорогостоящим, так и трудоемким. Наем людей для ручного сбора изображений и маркировки их совсем неэффективен. А в эпоху глубокого обучения данные, возможно, являются вашим самым ценным ресурсом.

Сети, достигающие высоких показателей в последних исследованиях, часто обучаются на сотнях тысяч и даже миллионах образцов. Для многих приложений такие большие наборы данных недоступны, и их получение будет дорогостоящим и отнимет много времени. Для небольших наборов данных классические алгоритмы машинного обучения, такие как регрессия, случайный лес и SVM, часто превосходят глубокие сети.

(2) Глубокое обучение на практике сложно и дорого

Глубокое обучение по-прежнему остается передовым методом. Вы определенно можете получить быстрое и простое решение, как и многие люди, особенно с широко доступными API, такими как Clarifai и AutoML от Google. Но если вы хотите сделать что-то по-настоящему индивидуально, такие услуги вам не помогут. Вы немного ограничены в том, чтобы делать что-то, хотя бы немного похожее на то, что делают все остальные, если только вы не готовы тратить деньги на исследования ...

К тому же это дорогое удовольствие не только из-за ресурсов, необходимых для получения данных и вычислительной мощности, но и из-за найма исследователей. Исследования в области глубокого обучения сейчас очень популярны, поэтому все эти три расходы очень сильно завышены. Вы также получаете очень большие накладные расходы, поскольку, делая что-то настолько индивидуализированное, вы тратите много времени, просто экспериментируя и ломая что-то.

(3) Глубокие сети нелегко интерпретировать

Глубокие сети - это очень «черный ящик», поскольку даже сейчас исследователи не до конца понимают «внутреннюю часть» глубинных сетей. У них высокая предсказательная сила, но низкая интерпретируемость. Гиперпараметры и проектирование сети также представляют собой серьезную проблему из-за отсутствия теоретической основы.

В последнее время появилось множество инструментов, таких как карты значимости и различия в активации, которые отлично работают для некоторых доменов, аналогично показанному на рисунке ниже. Но, к сожалению, они полностью не переносятся на все приложения. Эти инструменты в основном хорошо разработаны для того, чтобы убедиться, что вы не переобучаете свою сеть под набор данных или не сосредотачиваетесь на определенных функциях, которые являются ложными. По-прежнему очень сложно интерпретировать важность каждой функции для общего решения глубокой сети.

С другой стороны, классические алгоритмы машинного обучения, такие как регрессия или случайные леса, довольно легко интерпретировать и понимать из-за прямого проектирования функций. Кроме того, настройка гиперпараметров и изменение конструкций моделей более просты, поскольку у нас есть более глубокое понимание данных и лежащих в их основе алгоритмов. Это особенно важно, когда результаты сети должны быть переведены и доставлены общественности или нетехнической аудитории. Мы не можем просто сказать «мы продали эти акции» или «мы применили этот препарат к этому пациенту» , потому что это сказано в нашей глубокой сети. Нам нужно знать почему. К сожалению, все доказательства, которые у нас есть в пользу глубокого обучения, носят эмпирический характер.

Любите учиться?

Следуйте за мной в твиттере, где я публикую все о новейших и величайших достижениях искусственного интеллекта, технологий и науки! Присоединяйтесь и ко мне в LinkedIn!

смотрите также:

Новые материалы

Угловая структура архитектуры

Обратите внимание, что эта статья устарела, я решил создать новую с лучшей структурой и с учетом автономных компонентов: https://medium.com/@marekpanti/angular-standalone-architecture-b645edd0d54a..

«Данные, которые большинство людей используют для обучения своих моделей искусственного интеллекта, поставляются со встроенным…

Первоначально опубликовано HalkTalks: https://hacktown.com.br/blog/blog/os-dados-que-a-maioria-das-pessoas-usa-para-treinar-seus-modelos-de-inteligencia-artificial- ja-vem-com-um-vies-embutido/..

Сильный ИИ против слабого ИИ: различия парадигм искусственного интеллекта

В последние годы изучению и развитию искусственного интеллекта (ИИ) уделяется большое внимание и прогресс. Сильный ИИ и Слабый ИИ — две основные парадигмы в области искусственного интеллекта...

Правильный способ добавить Firebase в ваш проект React с помощью React Hooks

React + Firebase - это мощная комбинация для быстрого и безопасного создания приложений, от проверки концепции до массового производства. Раньше (знаете, несколько месяцев назад) добавление..

Создайте API с помощью Python FastAPI

Создание API с помощью Python становится очень простым при использовании пакета FastAPI. После установки и импорта вы можете создать приложение FastAPI и указать несколько конечных точек. Каждой..

Веселье с прокси-сервером JavaScript

Прокси-серверы JavaScript — это чистый сахар, если вы хотите создать некоторую общую логику в своих приложениях, чтобы облегчить себе жизнь. Вот один пример: Связь клиент-сервер Мы..

Получить бесплатный хостинг для разработчиков | Разместите свой сайт за несколько шагов 🔥

Статические веб-сайты — это веб-страницы с фиксированным содержанием и его постоянным содержанием. Но теперь статические сайты также обрабатывают динамические данные с помощью API и запросов...

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Python Web Development Coding Deep Learning AI React Software Engineering Nodejs Typescript Front End Development Java NLP Computer Science CSS Tech Data Algorithms Development Productivity ChatGPT Programming Languages HTML Tutorial Neural Networks Reactjs Angular Javascript Tips API Mathematics Javascript Development Startup Csharp Automation