Демонстрация: классификация аудио с преобразователем аудиоспектрограммы

Мультимодальные трансформаторы быстро растут. Отличным примером является Audio Spectrogram Transformer, модель классификации звука, которая была только что добавлена в библиотеку Hugging Face Transformers. Эта модель сначала создает изображение спектрограммы аудиоклипа, а затем классифицирует изображение с помощью модели Vision Transformer. Удивительные результаты!

✅ Демонстрация пространств: https://huggingface.co/spaces/juliensimon/keyword-spotting
✅ Модель: https://huggingface.co/MIT/ast-finetuned-speech-commands-v2< br /> ✅ Статья: https://arxiv.org/abs/2104.01778

смотрите также:

Новые материалы

День 76/100 Книга

День 76/100 Книга Обучение — это непрерывный процесс с ресурсами, широко используемыми людьми, которые признают сложный путь достижения успешной цели. Хотя поначалу это может показаться..

Gmail Smart Compose: умный способ написать электронное письмо

Gmail означает почту Google, это бесплатная служба электронной почты, предоставляемая Google по всему миру. Google официально запустил Gmail в 2004 году, и в настоящее время этой услугой..

API следующего поколения: gRPC n Javascript

gRPC - быстро развивающаяся технология, которая потенциально может заменить протокол HTTP. Это быстрее, чем традиционные HTTP-вызовы, потому что он отправляет данные в двоичном формате, а не в..

Ускоренный курс по жадным алгоритмам

Дай мне, дай мне, дай мне Аудитория Эта статья предназначена для инженеров, достаточно хорошо разбирающихся в программировании, структурах данных и алгоритмах. Он в основном основан на..

Изучайте Java (Урок 2: Комментарии)

Как и зачем использовать комментарии в java с примерами Введение: Комментарии — это строки текста в программе Java, которые игнорируются компилятором и используются для добавления..

Async Await в Swift: легкое управление параллелизмом

Введение в запуск асинхронного кода Асинхронный код выполняет несколько операций одновременно. Параллелизм необходим при выполнении тяжелых вычислений или сетевых запросов. Однако это может..

Очистить файлы Program .cache в Ubuntu 20.10

Очистите кеш за несколько простых шагов! GNU / Linux реализовал эффективное управление хранилищем для своих пользователей. Но заметили ли вы, что в вашей системе Linux заканчивается место,..

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Python Coding Web Development Deep Learning AI React Software Engineering Nodejs Typescript Java Front End Development NLP Development Data CSS Computer Science Algorithms Productivity ChatGPT Tech HTML Tutorial Reactjs API Neural Networks Javascript Tips Programming Languages Angular AWS Mathematics Javascript Development Computer Vision Startup