Машинное обучение помогает исследователям идентифицировать хиты с точностью до 97%

Каждый день выпускаются десятки тысяч песен. Этот постоянный поток опций затрудняет потоковым сервисам и радиостанциям выбор песен для добавления в списки воспроизведения. Чтобы найти те, которые найдут отклик у большой аудитории, эти сервисы использовали людей-слушателей и искусственный интеллект. Однако этот подход, сохраняющийся с точностью до 50%, не позволяет надежно предсказать, станут ли песни хитами.

Теперь исследователи из США использовали комплексную технику машинного обучения, применяемую к реакциям мозга, и смогли предсказать популярные песни с точностью 97%.

«Применив машинное обучение к нейрофизиологическим данным, мы смогли почти идеально идентифицировать хиты», — сказал Пол Зак, профессор Клермонтского университета и старший автор исследования, опубликованного в журнале Frontiers in Artificial Intelligence. «То, что нейронная активность 33 человек может предсказать, слушали ли миллионы других новые песни, просто удивительно. Ничто, близкое к такой точности, никогда ранее не было продемонстрировано».
Машинное обучение с использованием неврологических данных

Участники исследования были оснащены готовыми датчиками, прослушали набор из 24 песен и были опрошены об их предпочтениях и некоторых демографических данных. В ходе эксперимента ученые измерили нейрофизиологические реакции участников на песни. «Сигналы мозга, которые мы собрали, отражают активность мозговой сети, связанной с настроением и уровнем энергии», — сказал Зак. Это позволило исследователям предсказать результаты рынка, включая количество просмотров песни, основываясь на данных немногих.

Этот подход называется «нейропредсказанием». Он фиксирует нейронную активность небольшой группы людей, чтобы предсказать эффекты на уровне популяции без необходимости измерять мозговую активность сотен людей.

После сбора данных исследователи использовали различные статистические подходы для оценки точности прогнозирования нейрофизиологических переменных. Это позволило провести прямое сравнение моделей. Чтобы повысить точность прогнозирования, они обучили ML-модель, которая тестировала различные алгоритмы для получения наилучших результатов прогнозирования.

Они обнаружили, что линейная статистическая модель идентифицировала хитовые песни с вероятностью успеха 69%. Когда они применили машинное обучение к собранным данным, процент правильно идентифицированных хитов подскочил до 97%. Они также применили машинное обучение к нейронным реакциям на первую минуту песен. В этом случае обращения были правильно идентифицированы с вероятностью успеха 82%.

«Это означает, что потоковые сервисы могут легко идентифицировать новые песни, которые, вероятно, станут хитами в плейлистах людей, более эффективно, облегчая работу потоковых сервисов и радуя слушателей», — пояснил Зак.

Методы репликации

«Если в будущем носимые нейробиологические технологии, подобные тем, которые мы использовали для этого исследования, станут обычным явлением, аудитории можно будет предлагать правильные развлечения, основанные на их нейрофизиологии. Вместо того, чтобы предлагать сотни вариантов, им могут дать всего два или три, что облегчит и ускорит выбор музыки, которая им понравится», — сказал Зак.

Несмотря на почти идеальные результаты прогнозирования его команды, исследователи указали на некоторые ограничения. Например, в своем анализе они использовали относительно немного песен. Кроме того, демография участников исследования была умеренно разнообразной, но не включала представителей определенных этнических и возрастных групп.

Тем не менее, исследователи ожидают, что их подход, вероятно, может быть использован не только для идентификации хитов, отчасти из-за его простоты реализации. «Наш ключевой вклад — это методология. Вполне вероятно, что этот подход можно использовать и для прогнозирования популярности многих других видов развлечений, включая фильмы и телешоу», — заключил Зак.