«ИИ совсем как человек»: ребенок с камерой помог научить искусственный интеллект учить слова

Авторитетный научный журнал Science опубликовал исследование, в котором команда учёных научила ИИ учить новые слова, как это делает ребёнок
#Бизнес и технологии
1200
2 февраля 2024
Авторитетный научный журнал Science опубликовал исследование, в котором команда учёных научила ИИ учить новые слова, как это делает ребёнок

Искусственный интеллект, ИИ, Science

Как известно, большинство моделей машинного обучения опираются на гигантские массивы данных, чтобы выдавать результаты в удобочитаемом, «человеческом» виде, однако новое исследование, опубликованное в журнале Science, показывает, что рецепт изучения языка может быть более простым.

К двум годам большинство детей понимают около 300 слов. К четырем годам средний словарный запас увеличивается до более чем 1 000 слов. Невероятная способность человека быстро усваивать слова до конца не изучена. Некоторые ученые-когнитивисты и лингвисты предполагают, что люди рождаются со «встроенными ожиданиями и логическими ограничениями», которые делают это возможным. Однако исследования в области машинного обучения показывают, что «запрограммированные» предположения и предпосылки не являются необходимым условием для быстрого понимания моделью значения слов на основе минимальных данных.

Исследование команды ученых-когнитивистов

Журнал Science представил совместное исследование команды ученых-когнитивисты и ученых в области машинного обучения, которая успешно обучила базовую модель искусственного интеллекта подбирать изображения к словам, используя всего 61 час видео- и звуковых материалов «от первого лица» ребенка по имени Сэм, отснятых в 2013 и 2014 годах. В исследовании использовались видео и расшифрованные аудиозаписи, сделанные камерой, установленной на голове. Эта камера периодически надевалась на ребёнка, когда ему было от 6 до 25 месяцев. Хотя это небольшой отрезок жизни маленького человека, его оказалось достаточно, чтобы ИИ понял, что означают те или иные существительные.

Искусственный интеллект, ИИ, Science

Ученые создали и применили обобщенную многомодальную модель машинного обучения Child’s View for Contrastive Learning — CVCL (в переводе с английского — «Контрастивное обучение в точки зрения ребёнка»), состоящую из визуального и текстового кодировщиков, для обучения искусственного интеллекта способности ассоциировать изображения и текст.

Синхронизированные нейронные сети переводили изображения и текст в одно математическое репрезентативное пространство, позволяя ИИ интерпретировать данные. CVCL были предложены наборы визуально похожих предметов из одной категории (например, пазлы) через различные подкластеры (пазлы с животными против пазлов с алфавитом) с целью создания подобия ассоциативного мышления. Некоторые данные были хаотичны, неструктурированны или косвенны, например, разговоры опекуном за ребенком, беседы на фоне и фрагменты аудио, которые не всегда прямо описывали объекты или эпизод.

В ходе множественных тестов модель успешно ассоциировала многие слова с соответствующими изображениями и даже приблизилась к точности двух других ИИ-моделей, обученных на гораздо большем объеме языковых данных. В одном из тестов модель правильно указывала на объект на изображении с точностью около 62%, что значительно превосходит случайные догадки ИИ, точность которых достигает лишь 25%. Исследователи также проверили модель на новых изображениях объектов, не входивших в исходный набор данных, и модель успешно их идентифицировала, демонстрируя способность обобщения уже усвоенных знаний.

Полученные результаты позволяют предположить, что рецепт овладения языком может быть проще, чем считалось ранее. Возможно, детям «не нужен специально выработанный механизм, специфичный для языка», чтобы эффективно усваивать значения новых слов», — говорит Джессика Салливан, доцент психологии в колледже Скидмор. «Это действительно прекрасное исследование, — говорит она, — потому что оно предлагает доказательства того, что простая информация из мировоззрения ребенка достаточно богата, чтобы запустить процесс распознавания образов и понимания слов».

Новое исследование также демонстрирует, что машины могут обучаться так же, как и люди. Большие языковые модели, такие как GPT-4, лежащего в основе ChatGPT, обучаются на огромных объемах данных, которые могут включать миллиарды, а иногда и триллионы словосочетаний. По словам авторов статьи, человек обходится на порядки меньшим количеством информации, поэтому при правильном подборе данных этот разрыв между машинным и человеческим обучением может значительно сократиться.

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

Тренды в упаковке 2024, Тренды в дизайне, Тренды 2024, Pentawards
10 трендов в дизайне упаковки на 2024 год по версии Pentawards
Целевой дизайн, «игра теней», текстурирование «под камень» и другие заметные тенденции этого года
4927

Отлично!
Каждную неделю мы будем отправлять Вам самые важные новости, оюзоры и самые креативные кейсы.
Используя сайт, Вы соглашаетесь с использованием файлов cookie и обработкой персональных данных в соответствии с Политикой обработки персональных данных.

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: