Память для машин может быть такой же сложной задачей, как и для людей. Чтобы понять, почему у искусственных агентов возникают пробелы в собственных когнитивных процессах, инженеры-электрики из Университета штата Огайо проанализировали, насколько сильно процесс, называемый «непрерывным обучением», влияет на их общую производительность.
Непрерывное обучение — это когда компьютер обучается непрерывному выполнению последовательности задач, используя накопленные знания из старых задач для лучшего усвоения новых.
Однако для достижения таких высот ученым еще предстоит преодолеть одно серьезное препятствие — научиться обходить эквивалент потери памяти в машинном обучении — процесс, который в ИИ-агентах известен как «катастрофическое забывание». По словам Несса Шроффа, выдающегося ученого штата Огайо, профессора компьютерных наук и инженерии Университета штата Огайо, по мере обучения искусственных нейронных сетей одной новой задаче за другой они теряют информацию, полученную в ходе выполнения предыдущих задач, что может стать проблемой, поскольку общество все больше и больше полагается на системы ИИ.
«По мере того как приложения для автоматизированного вождения или другие роботизированные системы учатся чему-то новому, важно, чтобы они не забывали уже усвоенных уроков ради нашей и своей безопасности», — сказал Шрофф. «Наше исследование посвящено изучению сложностей непрерывного обучения в этих искусственных нейронных сетях, и то, что мы обнаружили, позволяет преодолеть разрыв между тем, как учится машина, и тем, как учится человек».
Исследователи обнаружили, что подобно тому, как люди с трудом вспоминают контрастные факты о похожих сценариях, но с легкостью запоминают ситуации, изначально отличающиеся друг от друга, искусственные нейронные сети могут лучше запоминать информацию, когда перед ними последовательно ставятся различные задачи, а не те, которые имеют сходные черты, сказал Шрофф.
Хотя обучить автономные системы подобному динамическому обучению на протяжении всей жизни может быть непросто, обладание такими возможностями позволит ученым быстрее масштабировать алгоритмы машинного обучения, а также легко адаптировать их к изменяющимся условиям и неожиданным ситуациям. По сути, цель создания таких систем состоит в том, чтобы в будущем они могли имитировать способность человека к обучению.
Традиционные алгоритмы машинного обучения обучаются на данных сразу, но результаты работы этой команды показали, что такие факторы, как схожесть задач, отрицательные и положительные корреляции и даже порядок обучения алгоритма задаче, имеют значение для продолжительности сохранения определенных знаний искусственной сетью.