Deep Dive 2 Deep Learning

👆🏻Повторение – мать ученья, даже для DL
Глубокие нейросети – это мощные машинами для распознавания визуальных образов, но логические задачи, которые легко решает человека, могут оказаться трудными для DL-моделей. После длительного размышления люди обладают способностью экстраполировать стратегии рассуждений, изученные на простых задачах, для решения более сложных примеров. Например, человек, который научился искать выход из небольших лабиринтов, может легко расширить эти методы поиска для решения более крупных задач. В ИИ такое поведение достигается за счет использования алгоритмов, которые масштабируются до произвольно сложных экземпляров проблемы за счет дополнительных вычислений. Но бюджет последовательных вычислений нейросетей с прямой связью ограничен их глубиной, а сети, обученные простым задачам, не могут расширить свои рассуждения для более сложных задач.
Поэтому исследователи из Университета Мэриленда предложили многократную отправку выходных данных части сети обратно через один и тот же блок перед дальнейшей передачей, чтобы DL-модель могла выполнять более сложную версию задачи, чем та, на которой она была обучен. Внутреннее представление входных данных в сети должно постепенно улучшаться каждый раз, когда они проходят через повторяющийся блок. Разработчики добавили повторение в ResNets перед обучением, продублировав первый остаточный блок и поделив его веса между всеми остаточными блоками. Обучив и протестировав отдельные сети на 3-х разных задачах (лабиринты, шахматы и обработка строк) исследователи доказали, что рекуррентные сети улучшали свою производительность по более сложным задачам с каждым проходом через цикл, превосходя неповторяющиеся сети на 2-10% точности.
https://read.deeplearning.ai/the-batch/more-thinking-solves-harder-problems/
https://arxiv.org/abs/2106.04537

The Batch | DeepLearning.AI

More Thinking Solves Harder Problems - The Batch | DeepLearning.AI

In machine learning, an easy task and a more difficult version of the same task — say, a maze that covers a smaller or larger area — often are learned separately. A new study shows that recurrent neural networks can generalize from one to the

45 views04:27