💰Слишком дорого: главное ограничение DL-моделей
Модели глубокого обучения чрезмерно параметризованы, то есть у них больше параметров, чем точек данных, доступных для обучения. В классическом ML это приводит к переобучению, когда модель не может адекватно работать с данными, на которых была обучена. Глубокое обучение позволяет избежать этого, случайным образом инициализируя параметры, а затем итеративно корректируя их наборы для лучшего соответствия данным, используя стохастический градиентный спуск. Это обеспечивает хорошее обобщение изученной модели и огромную гибкость. Обратной стороной этих достоинств является огромные вычислительные, и, соответственно, финансовые затраты.
Во-первых, как и для всех статистических моделей, чтобы повысить производительность в k раз, необходимо использовать как минимум k2 дополнительных точек данных для обучения. А чрезмерная параметризация увеличивает вычислительные затраты до k4. Это уже становится дорого: например, 10-кратное улучшение требует, по крайней мере, 10 000-кратного увеличения вычислений. А для достижения 5-процентного коэффициента ошибок потребуется 1019 миллиардов операций с плавающей запятой.
Ученые из MIT подсчитали экономические затраты и выбросы углерода, связанные с такой вычислительной нагрузкой: обучение DL-модели обойдется в 100 миллиардов долларов и приведет к таким же выбросам углерода, равнозначным с ежемесячным выбросом такого мегаполиса, как Нью-Йорк. А если нужна большая точность, например, в 1% ошибок, результаты будут намного хуже.
Когда дочка Google, компания DeepMind обучила свою DL-систему игре в го, это обошлось в 35 миллионов долларов. Когда исследователи DeepMind разрабатывали решение для видеоигры StarCraft II, они целенаправленно не пробовали несколько способов создания DL-архитектуры, потому что стоимость обучения была бы слишком высокой. Языковая DL-модель GPT-3 от OpenAI стоила более 4 миллионов долларов. При этом в развертывании системы допущена ошибка, которая не исправлена из-за слишком высокой стоимости обучения.
Пока расходы на DL превышают ожидаемую экономическую ценность, бизнес не стремится внедрять глубокое обучение. В частности, поэтому один из крупных европейских ритейлеров отказался от DL-системы прогнозирования продаж. Поэтому научное сообщество активно ищет способы снизить затраты на Deep Learning.
Одна из стратегий - использовать процессоры, специально разработанные для DL-вычислений: графические процессоры вместо ЦП и специализированные модули обработки тензорного кода, а также аналоговые, нейроморфные, оптические или квантовые аппаратные системы.
Другой подход - создание нейросетей, которые при реализации становятся меньше. Это снижает стоимость использования, но увеличивает стоимость обучения. Для большинства моделей эксплуатационные расходы – это самая большая часть общей суммы инвестиций. А для моделей, которые часто требуют переобучения, затраты на обучение, наоборот, доминируют. Впрочем, уменьшение масштабов недостаточно сокращает затраты. Поэтому разрабатывается метод мета-обучения, когда система обучается на различных данных, а затем может применяться во многих областях. Например, вместо того, чтобы создавать отдельные системы для распознавания собак, кошек и автомобилей на изображениях, одна система может быть обучена на всех из них и использоваться несколько раз.
Однако, ученые из MIT доказали, что мета-обучение тоже является сложным и дорогим. Даже небольшие различия между исходными и реальными данными, могут серьезно ухудшить производительность. Например, современные системы распознавания изображений сильно зависят от угла зрения на фотографируемый объект и его позы. Поэтому простая задача распознавания одних и тех же объектов в разных позах снижает точность системы почти вдвое. И даже с новыми наборами данных, специально созданными для имитации исходного обучающего датасета, производительность DL-модели падает более чем на 10%. Таким образом, если небольшие изменения в данных вызывают значительное падение производительности, итоговые расходы для комплексной системы мета-обучения могут оказаться огромными.
Модели глубокого обучения чрезмерно параметризованы, то есть у них больше параметров, чем точек данных, доступных для обучения. В классическом ML это приводит к переобучению, когда модель не может адекватно работать с данными, на которых была обучена. Глубокое обучение позволяет избежать этого, случайным образом инициализируя параметры, а затем итеративно корректируя их наборы для лучшего соответствия данным, используя стохастический градиентный спуск. Это обеспечивает хорошее обобщение изученной модели и огромную гибкость. Обратной стороной этих достоинств является огромные вычислительные, и, соответственно, финансовые затраты.
Во-первых, как и для всех статистических моделей, чтобы повысить производительность в k раз, необходимо использовать как минимум k2 дополнительных точек данных для обучения. А чрезмерная параметризация увеличивает вычислительные затраты до k4. Это уже становится дорого: например, 10-кратное улучшение требует, по крайней мере, 10 000-кратного увеличения вычислений. А для достижения 5-процентного коэффициента ошибок потребуется 1019 миллиардов операций с плавающей запятой.
Ученые из MIT подсчитали экономические затраты и выбросы углерода, связанные с такой вычислительной нагрузкой: обучение DL-модели обойдется в 100 миллиардов долларов и приведет к таким же выбросам углерода, равнозначным с ежемесячным выбросом такого мегаполиса, как Нью-Йорк. А если нужна большая точность, например, в 1% ошибок, результаты будут намного хуже.
Когда дочка Google, компания DeepMind обучила свою DL-систему игре в го, это обошлось в 35 миллионов долларов. Когда исследователи DeepMind разрабатывали решение для видеоигры StarCraft II, они целенаправленно не пробовали несколько способов создания DL-архитектуры, потому что стоимость обучения была бы слишком высокой. Языковая DL-модель GPT-3 от OpenAI стоила более 4 миллионов долларов. При этом в развертывании системы допущена ошибка, которая не исправлена из-за слишком высокой стоимости обучения.
Пока расходы на DL превышают ожидаемую экономическую ценность, бизнес не стремится внедрять глубокое обучение. В частности, поэтому один из крупных европейских ритейлеров отказался от DL-системы прогнозирования продаж. Поэтому научное сообщество активно ищет способы снизить затраты на Deep Learning.
Одна из стратегий - использовать процессоры, специально разработанные для DL-вычислений: графические процессоры вместо ЦП и специализированные модули обработки тензорного кода, а также аналоговые, нейроморфные, оптические или квантовые аппаратные системы.
Другой подход - создание нейросетей, которые при реализации становятся меньше. Это снижает стоимость использования, но увеличивает стоимость обучения. Для большинства моделей эксплуатационные расходы – это самая большая часть общей суммы инвестиций. А для моделей, которые часто требуют переобучения, затраты на обучение, наоборот, доминируют. Впрочем, уменьшение масштабов недостаточно сокращает затраты. Поэтому разрабатывается метод мета-обучения, когда система обучается на различных данных, а затем может применяться во многих областях. Например, вместо того, чтобы создавать отдельные системы для распознавания собак, кошек и автомобилей на изображениях, одна система может быть обучена на всех из них и использоваться несколько раз.
Однако, ученые из MIT доказали, что мета-обучение тоже является сложным и дорогим. Даже небольшие различия между исходными и реальными данными, могут серьезно ухудшить производительность. Например, современные системы распознавания изображений сильно зависят от угла зрения на фотографируемый объект и его позы. Поэтому простая задача распознавания одних и тех же объектов в разных позах снижает точность системы почти вдвое. И даже с новыми наборами данных, специально созданными для имитации исходного обучающего датасета, производительность DL-модели падает более чем на 10%. Таким образом, если небольшие изменения в данных вызывают значительное падение производительности, итоговые расходы для комплексной системы мета-обучения могут оказаться огромными.
👻AI тоже ошибается, причем намеренно
На то, чтобы компьютеры опередили людей в шахматах, потребовалось около 50 лет. Теперь даже простой смартфон может обыграть гроссмейстера. Но одна AI-программа делает ошибки специально, чтобы оценить, как играют обычные люди. Вместо того, чтобы сразу обыграть противника на доске, Maia сосредотачивается на предсказании человеческих ходов, включая ошибки. Разработчики говорят, что это первый шаг к разработке ИИ, который лучше понимает человеческую склонность к ошибкам. В будущем это поможет лучше взаимодействовать с людьми, например, обучая или договариваясь с ними.
Например, в здравоохранении ML-система, которая предвидит ошибки, может быть использована для обучения врачей чтению медицинских изображений или помощи в обнаружении неточностей. Maia была разработана с использованием кода, адаптированного из Leela Zero, клона Alpha Zero с открытым исходным кодом, революционной ИИ-программы от DeepMind. Смоделированная нейросеть содержит виртуальные нейроны, которые можно настроить для ответа на ввод. В шахматах Alpha Zero получает информацию о позициях на доске и ходах, сгенерированных в тренировочных играх, и настраивает срабатывание нейронов в пользу выигрышных ходов. Этот подход известен как обучение с подкреплением. Alpha Zero может использовать тот же подход, чтобы научиться играть в другие настольные игры, такие как шашки или Го, с минимальными изменениями.
Разработчики изменили код Leela Zero, чтобы создать программу, которая обучалась, отдавая предпочтение точному предсказанию движений человека. Причем Maia фокусируется на поиске наиболее вероятного хода, который сделает человек. DL-система обучалась с использованием данных LiChess, популярного сервера онлайн-игры в шахматы. Также Maia может быть полезна для подготовки к турниру с определенным человеком, имитируя определенных игроков. Имея достаточное количество игр, на которых можно учиться, этот DL-тренажер можно научить предсказывать только ходы конкретного игрока, например, действующего чемпиона мира или вашего соперника по завтрашней игре. Аналогичный подход можно применить и к другим играм, от киберспорта до переговоров в бизнесе.
https://www.wired.com/story/new-artificial-intelligence-mistakes-purpose-chess/
На то, чтобы компьютеры опередили людей в шахматах, потребовалось около 50 лет. Теперь даже простой смартфон может обыграть гроссмейстера. Но одна AI-программа делает ошибки специально, чтобы оценить, как играют обычные люди. Вместо того, чтобы сразу обыграть противника на доске, Maia сосредотачивается на предсказании человеческих ходов, включая ошибки. Разработчики говорят, что это первый шаг к разработке ИИ, который лучше понимает человеческую склонность к ошибкам. В будущем это поможет лучше взаимодействовать с людьми, например, обучая или договариваясь с ними.
Например, в здравоохранении ML-система, которая предвидит ошибки, может быть использована для обучения врачей чтению медицинских изображений или помощи в обнаружении неточностей. Maia была разработана с использованием кода, адаптированного из Leela Zero, клона Alpha Zero с открытым исходным кодом, революционной ИИ-программы от DeepMind. Смоделированная нейросеть содержит виртуальные нейроны, которые можно настроить для ответа на ввод. В шахматах Alpha Zero получает информацию о позициях на доске и ходах, сгенерированных в тренировочных играх, и настраивает срабатывание нейронов в пользу выигрышных ходов. Этот подход известен как обучение с подкреплением. Alpha Zero может использовать тот же подход, чтобы научиться играть в другие настольные игры, такие как шашки или Го, с минимальными изменениями.
Разработчики изменили код Leela Zero, чтобы создать программу, которая обучалась, отдавая предпочтение точному предсказанию движений человека. Причем Maia фокусируется на поиске наиболее вероятного хода, который сделает человек. DL-система обучалась с использованием данных LiChess, популярного сервера онлайн-игры в шахматы. Также Maia может быть полезна для подготовки к турниру с определенным человеком, имитируя определенных игроков. Имея достаточное количество игр, на которых можно учиться, этот DL-тренажер можно научить предсказывать только ходы конкретного игрока, например, действующего чемпиона мира или вашего соперника по завтрашней игре. Аналогичный подход можно применить и к другим играм, от киберспорта до переговоров в бизнесе.
https://www.wired.com/story/new-artificial-intelligence-mistakes-purpose-chess/
Wired
A New Artificial Intelligence Makes Mistakes—on Purpose
A chess program that learns from human error might be better at working with people or negotiating with them.
👆🏻Повторение – мать ученья, даже для DL
Глубокие нейросети – это мощные машинами для распознавания визуальных образов, но логические задачи, которые легко решает человека, могут оказаться трудными для DL-моделей. После длительного размышления люди обладают способностью экстраполировать стратегии рассуждений, изученные на простых задачах, для решения более сложных примеров. Например, человек, который научился искать выход из небольших лабиринтов, может легко расширить эти методы поиска для решения более крупных задач. В ИИ такое поведение достигается за счет использования алгоритмов, которые масштабируются до произвольно сложных экземпляров проблемы за счет дополнительных вычислений. Но бюджет последовательных вычислений нейросетей с прямой связью ограничен их глубиной, а сети, обученные простым задачам, не могут расширить свои рассуждения для более сложных задач.
Поэтому исследователи из Университета Мэриленда предложили многократную отправку выходных данных части сети обратно через один и тот же блок перед дальнейшей передачей, чтобы DL-модель могла выполнять более сложную версию задачи, чем та, на которой она была обучен. Внутреннее представление входных данных в сети должно постепенно улучшаться каждый раз, когда они проходят через повторяющийся блок. Разработчики добавили повторение в ResNets перед обучением, продублировав первый остаточный блок и поделив его веса между всеми остаточными блоками. Обучив и протестировав отдельные сети на 3-х разных задачах (лабиринты, шахматы и обработка строк) исследователи доказали, что рекуррентные сети улучшали свою производительность по более сложным задачам с каждым проходом через цикл, превосходя неповторяющиеся сети на 2-10% точности.
https://read.deeplearning.ai/the-batch/more-thinking-solves-harder-problems/
https://arxiv.org/abs/2106.04537
Глубокие нейросети – это мощные машинами для распознавания визуальных образов, но логические задачи, которые легко решает человека, могут оказаться трудными для DL-моделей. После длительного размышления люди обладают способностью экстраполировать стратегии рассуждений, изученные на простых задачах, для решения более сложных примеров. Например, человек, который научился искать выход из небольших лабиринтов, может легко расширить эти методы поиска для решения более крупных задач. В ИИ такое поведение достигается за счет использования алгоритмов, которые масштабируются до произвольно сложных экземпляров проблемы за счет дополнительных вычислений. Но бюджет последовательных вычислений нейросетей с прямой связью ограничен их глубиной, а сети, обученные простым задачам, не могут расширить свои рассуждения для более сложных задач.
Поэтому исследователи из Университета Мэриленда предложили многократную отправку выходных данных части сети обратно через один и тот же блок перед дальнейшей передачей, чтобы DL-модель могла выполнять более сложную версию задачи, чем та, на которой она была обучен. Внутреннее представление входных данных в сети должно постепенно улучшаться каждый раз, когда они проходят через повторяющийся блок. Разработчики добавили повторение в ResNets перед обучением, продублировав первый остаточный блок и поделив его веса между всеми остаточными блоками. Обучив и протестировав отдельные сети на 3-х разных задачах (лабиринты, шахматы и обработка строк) исследователи доказали, что рекуррентные сети улучшали свою производительность по более сложным задачам с каждым проходом через цикл, превосходя неповторяющиеся сети на 2-10% точности.
https://read.deeplearning.ai/the-batch/more-thinking-solves-harder-problems/
https://arxiv.org/abs/2106.04537
The Batch | DeepLearning.AI
More Thinking Solves Harder Problems - The Batch | DeepLearning.AI
In machine learning, an easy task and a more difficult version of the same task — say, a maze that covers a smaller or larger area — often are learned separately. A new study shows that recurrent neural networks can generalize from one to the
🍏DL на Mac: как включить GPU для Tensorflow
До сих пор для пользователя Mac установка некоторого ПО является нетривиальной задачей. Например, когда Apple отказалась от поддержки Nvidia, запустить обучение нейросети на личном ноуте, стало проблемой. Конечно, можно было воспользоваться Google Colab, но иногда требовалась локальная среда. Поэтому в конце 2020 года DS-специалисты с радостью встретили чип M1, который использует нейродвижок - Apple Neural Engine, позволяющий Mac быстро выполнять задачи машинного обучения без проблем с перегревом.
Но если вы обладатель Mac’а без M1, интеграция с Tensorflow не слишком простая, включая загрузку пакетов и конфигурирование файла среды environment.yml, чтобы исключить конфликты зависимостей. Установку Tensorflow на Miniforge с помощью подключаемого модуля Metal можно свести к следующим шагам:
1. установите Xcode из App Store вместе с CLI-инструментами
2. установите из App Store компонент MiniForge – мини-установщик conda, который по умолчанию использует канал conda-forge и поддерживает архитектуру aarch64, включая Apple M1
3. настройте среду и установите базу Tensorflow и плагин tensorflow-metal с помощью conda
4. при желании установите Jupyter
5. чтобы убедиться, что все работает и установка TensorFlow действительно использует графический процессор, выполните команды в Python prompt
Поскольку не все библиотеки можно найти в MiniForge, поэтому можно развернуть отдельную среду Anaconda или Miniconda для таких случаев.
https://betterprogramming.pub/installing-tensorflow-on-apple-m1-with-new-metal-plugin-6d3cb9cb00ca
До сих пор для пользователя Mac установка некоторого ПО является нетривиальной задачей. Например, когда Apple отказалась от поддержки Nvidia, запустить обучение нейросети на личном ноуте, стало проблемой. Конечно, можно было воспользоваться Google Colab, но иногда требовалась локальная среда. Поэтому в конце 2020 года DS-специалисты с радостью встретили чип M1, который использует нейродвижок - Apple Neural Engine, позволяющий Mac быстро выполнять задачи машинного обучения без проблем с перегревом.
Но если вы обладатель Mac’а без M1, интеграция с Tensorflow не слишком простая, включая загрузку пакетов и конфигурирование файла среды environment.yml, чтобы исключить конфликты зависимостей. Установку Tensorflow на Miniforge с помощью подключаемого модуля Metal можно свести к следующим шагам:
1. установите Xcode из App Store вместе с CLI-инструментами
2. установите из App Store компонент MiniForge – мини-установщик conda, который по умолчанию использует канал conda-forge и поддерживает архитектуру aarch64, включая Apple M1
3. настройте среду и установите базу Tensorflow и плагин tensorflow-metal с помощью conda
4. при желании установите Jupyter
5. чтобы убедиться, что все работает и установка TensorFlow действительно использует графический процессор, выполните команды в Python prompt
Поскольку не все библиотеки можно найти в MiniForge, поэтому можно развернуть отдельную среду Anaconda или Miniconda для таких случаев.
https://betterprogramming.pub/installing-tensorflow-on-apple-m1-with-new-metal-plugin-6d3cb9cb00ca
Medium
Installing Tensorflow on Apple M1 With the New Metal Plugin
How to enable GPU acceleration on Mac M1 and achieve a smooth installation
😜Что такое LLM и как работает AL: Deep Learning в NLP
Сегодня большие языковые модели (LLM, large language models) активно используются в задачах обработки естественного языка (NLP). LLM работают по двухэтапной схеме: предварительная подготовка и точная настройка. Первый этап использует большое количество немаркированных данных для создания предварительно обученных весов. Далее на этапе тонкой настройки эти веса загружаются и обучаются размеченным данным из последующих задач. LLM позволяет достичь хороших результатов даже с небольшим набором размеченных данных, сокращая время обучения. Но в реальности разметка даже небольшого датасета может стоить дорого. А когда речь идет о многоклассовой классификации, задача маркирования еще больше усложняется. Сократить количество таких аннотаций поможет активное обучение (Active Learning, AL).
Основная идея AL заключается в том, что алгоритм может достичь лучшей производительности с меньшим количеством размеченных образцов, что сокращает усилия по разметке и время обучения. AL полезно, когда разметка данных стоит дорого или их трудно собрать, тогда как немаркированные данные есть в большом количестве. Это характерно для большинства реальных приложений, например, речевые данные и пр.
Одним из самых популярных подходов к AL является выборка на основе пула (Pool-base sampling), который предполагает наличие небольшой начальный набор размеченных данных для обучения начального классификатора, и большой набор немаркированных данных. Первоначальный классификатор выбирает образцы из немаркированного набора, используя показатель информативности. Затем отобранные образцы маркируются автоматически или вручную и добавляются к размеченным данным. Новая модель обучается с использованием нового размеченного набора. Процесс повторяется до тех пор, пока не будет достигнута желаемая производительность.
Метрика информативности или стратегия запроса помогает выбрать образцы, которые стоит маркировать. Есть несколько стратегий запросов в зависимости от данных и задачи. Например, можно использовать выборку неопределенности (Uncertainty sampling) – эвристику с вероятностными классификаторами, чтобы выбрать наиболее неопределенные выборки. Высокая неопределенность указывает на границу принятия решения, уточнение которой приведет к обучению лучшего классификатора.
https://towardsdatascience.com/transformers-meet-active-learning-less-data-better-performance-4cf931517ff6
Сегодня большие языковые модели (LLM, large language models) активно используются в задачах обработки естественного языка (NLP). LLM работают по двухэтапной схеме: предварительная подготовка и точная настройка. Первый этап использует большое количество немаркированных данных для создания предварительно обученных весов. Далее на этапе тонкой настройки эти веса загружаются и обучаются размеченным данным из последующих задач. LLM позволяет достичь хороших результатов даже с небольшим набором размеченных данных, сокращая время обучения. Но в реальности разметка даже небольшого датасета может стоить дорого. А когда речь идет о многоклассовой классификации, задача маркирования еще больше усложняется. Сократить количество таких аннотаций поможет активное обучение (Active Learning, AL).
Основная идея AL заключается в том, что алгоритм может достичь лучшей производительности с меньшим количеством размеченных образцов, что сокращает усилия по разметке и время обучения. AL полезно, когда разметка данных стоит дорого или их трудно собрать, тогда как немаркированные данные есть в большом количестве. Это характерно для большинства реальных приложений, например, речевые данные и пр.
Одним из самых популярных подходов к AL является выборка на основе пула (Pool-base sampling), который предполагает наличие небольшой начальный набор размеченных данных для обучения начального классификатора, и большой набор немаркированных данных. Первоначальный классификатор выбирает образцы из немаркированного набора, используя показатель информативности. Затем отобранные образцы маркируются автоматически или вручную и добавляются к размеченным данным. Новая модель обучается с использованием нового размеченного набора. Процесс повторяется до тех пор, пока не будет достигнута желаемая производительность.
Метрика информативности или стратегия запроса помогает выбрать образцы, которые стоит маркировать. Есть несколько стратегий запросов в зависимости от данных и задачи. Например, можно использовать выборку неопределенности (Uncertainty sampling) – эвристику с вероятностными классификаторами, чтобы выбрать наиболее неопределенные выборки. Высокая неопределенность указывает на границу принятия решения, уточнение которой приведет к обучению лучшего классификатора.
https://towardsdatascience.com/transformers-meet-active-learning-less-data-better-performance-4cf931517ff6
Medium
Transformers Meet Active Learning: Less Data, Better Performance
A hands-on tutorial on how to use Active Learning with Transformer models
💸Финансовая DL-система обучения с подкреплением
FinRL - это DL-платформа с открытым исходным кодом, которая помогает создать конвейер разработки торговых стратегий с использованием глубокого обучения с подкреплением (Reinforcement Learning, RL). В обучении с подкреплением есть три основных компонента: состояние, действие и вознаграждение. Агент RL наблюдает за пространством состояний, а затем придумывает действие, чтобы максимизировать общее вознаграждение в будущем. Агент учится, постоянно взаимодействуя с окружающей средой методом проб и ошибок, принимая последовательные решения в условиях неопределенности и достигая баланса между обучением и работой на реальных данных. https://github.com/AI4Finance-Foundation/FinRL
Дополнительно улучшить решение на основе FinRL можно, подключив следующие DL-библиотеки:
• RLlib обеспечивает высокую масштабируемость и унифицированный API для множества приложений. RLlib изначально поддерживает TensorFlow, TensorFlow Eager и PyTorch, но большинство его внутренних компонентов не зависят от фреймворка. https://docs.ray.io/en/latest/rllib.html
• легковесный проект ElegantRL - более стабильный, чем Stable Baselines 3 и с поддержкой до 8 графических процессоров. ElegantRL реализует DL-алгоритмы с подкреплением без использования моделей: DDPG, TD3, SAC, PPO, PPO (GAE) для непрерывных задач, а также DQN, DoubleDQN, D3QN для дискретных задач. https://github.com/AI4Finance-Foundation/ElegantRL
Смотрите подробный пример практического использования всех этих DLR-инструментов: https://medium.com/analytics-vidhya/a-hitchhikers-guide-to-finrl-a-deep-reinforcement-learning-framework-for-quantitative-finance-e624c508f763
FinRL - это DL-платформа с открытым исходным кодом, которая помогает создать конвейер разработки торговых стратегий с использованием глубокого обучения с подкреплением (Reinforcement Learning, RL). В обучении с подкреплением есть три основных компонента: состояние, действие и вознаграждение. Агент RL наблюдает за пространством состояний, а затем придумывает действие, чтобы максимизировать общее вознаграждение в будущем. Агент учится, постоянно взаимодействуя с окружающей средой методом проб и ошибок, принимая последовательные решения в условиях неопределенности и достигая баланса между обучением и работой на реальных данных. https://github.com/AI4Finance-Foundation/FinRL
Дополнительно улучшить решение на основе FinRL можно, подключив следующие DL-библиотеки:
• RLlib обеспечивает высокую масштабируемость и унифицированный API для множества приложений. RLlib изначально поддерживает TensorFlow, TensorFlow Eager и PyTorch, но большинство его внутренних компонентов не зависят от фреймворка. https://docs.ray.io/en/latest/rllib.html
• легковесный проект ElegantRL - более стабильный, чем Stable Baselines 3 и с поддержкой до 8 графических процессоров. ElegantRL реализует DL-алгоритмы с подкреплением без использования моделей: DDPG, TD3, SAC, PPO, PPO (GAE) для непрерывных задач, а также DQN, DoubleDQN, D3QN для дискретных задач. https://github.com/AI4Finance-Foundation/ElegantRL
Смотрите подробный пример практического использования всех этих DLR-инструментов: https://medium.com/analytics-vidhya/a-hitchhikers-guide-to-finrl-a-deep-reinforcement-learning-framework-for-quantitative-finance-e624c508f763
GitHub
GitHub - AI4Finance-Foundation/FinRL: FinRL: Financial Reinforcement Learning. 🔥
FinRL: Financial Reinforcement Learning. 🔥. Contribute to AI4Finance-Foundation/FinRL development by creating an account on GitHub.
☀️Глубокое обучение со скоростью света
Одной из главных проблем глубокого обучения является стоимость вычислительных процессов. Глубокие нейросети потребляют множество энергии для обучения, поэтому DS-специалисты ищут способы сократить эти затраты. Для этого компания Lightmatter предложила стратегию вычислений с использованием фотонов, а не электронов. В конце 2021 года Lightmatter планирует выпустить световую микросхему ускорителя нейросети, доработав ранее созданный прототип чипа Mars. Вообще сама идея световых, а не электронных вычислений не нова: в микросхемах Lightmatter основным компонентом является интерферометр Маха-Цендера, изобретенный в конце 19 века. Однако, упаковать их в миниатюрный чип было невозможно до недавнего времени. Благодаря развитию интегрированной фотоники инженеры Lightmatter смогли уменьшить интерферометры до такой степени, чтобы разместить их в миниатюрный чип и использовать для выполнения матричных умножений в вычислениях нейросетей.
Обработка аналоговых сигналов, переносимых светом, снижает затраты на электроэнергию и увеличивает скорость вычислений, но пока проигрывает цифровым системам в точности. Поэтому Lightmatter и другие стартапы, работающие в этом направлении (Fathom Computing, LightIntelligence, LightOn, Luminous и Optalysis) работают над этой проблемой. Например, Luminous планирует применить оптические вычисления для объяснения принципов работы человеческого мозга и применения их к искусственным нейросетям, ожидая получить работающую систему не позже 2025 года.
https://spectrum.ieee.org/deep-learning-at-the-speed-of-light
Одной из главных проблем глубокого обучения является стоимость вычислительных процессов. Глубокие нейросети потребляют множество энергии для обучения, поэтому DS-специалисты ищут способы сократить эти затраты. Для этого компания Lightmatter предложила стратегию вычислений с использованием фотонов, а не электронов. В конце 2021 года Lightmatter планирует выпустить световую микросхему ускорителя нейросети, доработав ранее созданный прототип чипа Mars. Вообще сама идея световых, а не электронных вычислений не нова: в микросхемах Lightmatter основным компонентом является интерферометр Маха-Цендера, изобретенный в конце 19 века. Однако, упаковать их в миниатюрный чип было невозможно до недавнего времени. Благодаря развитию интегрированной фотоники инженеры Lightmatter смогли уменьшить интерферометры до такой степени, чтобы разместить их в миниатюрный чип и использовать для выполнения матричных умножений в вычислениях нейросетей.
Обработка аналоговых сигналов, переносимых светом, снижает затраты на электроэнергию и увеличивает скорость вычислений, но пока проигрывает цифровым системам в точности. Поэтому Lightmatter и другие стартапы, работающие в этом направлении (Fathom Computing, LightIntelligence, LightOn, Luminous и Optalysis) работают над этой проблемой. Например, Luminous планирует применить оптические вычисления для объяснения принципов работы человеческого мозга и применения их к искусственным нейросетям, ожидая получить работающую систему не позже 2025 года.
https://spectrum.ieee.org/deep-learning-at-the-speed-of-light
IEEE Spectrum
Deep Learning at the Speed of Light
Lightmatter bets that optical computing can solve AI’s efficiency problem
🤦🏼♀️Защита частной жизни vs успехи глубокого обучения: размывание лиц в ImageNet
Бум нейросетевых алгоритмов распознавания образов, возникший в 2012 году, обусловлен не только развитием аппаратного обеспечения, но накопленному множеству обучающих датасетам, самым известным из которых является ImageNet. Однако в 2021 году исследователи, управляющие этим набором данных, решили размыть входящие в него снимки лиц реальных людей.
Сегодня ImageNet содержит 1,5 миллиона промаркированных изображений, которые часто используются для измерения производительности ML-алгоритмов или для обучения моделей компьютерного зрения. Размытие лиц затронуло 243 198 изображений, при этом другие объекты на фотографиях не были затронуты. Размытие лиц было реализовано с помощью ИИ-сервиса Amazon Rekognition и сотрудников Mechanical Turk. Примечательно, что размытие лиц не повлияло на производительность алгоритмов распознавания объектов, обученных на ImageNet.
Это не первая попытка модификации знаменитой библиотеки изображений: в декабре 2019 года команда ImageNet удалила предвзятые и уничижительные термины, используемые для маркирования фотографий. Однако, размытие лиц не исключает возможности нарушения приватности: DL-алгоритмы могут научиться искать людей и по размытым фотографиям. А DL-система, обученный на наборе данных с размытыми лицами, может быть сбита с толку внешним видом людей в реальном мире. Поэтому при принятии таких решений, касающихся использования глобальных датасетов, следует учитывать все риски и возможные негативные последствия.
https://www.wired.com/story/researchers-blur-faces-launched-thousand-algorithms/
Бум нейросетевых алгоритмов распознавания образов, возникший в 2012 году, обусловлен не только развитием аппаратного обеспечения, но накопленному множеству обучающих датасетам, самым известным из которых является ImageNet. Однако в 2021 году исследователи, управляющие этим набором данных, решили размыть входящие в него снимки лиц реальных людей.
Сегодня ImageNet содержит 1,5 миллиона промаркированных изображений, которые часто используются для измерения производительности ML-алгоритмов или для обучения моделей компьютерного зрения. Размытие лиц затронуло 243 198 изображений, при этом другие объекты на фотографиях не были затронуты. Размытие лиц было реализовано с помощью ИИ-сервиса Amazon Rekognition и сотрудников Mechanical Turk. Примечательно, что размытие лиц не повлияло на производительность алгоритмов распознавания объектов, обученных на ImageNet.
Это не первая попытка модификации знаменитой библиотеки изображений: в декабре 2019 года команда ImageNet удалила предвзятые и уничижительные термины, используемые для маркирования фотографий. Однако, размытие лиц не исключает возможности нарушения приватности: DL-алгоритмы могут научиться искать людей и по размытым фотографиям. А DL-система, обученный на наборе данных с размытыми лицами, может быть сбита с толку внешним видом людей в реальном мире. Поэтому при принятии таких решений, касающихся использования глобальных датасетов, следует учитывать все риски и возможные негативные последствия.
https://www.wired.com/story/researchers-blur-faces-launched-thousand-algorithms/
WIRED
Researchers Blur Faces That Launched a Thousand Algorithms
Managers of the ImageNet data set paved the way for advances in deep learning. Now they’ve taken a big step to protect people’s privacy.
🌸Прогнозирование взаимосвязей между генами и фенотипами с DL
Одной из актуальных задач современной системной биологии является вывод фенотипических результатов на основе геномных особенностей. Исследователи применили эволюционное DL-моделирование для прогнозирования фенотипов для анализа ответов внутривидовых и межвидовых транскриптомов для нескольких сортов кукурузы. Возможность использовать геномные данные для прогнозирования, как организм отреагирует на изменения в питании, токсинах и воздействии патогенов даст пользу для улучшения сельскохозяйственных культур, прогнозирования болезней, эпидемиологии и других биомедицинских приложений. С учетом огромного количества данных, для этой задачи ученые использовали алгоритмы глубокого обучения, разработав эволюционный ML-конвейер для идентификации важных генов.
Подробную статью с графическими иллюстрациями, формулами и таблицами читайте здесь: https://www.nature.com/articles/s41467-021-25893-w
Одной из актуальных задач современной системной биологии является вывод фенотипических результатов на основе геномных особенностей. Исследователи применили эволюционное DL-моделирование для прогнозирования фенотипов для анализа ответов внутривидовых и межвидовых транскриптомов для нескольких сортов кукурузы. Возможность использовать геномные данные для прогнозирования, как организм отреагирует на изменения в питании, токсинах и воздействии патогенов даст пользу для улучшения сельскохозяйственных культур, прогнозирования болезней, эпидемиологии и других биомедицинских приложений. С учетом огромного количества данных, для этой задачи ученые использовали алгоритмы глубокого обучения, разработав эволюционный ML-конвейер для идентификации важных генов.
Подробную статью с графическими иллюстрациями, формулами и таблицами читайте здесь: https://www.nature.com/articles/s41467-021-25893-w
Nature
Evolutionarily informed machine learning enhances the power of predictive gene-to-phenotype relationships
Nature Communications - Predicting complex phenotypes from genomic information is still a challenge. Here, the authors use an evolutionarily informed machine learning approach within and across...
🤜🏻🏃Восстановление после падения: новая DL-система с подкреплением
Команда исследователей из Чжэцзянского и Эдинбургского университетов научили робота вставать после падения, случившегося из-за физической атаки. Они разработали архитектуру обучения с восемью экспертными алгоритмами, которые помогают роботу-собаке выработать сложное поведение. Для каждого алгоритма создана глубокая нейросеть, обучающая виртуальную модель робота бежать или вставать, если он упал на спину. Это типичная система обучения с подкреплением: когда робот пробовал что-то, приближающее его к цели, он получал цифровое вознаграждение.
После обучения экспертных алгоритмов исследователи объединили их в единую сеть, чтобы они могли действовать вместе. Например, когда робот падает и ему необходимо восстановиться, система обнаруживает это движение и запускает алгоритм балансировки. По мере того как виртуальный робот перемещается по моделируемой среде, DL-сеть изменяет влияние отдельных экспертных алгоритмов, в зависимости от того, какие навыки необходимы в конкретный момент.
После моделирования в виртуальной среде исследователи перенесли робота в реальный мир. Эксперименты показали успешность предложенного подхода: робот учился ходить, падая и самостоятельно поднимаясь, как это делают люди в младенческом возрасте.
https://www.wired.com/story/watch-a-robot-dog-learn-how-to-deftly-fend-off-a-human/
Команда исследователей из Чжэцзянского и Эдинбургского университетов научили робота вставать после падения, случившегося из-за физической атаки. Они разработали архитектуру обучения с восемью экспертными алгоритмами, которые помогают роботу-собаке выработать сложное поведение. Для каждого алгоритма создана глубокая нейросеть, обучающая виртуальную модель робота бежать или вставать, если он упал на спину. Это типичная система обучения с подкреплением: когда робот пробовал что-то, приближающее его к цели, он получал цифровое вознаграждение.
После обучения экспертных алгоритмов исследователи объединили их в единую сеть, чтобы они могли действовать вместе. Например, когда робот падает и ему необходимо восстановиться, система обнаруживает это движение и запускает алгоритм балансировки. По мере того как виртуальный робот перемещается по моделируемой среде, DL-сеть изменяет влияние отдельных экспертных алгоритмов, в зависимости от того, какие навыки необходимы в конкретный момент.
После моделирования в виртуальной среде исследователи перенесли робота в реальный мир. Эксперименты показали успешность предложенного подхода: робот учился ходить, падая и самостоятельно поднимаясь, как это делают люди в младенческом возрасте.
https://www.wired.com/story/watch-a-robot-dog-learn-how-to-deftly-fend-off-a-human/
Wired
Watch a Robot Dog Learn How to Deftly Fend Off a Human
Kick over this robot and it’ll quickly right itself—not because someone told it how, but because it taught itself to overcome the embarrassment.
Forwarded from Алексей Чернобровов
Я продолжаю серию митапов про Data Science в геосервисах, логистике, приложениях Smart City и т.д.
28 октября в 18:00 МСК состоится 3-я онлайн встреча Citymobil Data Meetup!
💣 Программа – пушка!
🚕 Ксения Мензорова Data Science в Surge Pricing Ситимобил
«Атака тестов на свичбэк»
Расскажет какими статистическими методами можно проверить switchback-тест. А ещё подскажет, как правильно выбрать подход, позволяющий бизнесу быстро принимать решения.
🚕 Екатерина Колпакова Руководитель DWH Ситимобил
«Сказ про то как мы в Ситимобил DWH строим»
Подробно расскажет о подходе к построению сложных систем, совмещения Data Vault и Data Lake, а также будет рассмотрено, как же в компании устроены потоки данных.
🛴 Николай Рядчиков Senior ML Specialist Самокат
«Прогнозирование времени доставки заказа»
Будут рассмотрены необходимость детальной структуры местности для точного прогноза заказа, временные факторы прогноза, очередность заказа в порядке выполнения курьером как важнейший фактор прогноза, методология проведения экспериментов для проверки качества прогноза.
После доклада спикеры ответят на вопросы слушателей. Регистрация для бесплатного участия в первом комментарии)
https://citymobil.timepad.ru/event/1813232/
28 октября в 18:00 МСК состоится 3-я онлайн встреча Citymobil Data Meetup!
💣 Программа – пушка!
🚕 Ксения Мензорова Data Science в Surge Pricing Ситимобил
«Атака тестов на свичбэк»
Расскажет какими статистическими методами можно проверить switchback-тест. А ещё подскажет, как правильно выбрать подход, позволяющий бизнесу быстро принимать решения.
🚕 Екатерина Колпакова Руководитель DWH Ситимобил
«Сказ про то как мы в Ситимобил DWH строим»
Подробно расскажет о подходе к построению сложных систем, совмещения Data Vault и Data Lake, а также будет рассмотрено, как же в компании устроены потоки данных.
🛴 Николай Рядчиков Senior ML Specialist Самокат
«Прогнозирование времени доставки заказа»
Будут рассмотрены необходимость детальной структуры местности для точного прогноза заказа, временные факторы прогноза, очередность заказа в порядке выполнения курьером как важнейший фактор прогноза, методология проведения экспериментов для проверки качества прогноза.
После доклада спикеры ответят на вопросы слушателей. Регистрация для бесплатного участия в первом комментарии)
https://citymobil.timepad.ru/event/1813232/
citymobil.timepad.ru
Citymobil Data Meetup №3 / События на TimePad.ru
Ситимобил каждый месяц проводит митапы о применении Data science в городских и геосервисах, логистике и технологиях умных городов.
Добавляйтесь в наш телеграм-канал, чтобы быть в курсе новостей https://t.me/citymobiltech .
Добавляйтесь в наш телеграм-канал, чтобы быть в курсе новостей https://t.me/citymobiltech .
🕸Глубокое обучение для кибербезопасности: кейс Adobe
Команда Security Intelligence в Adobe применяет методы DL, чтобы лучше обнаруживать обфускацию команд, повышая общую безопасность. Обфускация команд - это популярный метод кибербезопасности, который намеренно затрудняет чтение части стандартного кода, продолжая выполнять его. Традиционные методы обнаружения вредоносных программ обычно основаны на правилах и не быстро адаптируются к новым типам вредоносных программ и обфускации. Обнаружить их поможет глубокое обучение, которое создает динамические ML-модели, способные адаптироваться к новым типам информации.
Есть несколько способов обнаружить обфускацию. Например, методы статистики, применяемой к соотношениям известных/неизвестных слов (токенов) и простым языковым моделям, основанным на n-граммах. Но при достаточном количестве данных глубокое обучение превосходит традиционные методы обработки естественного языка в классических основных задачах. Поэтому глубокое обучение может предоставить надежное решение для обнаружения запутанных команд, обфускация которых может принимать множество различных форм. Deep Learning позволяет создавать более динамичные модели, которые лучше работают с ранее невидимыми данными, чем традиционные методы ML.
Команда разработчиков Adobe представляет собой глубокую сверточную нейросеть (CNN) на уровне символов. Тестирование этой DL-модели на несбалансированном датасете показало отличные результаты, близкие к 100% успешности.
Исходный код и подробное объяснение доступны здесь: https://pypi.org/project/obfuscation-detection/
Команда Security Intelligence в Adobe применяет методы DL, чтобы лучше обнаруживать обфускацию команд, повышая общую безопасность. Обфускация команд - это популярный метод кибербезопасности, который намеренно затрудняет чтение части стандартного кода, продолжая выполнять его. Традиционные методы обнаружения вредоносных программ обычно основаны на правилах и не быстро адаптируются к новым типам вредоносных программ и обфускации. Обнаружить их поможет глубокое обучение, которое создает динамические ML-модели, способные адаптироваться к новым типам информации.
Есть несколько способов обнаружить обфускацию. Например, методы статистики, применяемой к соотношениям известных/неизвестных слов (токенов) и простым языковым моделям, основанным на n-граммах. Но при достаточном количестве данных глубокое обучение превосходит традиционные методы обработки естественного языка в классических основных задачах. Поэтому глубокое обучение может предоставить надежное решение для обнаружения запутанных команд, обфускация которых может принимать множество различных форм. Deep Learning позволяет создавать более динамичные модели, которые лучше работают с ранее невидимыми данными, чем традиционные методы ML.
Команда разработчиков Adobe представляет собой глубокую сверточную нейросеть (CNN) на уровне символов. Тестирование этой DL-модели на несбалансированном датасете показало отличные результаты, близкие к 100% успешности.
Исходный код и подробное объяснение доступны здесь: https://pypi.org/project/obfuscation-detection/
PyPI
obfuscation-detection
Python module for obfuscation classification in command line executions
🎂SaLinA – легковесная DL-библиотека для последовательного обучения агентов и обучения с подкреплением от Facebook Research
SaLinA основана на популярном DL-фреймворке PyTorch и использует Hydra для настройки экспериментов, а также Gym для алгоритмов обучения с подкреплением. Исходный код SaLinA не превышает 300 строк, но она позволяет реализовать последовательные процессы принятия решения, создавая сложные агенты из более простых с предопределенными контейнерами. А оболочка NRemoteAgent может выполнить любой агент в нескольких процессах, ускоряя вычисления. Благодаря тому, что алгоритмы выполняются на CPU или графических процессорах, процессы развертывания и масштабирования становятся проще.
Стоит помнить, что SaLinA – это не просто очередной RL-фреймворк: она ориентирована на последовательное принятие решений в целом, а только для этого частного случая. Помимо обучения с подкреплением, SaLinA можно использовать для контролируемого ML, моделей внимания, многоагентного обучения, рекомендательных систем и других вариантов использования. Хотя SaLinA – это всего лишь небольшой слой поверх PyTorch, который очень просто использовать, этот инструмент очень мощный.
Библиотека распространяется под лицензией MIT И доступна для свободного скачивания с Github. https://github.com/facebookresearch/salina
SaLinA основана на популярном DL-фреймворке PyTorch и использует Hydra для настройки экспериментов, а также Gym для алгоритмов обучения с подкреплением. Исходный код SaLinA не превышает 300 строк, но она позволяет реализовать последовательные процессы принятия решения, создавая сложные агенты из более простых с предопределенными контейнерами. А оболочка NRemoteAgent может выполнить любой агент в нескольких процессах, ускоряя вычисления. Благодаря тому, что алгоритмы выполняются на CPU или графических процессорах, процессы развертывания и масштабирования становятся проще.
Стоит помнить, что SaLinA – это не просто очередной RL-фреймворк: она ориентирована на последовательное принятие решений в целом, а только для этого частного случая. Помимо обучения с подкреплением, SaLinA можно использовать для контролируемого ML, моделей внимания, многоагентного обучения, рекомендательных систем и других вариантов использования. Хотя SaLinA – это всего лишь небольшой слой поверх PyTorch, который очень просто использовать, этот инструмент очень мощный.
Библиотека распространяется под лицензией MIT И доступна для свободного скачивания с Github. https://github.com/facebookresearch/salina
GitHub
GitHub - facebookresearch/salina: a Lightweight library for sequential learning agents, including reinforcement learning
a Lightweight library for sequential learning agents, including reinforcement learning - GitHub - facebookresearch/salina: a Lightweight library for sequential learning agents, including reinforcem...
😎Безопасное распознавание лиц: датасет с синтетическими лицами от Microsoft
После того, как DS-исследователи, управляющие популярным набором данных ImageNet, решили размыть входящие в него снимки лиц реальных людей, корпорация Microsoft создала датасет синтетических изображений лиц под названием «Fake It Till You Make It». Этот набор данных получен с помощью DL-нейросети, генерирующей параметрическую 3D-модель лица, к которой случайным образом применяются текстуры кожи и волос. В результате составлен датасет из 100000 изображений лиц с разрешением 512 x 512 пикселей, включая 70 стандартных аннотаций лицевых ориентиров и попиксельные аннотации семантических классов. Разработчики ожидают, что этот набор данных поможет ML-специалистам организовать предварительное обучение алгоритмов распознавания лиц перед запуском в production.
https://microsoft.github.io/FaceSynthetics/
https://github.com/microsoft/FaceSynthetics
После того, как DS-исследователи, управляющие популярным набором данных ImageNet, решили размыть входящие в него снимки лиц реальных людей, корпорация Microsoft создала датасет синтетических изображений лиц под названием «Fake It Till You Make It». Этот набор данных получен с помощью DL-нейросети, генерирующей параметрическую 3D-модель лица, к которой случайным образом применяются текстуры кожи и волос. В результате составлен датасет из 100000 изображений лиц с разрешением 512 x 512 пикселей, включая 70 стандартных аннотаций лицевых ориентиров и попиксельные аннотации семантических классов. Разработчики ожидают, что этот набор данных поможет ML-специалистам организовать предварительное обучение алгоритмов распознавания лиц перед запуском в production.
https://microsoft.github.io/FaceSynthetics/
https://github.com/microsoft/FaceSynthetics
GitHub
GitHub - microsoft/FaceSynthetics
Contribute to microsoft/FaceSynthetics development by creating an account on GitHub.
🌦Не только биомедицина: DL-прогноз погоды от DeepMind
Дочерняя компания Google AI, ставшая всемирно известной после успеха AlphaFold с предсказанием структуры белков, недавно представила новый DL-проект: генеративно-состязательную сеть Deep Generative Model of Rain (DGMR) для краткосрочных прогнозов погоды. По сравнению с другими ML-аналогами и физическим моделированием, эта модель дает самые высокие показатели точности. DGMR представляет собой генеративно-состязательную нейросеть, обученную на данных с радиолокационных измерений о формировании и движении облаков. GAN-сеть генерирует новые образцы данных, похожие на обучающий датасет, полученный с радаров, создавая синтетические снимки радиолокации, которые продолжают последовательность реальных измерений.
https://deepmind.com/blog/article/nowcasting
https://www.nature.com/articles/s41586-021-03854-z
Дочерняя компания Google AI, ставшая всемирно известной после успеха AlphaFold с предсказанием структуры белков, недавно представила новый DL-проект: генеративно-состязательную сеть Deep Generative Model of Rain (DGMR) для краткосрочных прогнозов погоды. По сравнению с другими ML-аналогами и физическим моделированием, эта модель дает самые высокие показатели точности. DGMR представляет собой генеративно-состязательную нейросеть, обученную на данных с радиолокационных измерений о формировании и движении облаков. GAN-сеть генерирует новые образцы данных, похожие на обучающий датасет, полученный с радаров, создавая синтетические снимки радиолокации, которые продолжают последовательность реальных измерений.
https://deepmind.com/blog/article/nowcasting
https://www.nature.com/articles/s41586-021-03854-z
Deepmind
Nowcasting the next hour of rain
Our lives are dependent on the weather. At any moment in the UK, according to one study, one third of the country has talked about the weather in the past hour, reflecting the importance of weather in daily life. Amongst weather phenomena, rain is especially…
📝DL для исправления опечаток и других ошибок: Context IQ в Microsoft 365
2 ноября 2021 года Microsoft объявила об улучшении текстового редактора и других офисных приложений с помощью ИИ. Благодаря DL-решению Context IQ опечатки будут исправляться сами, а найти нужный документ и поделиться им с коллегами станет еще проще. Это лишь немногие функции, которые станут доступны пользователям в 2022 году, который наступит уже через пару месяцев.
https://techcommunity.microsoft.com/t5/microsoft-365-blog/microsoft-editor-is-now-superpowered-with-context-iq-to-help-you/ba-p/2897180
2 ноября 2021 года Microsoft объявила об улучшении текстового редактора и других офисных приложений с помощью ИИ. Благодаря DL-решению Context IQ опечатки будут исправляться сами, а найти нужный документ и поделиться им с коллегами станет еще проще. Это лишь немногие функции, которые станут доступны пользователям в 2022 году, который наступит уже через пару месяцев.
https://techcommunity.microsoft.com/t5/microsoft-365-blog/microsoft-editor-is-now-superpowered-with-context-iq-to-help-you/ba-p/2897180
TECHCOMMUNITY.MICROSOFT.COM
Microsoft Editor is now superpowered with Context IQ to help you stay in the flow of your work
Whether you’re a seasoned author or drafting your second blog post ever, writing assistance can speed up the creative process. It’s even better if that assistance includes intelligent suggestions informed by your own writing. Today, we’re announcing Context…
🔥MuJoCo теперь open-cource: как DeepMind купила и открыла исходный код самого популярного робосимулятора
MuJoCo (Multi-Joint Dynamics with Contact) – физический симулятор, разработанный Roboti LLC, активно используется для моделирования реальных ситуаций у робототехников. Контактная модель симулятора точно и эффективно фиксирует характерные особенности различных объектов. Как и другие симуляторы твердого тела, он избегает мелких деталей деформаций в месте контакта и работает быстрее, чем в реальном времени. Однако, в отличие от других симуляторов, MuJoCo использует выпуклый принцип Гаусса, обеспечивая четко определенную обратную динамику. Модель предоставляет множество параметров, которые можно настраивать для аппроксимации широкого диапазона явлений контакта.
В октябре 2021 года дочерняя компания Google AI, DeepMind приобрела MuJoCo и открыла его исходный код. Скоро планируется выпустить MuJoCo в виде бесплатной предварительно скомпилированной библиотеки.
https://deepmind.com/blog/announcements/mujoco
https://github.com/deepmind/mujoco
MuJoCo (Multi-Joint Dynamics with Contact) – физический симулятор, разработанный Roboti LLC, активно используется для моделирования реальных ситуаций у робототехников. Контактная модель симулятора точно и эффективно фиксирует характерные особенности различных объектов. Как и другие симуляторы твердого тела, он избегает мелких деталей деформаций в месте контакта и работает быстрее, чем в реальном времени. Однако, в отличие от других симуляторов, MuJoCo использует выпуклый принцип Гаусса, обеспечивая четко определенную обратную динамику. Модель предоставляет множество параметров, которые можно настраивать для аппроксимации широкого диапазона явлений контакта.
В октябре 2021 года дочерняя компания Google AI, DeepMind приобрела MuJoCo и открыла его исходный код. Скоро планируется выпустить MuJoCo в виде бесплатной предварительно скомпилированной библиотеки.
https://deepmind.com/blog/announcements/mujoco
https://github.com/deepmind/mujoco
Google DeepMind
Opening up a physics simulator for robotics
When you walk, your feet make contact with the ground. When you write, your fingers make contact with the pen. Physical contacts are what makes interaction with the world possible. Yet, for such a...
😜Распознавание речи на редких языках: новый проект MIT
Исследователи из Массачусетского технологического института предлагают удалить ненужные части общей, но сложной модели распознавания речи, а затем внести в нее незначительные изменение, чтобы модель могла распознавать определенный язык. После того, как крупная модель будет уменьшена, ее обучение становится дешевле и быстрее. Это поможет внедрить системы автоматического распознавания речи в страны и регионы, где люди говорят на редких языках.
Ученые модернизировали Wave2vec 2.0 – популярную ML-модель, которая учится распознавать разговорный язык после тренировки на больших объемах немаркированных данных. Изначально эта нейросеть имеет около 300 миллионов отдельных соединений и требует огромное количество вычислительных мощностей. На первом этапе из предварительно обученной Wave2vec 2.0 удаляются ненужные соединения, далее подсеть корректируется для определенного языка, а затем снова сокращается. На этом втором этапе удаленные соединения могут расти, если они важны для конкретного языка. Поэтому модель нужно настраивать только один раз, а не за несколько итераций, что значительно снижает количество потребляемых вычислительных мощностей.
По сравнению с другими методами распознавания речи, предложенный подход особенно эффективен на небольших датасетах и может создать одну малую сеть, которую можно точно настроить для 10 языков одновременно. Это дополнительно сокращает расходы и время на обучение языковых моделей.
https://news.mit.edu/2021/speech-recognition-uncommon-languages-1104
Исследователи из Массачусетского технологического института предлагают удалить ненужные части общей, но сложной модели распознавания речи, а затем внести в нее незначительные изменение, чтобы модель могла распознавать определенный язык. После того, как крупная модель будет уменьшена, ее обучение становится дешевле и быстрее. Это поможет внедрить системы автоматического распознавания речи в страны и регионы, где люди говорят на редких языках.
Ученые модернизировали Wave2vec 2.0 – популярную ML-модель, которая учится распознавать разговорный язык после тренировки на больших объемах немаркированных данных. Изначально эта нейросеть имеет около 300 миллионов отдельных соединений и требует огромное количество вычислительных мощностей. На первом этапе из предварительно обученной Wave2vec 2.0 удаляются ненужные соединения, далее подсеть корректируется для определенного языка, а затем снова сокращается. На этом втором этапе удаленные соединения могут расти, если они важны для конкретного языка. Поэтому модель нужно настраивать только один раз, а не за несколько итераций, что значительно снижает количество потребляемых вычислительных мощностей.
По сравнению с другими методами распознавания речи, предложенный подход особенно эффективен на небольших датасетах и может создать одну малую сеть, которую можно точно настроить для 10 языков одновременно. Это дополнительно сокращает расходы и время на обучение языковых моделей.
https://news.mit.edu/2021/speech-recognition-uncommon-languages-1104
MIT News
Toward speech recognition for uncommon spoken languages
PARP is a new technique that reduces computational complexity of an advanced machine learning model so it can be applied to perform automated speech recognition for rare or uncommon languages. The work was developed by researchers from MIT CSAIL and elsewhere.
🌏🪐🌚Как DL открывает новые экзопланеты и ищет незаконные свалки
Большинство известных сегодня экзопланет обнаружено транзитным методом, основанным на мини-затмениях при прохождении планеты перед звездой. Наблюдаемое уменьшение светимости позволяет сделать вывод о существовании планеты и оценить ее диаметр после периодического подтверждения наблюдений. Однако, во многих планетных системах взаимодействия между планетами изменяют эту периодичность и делают невозможным их обнаружение. Поэтому группа ученых из университетов Швейцарии вместе с компанией Disaitek применили ИИ для обработки изображений, научив ML-модель предсказывать эффект взаимодействия между планетами, чтобы найти экзопланеты.
Нейросеть определяет для каждого пикселя изображения того объекта, который он представляет, чтобы выявить для каждого измерения светимости звезды, наблюдается ли затмение планеты. Далее ML-модель принимает решение, сравнивая все доступные наблюдения этой звезды с диапазоном конфигураций, наблюдаемых во время ее обучения. Так с помощью ML обнаружены две экзопланеты - Kepler-1705b и Kepler-1705c, определены их радиусы, масса, сделаны выводы о плотности и составе. DL проанализировало множество результатов численного моделирования, производящего терабайты данных.
Хотя метод доказал свою эффективность для астрономических наблюдений, он может также использоваться и для земных нужд для наблюдений за нашей планетой и окружающей средой, в частности, для решения экологических проблем, например, обнаружения незаконных свалок.
https://phys.org/news/2021-10-exoplanets-artificial-intelligence.html
Большинство известных сегодня экзопланет обнаружено транзитным методом, основанным на мини-затмениях при прохождении планеты перед звездой. Наблюдаемое уменьшение светимости позволяет сделать вывод о существовании планеты и оценить ее диаметр после периодического подтверждения наблюдений. Однако, во многих планетных системах взаимодействия между планетами изменяют эту периодичность и делают невозможным их обнаружение. Поэтому группа ученых из университетов Швейцарии вместе с компанией Disaitek применили ИИ для обработки изображений, научив ML-модель предсказывать эффект взаимодействия между планетами, чтобы найти экзопланеты.
Нейросеть определяет для каждого пикселя изображения того объекта, который он представляет, чтобы выявить для каждого измерения светимости звезды, наблюдается ли затмение планеты. Далее ML-модель принимает решение, сравнивая все доступные наблюдения этой звезды с диапазоном конфигураций, наблюдаемых во время ее обучения. Так с помощью ML обнаружены две экзопланеты - Kepler-1705b и Kepler-1705c, определены их радиусы, масса, сделаны выводы о плотности и составе. DL проанализировало множество результатов численного моделирования, производящего терабайты данных.
Хотя метод доказал свою эффективность для астрономических наблюдений, он может также использоваться и для земных нужд для наблюдений за нашей планетой и окружающей средой, в частности, для решения экологических проблем, например, обнаружения незаконных свалок.
https://phys.org/news/2021-10-exoplanets-artificial-intelligence.html
phys.org
Discovering exoplanets using artificial intelligence
By implementing artificial intelligence techniques similar to those used in autonomous cars, a team from the UNIGE and the UniBE, in partnership with the company Disaitek, has discovered a new method ...
📕📗📘RGB-Stacking от DeepMind: новый эталон для роботизированных манипуляций на базе CV
DeepMind открыла исходный код среды моделирования для RL-обучения роботов-манипуляторов. В этой среде агент управляет манипулятором робота с параллельным захватом над корзиной, которая содержит три объекта разных цветов - красный, зеленый и синий, отсюда и название RGB (Red, Green, Blue). Задача агента - поставить красный объект поверх синего в течение 20 секунд, когда зеленый объект служит препятствием и отвлекает. Агент управляет роботом с помощью четырехмерного декартового контроллера, с 3-мя контролируемыми степенями свободы (x, y, z) и вращением вокруг оси z. Моделирование представляет собой среду MuJoCo, созданную с использованием структуры Modular Manipulation (MoMa).
Суть подхода в том, чтобы перевести основанную на состоянии политику моделирования с помощью стандартного RL-алгоритма с последующей интерактивной дистилляцией в политику на базе компьютерного зрения с использованием рандомизированной версии среды предметной области. Добавлено автономное обучение с подкреплением на основе симулированных и реальных данных.
https://deepmind.com/blog/article/stacking-our-way-to-more-general-robots
https://github.com/deepmind/rgb_stacking
DeepMind открыла исходный код среды моделирования для RL-обучения роботов-манипуляторов. В этой среде агент управляет манипулятором робота с параллельным захватом над корзиной, которая содержит три объекта разных цветов - красный, зеленый и синий, отсюда и название RGB (Red, Green, Blue). Задача агента - поставить красный объект поверх синего в течение 20 секунд, когда зеленый объект служит препятствием и отвлекает. Агент управляет роботом с помощью четырехмерного декартового контроллера, с 3-мя контролируемыми степенями свободы (x, y, z) и вращением вокруг оси z. Моделирование представляет собой среду MuJoCo, созданную с использованием структуры Modular Manipulation (MoMa).
Суть подхода в том, чтобы перевести основанную на состоянии политику моделирования с помощью стандартного RL-алгоритма с последующей интерактивной дистилляцией в политику на базе компьютерного зрения с использованием рандомизированной версии среды предметной области. Добавлено автономное обучение с подкреплением на основе симулированных и реальных данных.
https://deepmind.com/blog/article/stacking-our-way-to-more-general-robots
https://github.com/deepmind/rgb_stacking
Deepmind
Stacking our way to more general robots
Introducing RGB-Stacking as a new benchmark for vision-based robotic manipulation.