[Перевод] Deep Q Trading: объектно-ориентированный код на R
#DataMining #R #datamining #reinforcementlearning IV
https://habr.com/ru/post/496062/
#DataMining #R #datamining #reinforcementlearning IV
https://habr.com/ru/post/496062/
t.me
Deep Q Trading: объектно-ориентированный код на R
Привет! Это перевод еще одной моей статьи, посвященной обучению с подкреплением (reinforcement learning). Эту итерацию даже предложили запостить в блоге Веды а...
[Перевод] Что такое Emergent Communication и почему это нужно знать
#Машинноеобучение #Искусственныйинтеллект #обучениесподкреплением #обработкаестественногоязыка #искусственныйинтеллект #reinforcementlearning #naturallanguageprocessing IV
https://habr.com/ru/post/496830/
#Машинноеобучение #Искусственныйинтеллект #обучениесподкреплением #обработкаестественногоязыка #искусственныйинтеллект #reinforcementlearning #naturallanguageprocessing IV
https://habr.com/ru/post/496830/
t.me
Что такое Emergent Communication и почему это нужно знать
TL;DR: перевод поста Михаила Нуховича What is Emergent Communication and Why You Should Care: что это такое, зачем это нужно, какие есть точки зрения на задачу и...
[Перевод] Алгоритм MADDPG OpenAI
#БлогкомпанииOTUSОнлайнобразование #BigData #Математика #Машинноеобучение #ArtificialIntelligence #MachineLearning #ReinforcementLearning IV
https://habr.com/ru/post/508736/
#БлогкомпанииOTUSОнлайнобразование #BigData #Математика #Машинноеобучение #ArtificialIntelligence #MachineLearning #ReinforcementLearning IV
https://habr.com/ru/post/508736/
t.me
Алгоритм MADDPG OpenAI
Начинаем неделю с продолжения серии статей, подготовленных специально для базового и продвинутого курсов «Математика для Data Science». В конце статьи поделимс...
[Перевод] Модели мира. Могут ли агенты учиться в своем воображении?
#Искусственныйинтеллект #neuralnetworks #ai #reinforcementlearning IV
https://habr.com/ru/post/491128/
#Искусственныйинтеллект #neuralnetworks #ai #reinforcementlearning IV
https://habr.com/ru/post/491128/
t.me
Модели мира. Могут ли агенты учиться в своем воображении?
От переводчика: вопросы, поднятые в прошлой моей статье (видимо не слишком удачной) тем не менее вывели меня (огромное спасибо комраду Kilorad за ссылку!) на мат...
World Models — обучение в воображении
#Искусственныйинтеллект #reinforcementlearning #обучениесподкреплением #worldmodels IV
https://habr.com/ru/post/518804/
#Искусственныйинтеллект #reinforcementlearning #обучениесподкреплением #worldmodels IV
https://habr.com/ru/post/518804/
t.me
World Models — обучение в воображении
Обучение с подкреплением (Reinforcement Learning) плохо, а точнее, совсем не работает с высокими размерностями. А также сталкивается с проблемой, что физические...
Как мы управляли поездами на соревновании NeurIPS 2020: Flatland
#БлогкомпанииПитерскаяВышка #Машинноеобучение #УчебныйпроцессвIT #Транспорт #reinforcementlearning #обучениесподкреплением #machinelearning IV
https://habr.com/ru/post/537474/
#БлогкомпанииПитерскаяВышка #Машинноеобучение #УчебныйпроцессвIT #Транспорт #reinforcementlearning #обучениесподкреплением #machinelearning IV
https://habr.com/ru/post/537474/
t.me
Как мы управляли поездами на соревновании NeurIPS 2020: Flatland
Всем привет! Мы — команда из Питерской Вышки, и в этом году мы заняли первое место в RL треке соревнования NeurIPS 2020: Flatland. Цель Flatland — разработать ал...
Постановка задач для универсального интеллекта: у нас нет общего языка
#Машинноеобучение #Искусственныйинтеллект #ИИ #AI #reinforcementlearning #постановказадач IV
https://habr.com/ru/post/538522/
#Машинноеобучение #Искусственныйинтеллект #ИИ #AI #reinforcementlearning #постановказадач IV
https://habr.com/ru/post/538522/
t.me
Постановка задач для универсального интеллекта: у нас нет общего языка
Введение или о каком ИИ я говорюВ первую очередь меня интересует универсальный ИИ как машина достижения сложных целей. То есть некий программно-аппаратный компле...
[Перевод] Сэмплирование Томпсона
#БлогкомпанииДомКлик #Python #Машинноеобучение #ThompsonSampling #reinforcementlearning #обучениесподкреплением #python IV
https://habr.com/ru/post/547258/
#БлогкомпанииДомКлик #Python #Машинноеобучение #ThompsonSampling #reinforcementlearning #обучениесподкреплением #python IV
https://habr.com/ru/post/547258/
t.me
Сэмплирование Томпсона
Сэмплирование Томпсона — это один из самых сложных способов решения задачи «многорукого бандита».ЗадачаМаленький Робот потерялся в торговом центре. С помощью обу...
Brax — физический движок на GPU, заменяющий кластер CPU
#Машинноеобучение #физическийдвижок #обучениесподкреплением #reinforcementlearning IV
https://habr.com/ru/post/568234/
#Машинноеобучение #физическийдвижок #обучениесподкреплением #reinforcementlearning IV
https://habr.com/ru/post/568234/
t.me
Brax — физический движок на GPU, заменяющий кластер CPU
В обучении с подкреплением (Reinforcement Learning) одним из ограничивающих факторов является быстродействие физических симуляторов, на основе которых происходит...
Sample-efficient reinforcement learning: пытаемся воспроизвести обучение в воображении
#Машинноеобучение #Искусственныйинтеллект #искусственныйинтеллект #обучениесподкреплением #reinforcementlearning #машинноеобучение IV
https://habr.com/ru/post/568320/
#Машинноеобучение #Искусственныйинтеллект #искусственныйинтеллект #обучениесподкреплением #reinforcementlearning #машинноеобучение IV
https://habr.com/ru/post/568320/
t.me
Sample-efficient reinforcement learning: пытаемся воспроизвести обучение в воображении
Одна из крупных проблем обучения с подкреплением - это неэффективность по данным. Да, мы можем обучить нейросеть, которая будет играть в Пакмена лучше человека. Для этого ей потребуется сделать...
Обучение с подкреплением на Python: Пример не из «качалки»
#Python #Машинноеобучение #Разработкаробототехники #reinforcementlearning #reinforcementlearning #python #обучениесподкреплением IV
https://habr.com/ru/post/586474/
#Python #Машинноеобучение #Разработкаробототехники #reinforcementlearning #reinforcementlearning #python #обучениесподкреплением IV
https://habr.com/ru/post/586474/
t.me
Обучение с подкреплением на Python: Пример не из «качалки»
Постановка задачиОбучение с подкреплением молодая и бурно растущая дисциплина. Это обстоятельство привело к тому что информации об этом на русском языке почти нет. Особенно, если дело касается...
Захватывающая история о градиенте стратегии в RL
#Машинноеобучение #reinforcementlearning #math IV
https://habr.com/ru/post/699390/
#Машинноеобучение #reinforcementlearning #math IV
https://habr.com/ru/post/699390/
Хабр
Захватывающая история о градиенте стратегии в RL
Введение Статья написана под впечатлением и при поддержке "Большой математической мастерской", проходившей летом 2022 г. в Академгородке на базе НГУ. Теорема о градиенте стратегии является одним из...
Марковские цепи в обработке естественного языка и моделировании текстовых данных
#БлогкомпанииOTUS #марковскиецепи #обработкаестественногоязыка #моделированиетекстовыхданных #ReinforcementLearning #методмонтекарло IV
https://habr.com/ru/companies/otus/articles/746412/
#БлогкомпанииOTUS #марковскиецепи #обработкаестественногоязыка #моделированиетекстовыхданных #ReinforcementLearning #методмонтекарло IV
https://habr.com/ru/companies/otus/articles/746412/
Хабр
Марковские цепи в обработке естественного языка и моделировании текстовых данных
В последние десятилетия марковские цепи стали широко используемым инструментом в обработке естественного языка и моделировании текстовых данных. Они представляют собой вероятностную модель, которая...
Как я учил нейросеть играть в Rocket League
#Машинноеобучение #Игрыиигровыеконсоли #rocketleague #dqn #ppo #обучениесподкреплением #reinforcementlearning IV
https://habr.com/ru/articles/773454/
#Машинноеобучение #Игрыиигровыеконсоли #rocketleague #dqn #ppo #обучениесподкреплением #reinforcementlearning IV
https://habr.com/ru/articles/773454/
Хабр
Как я учил нейросеть играть в Rocket League
Rocket League - это соревновательная игра, в которой, управляя машинкой на футбольном поле, нужно забить мяч в ворота противника. Своеобразная интерпретация футбола на машинках. Звучит просто, но на...
[Перевод] Обучение с подкреплением: 10 вариантов применения
#БлогкомпанииOTUS #Машинноеобучение #reinforcementlearning #обучениесподкреплением IV
https://habr.com/ru/companies/otus/articles/775334/
#БлогкомпанииOTUS #Машинноеобучение #reinforcementlearning #обучениесподкреплением IV
https://habr.com/ru/companies/otus/articles/775334/
Хабр
Обучение с подкреплением: 10 вариантов применения
В системе обучения с подкреплением (Reinforcement Learning) агенты обучаются с помощью механизма вознаграждений и наказаний (или регресса). Агент получает вознаграждение за правильные действия и...
Многорукие бандиты в задаче ритейла
#БлогкомпанииX5Tech #Алгоритмы #Математика #Машинноеобучение #reinforcementlearning #ритейл #thompsonsampling IV
https://habr.com/ru/companies/X5Tech/articles/783390/
#БлогкомпанииX5Tech #Алгоритмы #Математика #Машинноеобучение #reinforcementlearning #ритейл #thompsonsampling IV
https://habr.com/ru/companies/X5Tech/articles/783390/
Хабр
Многорукие бандиты в задаче ритейла
Введение В настоящее время набирают популярность модели Reinforcement Learning для решения прикладных задач бизнеса. В этой статье мы рассмотрим подмножество этих моделей, а именно многоруких...
Научно-исследовательский кружок по ИИ в робототехнике для студентов и взрослых
#machinelearning #deeplearning #reinforcementlearning #кружокробототехники #искусственныйинтеллект #обучениесподкреплением #глубокоеобучение
https://habr.com/ru/companies/sberbank/articles/845824/
#machinelearning #deeplearning #reinforcementlearning #кружокробототехники #искусственныйинтеллект #обучениесподкреплением #глубокоеобучение
https://habr.com/ru/companies/sberbank/articles/845824/
Хабр
Научно-исследовательский кружок по ИИ в робототехнике для студентов и взрослых
Студенты ДГТУ обучают робота ползти вперед в Центре робототехники Сбера Мы открываем кружок, в котором вы можете заниматься современной робототехникой и искусственным интеллектом на самом передовом...
Мультимодальные приложения на Llama 3.2 и Llama Stack
#mlops #нейронныесети #reinforcementlearning #llama #llama3 #llm #nlp
https://habr.com/ru/articles/852168/
#mlops #нейронныесети #reinforcementlearning #llama #llama3 #llm #nlp
https://habr.com/ru/articles/852168/
Хабр
Мультимодальные приложения на Llama 3.2 и Llama Stack
Недавний релиз Llama 3.2 с мультимодальными версиями 11B и 90B открывает возможности для создания AI приложений, анализирующих визуальный ввод. Мультимодальные модели были и раньше, но это первая...
Как нейросети, RL и байесовскую оптимизацию стали использовать на ускорителях заряженных частиц
#машинноеобучение #нейросети #reinforcementlearning #байесовскаяоптимизация #оптимизацияэкспериментов #инновациивтехнологиях #научныеисследования
https://habr.com/ru/companies/ods/articles/868748/
#машинноеобучение #нейросети #reinforcementlearning #байесовскаяоптимизация #оптимизацияэкспериментов #инновациивтехнологиях #научныеисследования
https://habr.com/ru/companies/ods/articles/868748/
Хабр
Как нейросети, RL и байесовскую оптимизацию стали использовать на ускорителях заряженных частиц
Ускорители заряженных частиц — уникальные машины, играющие ключевую роль в фундаментальной науке и прикладных исследованиях. Они помогают заглянуть внутрь материи, создавать новые материалы и...
Контекстные бандиты в ценообразовании
#reinforcementlearning #machinelearning #neuralnetworks #multiarmedbandit
https://habr.com/ru/companies/X5Tech/articles/870012/
#reinforcementlearning #machinelearning #neuralnetworks #multiarmedbandit
https://habr.com/ru/companies/X5Tech/articles/870012/
Хабр
Контекстные бандиты в ценообразовании
Всем привет! На связи команда аналитиков X5 Tech. Мы продолжаем исследовать подходы Reinforcement Learning для ценообразования. В этой статье мы рассмотрим применение контекстных многоруких бандитов...