Habr.com

[Перевод] Оптимизация стратегии игры в Блэкджек методом Монте-Карло

#БлогкомпанииOTUSОнлайнобразование #Машинноеобучение #Искусственныйинтеллект #MachineLearning #ReinforcementLearning #AI #Blackjack IV

https://habr.com/ru/post/477042/

t.me

Оптимизация стратегии игры в Блэкджек методом Монте-Карло

Перевод статьи подготовлен специально для студентов курса «Machine learning». Обучение с подкреплением штурмом взяло мир Искусственного Интеллекта. Начиная от...

23 views20:15

Habr.com

ИИ, пытающийся избежать проблем, научился сложному поведению

#Искусственныйинтеллект #Обучениесподкреплением #ReinforcementLearning #искусственныйинтеллект #ИИ #нейронныесети IV

https://habr.com/ru/post/481484/

t.me

ИИ, пытающийся избежать проблем, научился сложному поведению

В обучении с подкреплением (Reinforcement Learning) часто используется любопытство в качестве мотивации для ИИ. Заставляющее его искать новые ощущения и исследо...

25 views22:15

Habr.com

Московский Центр Искусственного интеллекта Samsung в рассказах сотрудников

#БлогкомпанииSamsung #ОфисыITкомпаний #машинноеобучение #машинноетворчество #machinelearning #reinforcementlearning #компьютерноезрение IV

https://habr.com/ru/post/484376/

t.me

Московский Центр Искусственного интеллекта Samsung в рассказах сотрудников

Наш пост – это возможность узнать об исследованиях в новом подразделении Samsung Research – Центре Искусственного интеллекта (ИИ) в Москве. Он открылся в мае 201...

16 views12:15

Habr.com

[Перевод] Deep Q Trading: объектно-ориентированный код на R

#DataMining #R #datamining #reinforcementlearning IV

https://habr.com/ru/post/496062/

t.me

Deep Q Trading: объектно-ориентированный код на R

Привет! Это перевод еще одной моей статьи, посвященной обучению с подкреплением (reinforcement learning). Эту итерацию даже предложили запостить в блоге Веды а...

11 views15:15

Habr.com

[Перевод] Что такое Emergent Communication и почему это нужно знать

#Машинноеобучение #Искусственныйинтеллект #обучениесподкреплением #обработкаестественногоязыка #искусственныйинтеллект #reinforcementlearning #naturallanguageprocessing IV

https://habr.com/ru/post/496830/

t.me

Что такое Emergent Communication и почему это нужно знать

TL;DR: перевод поста Михаила Нуховича What is Emergent Communication and Why You Should Care: что это такое, зачем это нужно, какие есть точки зрения на задачу и...

16 views07:15

Habr.com

[Перевод] Алгоритм MADDPG OpenAI

#БлогкомпанииOTUSОнлайнобразование #BigData #Математика #Машинноеобучение #ArtificialIntelligence #MachineLearning #ReinforcementLearning IV

https://habr.com/ru/post/508736/

t.me

Алгоритм MADDPG OpenAI

Начинаем неделю с продолжения серии статей, подготовленных специально для базового и продвинутого курсов «Математика для Data Science». В конце статьи поделимс...

10 views03:30

Habr.com

[Перевод] Модели мира. Могут ли агенты учиться в своем воображении?

#Искусственныйинтеллект #neuralnetworks #ai #reinforcementlearning IV

https://habr.com/ru/post/491128/

t.me

Модели мира. Могут ли агенты учиться в своем воображении?

От переводчика: вопросы, поднятые в прошлой моей статье (видимо не слишком удачной) тем не менее вывели меня (огромное спасибо комраду Kilorad за ссылку!) на мат...

16 views20:15

Habr.com

World Models — обучение в воображении

#Искусственныйинтеллект #reinforcementlearning #обучениесподкреплением #worldmodels IV

https://habr.com/ru/post/518804/

t.me

World Models — обучение в воображении

Обучение с подкреплением (Reinforcement Learning) плохо, а точнее, совсем не работает с высокими размерностями. А также сталкивается с проблемой, что физические...

18 views08:45

Habr.com

Как мы управляли поездами на соревновании NeurIPS 2020: Flatland

#БлогкомпанииПитерскаяВышка #Машинноеобучение #УчебныйпроцессвIT #Транспорт #reinforcementlearning #обучениесподкреплением #machinelearning IV

https://habr.com/ru/post/537474/

t.me

Как мы управляли поездами на соревновании NeurIPS 2020: Flatland

Всем привет! Мы — команда из Питерской Вышки, и в этом году мы заняли первое место в RL треке соревнования NeurIPS 2020: Flatland. Цель Flatland — разработать ал...

17 views06:45

Habr.com

Постановка задач для универсального интеллекта: у нас нет общего языка

#Машинноеобучение #Искусственныйинтеллект #ИИ #AI #reinforcementlearning #постановказадач IV

https://habr.com/ru/post/538522/

t.me

Постановка задач для универсального интеллекта: у нас нет общего языка

Введение или о каком ИИ я говорюВ первую очередь меня интересует универсальный ИИ как машина достижения сложных целей. То есть некий программно-аппаратный компле...

28 views10:30

Habr.com

[Перевод] Сэмплирование Томпсона

#БлогкомпанииДомКлик #Python #Машинноеобучение #ThompsonSampling #reinforcementlearning #обучениесподкреплением #python IV

https://habr.com/ru/post/547258/

t.me

Сэмплирование Томпсона

Сэмплирование Томпсона — это один из самых сложных способов решения задачи «многорукого бандита».ЗадачаМаленький Робот потерялся в торговом центре. С помощью обу...

17 views10:30

Habr.com

Brax — физический движок на GPU, заменяющий кластер CPU

#Машинноеобучение #физическийдвижок #обучениесподкреплением #reinforcementlearning IV

https://habr.com/ru/post/568234/

t.me

Brax — физический движок на GPU, заменяющий кластер CPU

В обучении с подкреплением (Reinforcement Learning) одним из ограничивающих факторов является быстродействие физических симуляторов, на основе которых происходит...

27 views20:15

Habr.com

Sample-efficient reinforcement learning: пытаемся воспроизвести обучение в воображении

#Машинноеобучение #Искусственныйинтеллект #искусственныйинтеллект #обучениесподкреплением #reinforcementlearning #машинноеобучение IV

https://habr.com/ru/post/568320/

t.me

Sample-efficient reinforcement learning: пытаемся воспроизвести обучение в воображении

Одна из крупных проблем обучения с подкреплением - это неэффективность по данным. Да, мы можем обучить нейросеть, которая будет играть в Пакмена лучше человека. Для этого ей потребуется сделать...

30 views19:30

Habr.com

Обучение с подкреплением на Python: Пример не из «качалки»

#Python #Машинноеобучение #Разработкаробототехники #reinforcementlearning #reinforcementlearning #python #обучениесподкреплением IV

https://habr.com/ru/post/586474/

t.me

Обучение с подкреплением на Python: Пример не из «качалки»

Постановка задачиОбучение с подкреплением молодая и бурно растущая дисциплина. Это обстоятельство привело к тому что информации об этом на русском языке почти нет. Особенно, если дело касается...

31 views14:45

Habr.com

Захватывающая история о градиенте стратегии в RL

#Машинноеобучение #reinforcementlearning #math IV

https://habr.com/ru/post/699390/

Хабр

Захватывающая история о градиенте стратегии в RL

Введение Статья написана под впечатлением и при поддержке "Большой математической мастерской", проходившей летом 2022 г. в Академгородке на базе НГУ. Теорема о градиенте стратегии является одним из...

40 views17:45

About

Blog

Apps

Platform