[Перевод] Оптимизация стратегии игры в Блэкджек методом Монте-Карло
#БлогкомпанииOTUSОнлайнобразование #Машинноеобучение #Искусственныйинтеллект #MachineLearning #ReinforcementLearning #AI #Blackjack IV
https://habr.com/ru/post/477042/
#БлогкомпанииOTUSОнлайнобразование #Машинноеобучение #Искусственныйинтеллект #MachineLearning #ReinforcementLearning #AI #Blackjack IV
https://habr.com/ru/post/477042/
t.me
Оптимизация стратегии игры в Блэкджек методом Монте-Карло
Перевод статьи подготовлен специально для студентов курса «Machine learning». Обучение с подкреплением штурмом взяло мир Искусственного Интеллекта. Начиная от...
ИИ, пытающийся избежать проблем, научился сложному поведению
#Искусственныйинтеллект #Обучениесподкреплением #ReinforcementLearning #искусственныйинтеллект #ИИ #нейронныесети IV
https://habr.com/ru/post/481484/
#Искусственныйинтеллект #Обучениесподкреплением #ReinforcementLearning #искусственныйинтеллект #ИИ #нейронныесети IV
https://habr.com/ru/post/481484/
t.me
ИИ, пытающийся избежать проблем, научился сложному поведению
В обучении с подкреплением (Reinforcement Learning) часто используется любопытство в качестве мотивации для ИИ. Заставляющее его искать новые ощущения и исследо...
Московский Центр Искусственного интеллекта Samsung в рассказах сотрудников
#БлогкомпанииSamsung #ОфисыITкомпаний #машинноеобучение #машинноетворчество #machinelearning #reinforcementlearning #компьютерноезрение IV
https://habr.com/ru/post/484376/
#БлогкомпанииSamsung #ОфисыITкомпаний #машинноеобучение #машинноетворчество #machinelearning #reinforcementlearning #компьютерноезрение IV
https://habr.com/ru/post/484376/
t.me
Московский Центр Искусственного интеллекта Samsung в рассказах сотрудников
Наш пост – это возможность узнать об исследованиях в новом подразделении Samsung Research – Центре Искусственного интеллекта (ИИ) в Москве. Он открылся в мае 201...
[Перевод] Deep Q Trading: объектно-ориентированный код на R
#DataMining #R #datamining #reinforcementlearning IV
https://habr.com/ru/post/496062/
#DataMining #R #datamining #reinforcementlearning IV
https://habr.com/ru/post/496062/
t.me
Deep Q Trading: объектно-ориентированный код на R
Привет! Это перевод еще одной моей статьи, посвященной обучению с подкреплением (reinforcement learning). Эту итерацию даже предложили запостить в блоге Веды а...
[Перевод] Что такое Emergent Communication и почему это нужно знать
#Машинноеобучение #Искусственныйинтеллект #обучениесподкреплением #обработкаестественногоязыка #искусственныйинтеллект #reinforcementlearning #naturallanguageprocessing IV
https://habr.com/ru/post/496830/
#Машинноеобучение #Искусственныйинтеллект #обучениесподкреплением #обработкаестественногоязыка #искусственныйинтеллект #reinforcementlearning #naturallanguageprocessing IV
https://habr.com/ru/post/496830/
t.me
Что такое Emergent Communication и почему это нужно знать
TL;DR: перевод поста Михаила Нуховича What is Emergent Communication and Why You Should Care: что это такое, зачем это нужно, какие есть точки зрения на задачу и...
[Перевод] Алгоритм MADDPG OpenAI
#БлогкомпанииOTUSОнлайнобразование #BigData #Математика #Машинноеобучение #ArtificialIntelligence #MachineLearning #ReinforcementLearning IV
https://habr.com/ru/post/508736/
#БлогкомпанииOTUSОнлайнобразование #BigData #Математика #Машинноеобучение #ArtificialIntelligence #MachineLearning #ReinforcementLearning IV
https://habr.com/ru/post/508736/
t.me
Алгоритм MADDPG OpenAI
Начинаем неделю с продолжения серии статей, подготовленных специально для базового и продвинутого курсов «Математика для Data Science». В конце статьи поделимс...
[Перевод] Модели мира. Могут ли агенты учиться в своем воображении?
#Искусственныйинтеллект #neuralnetworks #ai #reinforcementlearning IV
https://habr.com/ru/post/491128/
#Искусственныйинтеллект #neuralnetworks #ai #reinforcementlearning IV
https://habr.com/ru/post/491128/
t.me
Модели мира. Могут ли агенты учиться в своем воображении?
От переводчика: вопросы, поднятые в прошлой моей статье (видимо не слишком удачной) тем не менее вывели меня (огромное спасибо комраду Kilorad за ссылку!) на мат...
World Models — обучение в воображении
#Искусственныйинтеллект #reinforcementlearning #обучениесподкреплением #worldmodels IV
https://habr.com/ru/post/518804/
#Искусственныйинтеллект #reinforcementlearning #обучениесподкреплением #worldmodels IV
https://habr.com/ru/post/518804/
t.me
World Models — обучение в воображении
Обучение с подкреплением (Reinforcement Learning) плохо, а точнее, совсем не работает с высокими размерностями. А также сталкивается с проблемой, что физические...
Как мы управляли поездами на соревновании NeurIPS 2020: Flatland
#БлогкомпанииПитерскаяВышка #Машинноеобучение #УчебныйпроцессвIT #Транспорт #reinforcementlearning #обучениесподкреплением #machinelearning IV
https://habr.com/ru/post/537474/
#БлогкомпанииПитерскаяВышка #Машинноеобучение #УчебныйпроцессвIT #Транспорт #reinforcementlearning #обучениесподкреплением #machinelearning IV
https://habr.com/ru/post/537474/
t.me
Как мы управляли поездами на соревновании NeurIPS 2020: Flatland
Всем привет! Мы — команда из Питерской Вышки, и в этом году мы заняли первое место в RL треке соревнования NeurIPS 2020: Flatland. Цель Flatland — разработать ал...
Постановка задач для универсального интеллекта: у нас нет общего языка
#Машинноеобучение #Искусственныйинтеллект #ИИ #AI #reinforcementlearning #постановказадач IV
https://habr.com/ru/post/538522/
#Машинноеобучение #Искусственныйинтеллект #ИИ #AI #reinforcementlearning #постановказадач IV
https://habr.com/ru/post/538522/
t.me
Постановка задач для универсального интеллекта: у нас нет общего языка
Введение или о каком ИИ я говорюВ первую очередь меня интересует универсальный ИИ как машина достижения сложных целей. То есть некий программно-аппаратный компле...