464 subscribers
478 photos
23 videos
36 files
947 links
Download Telegram
🤔4👎1
Forwarded from AbstractDL
Нашёл максимально компактный обзор всех RL-подходов (тык)
🤔1
tag yourself
👍1
Forwarded from AbstractDL
This media is not supported in your browser
VIEW IN TELEGRAM
SayCan: как заставить языковую модель принести тебе колу (by Google)

Идея довольно простая: нужно взять робота, который уже умеет выполнять примитивные команды (найти, поднять, положить и тд), а в качестве мозгов для планирования взять языковую модель (PaLM) со специальным step-by-step промптом:

«How would you {TASK}? I would 1. ..., 2, …»

Дальше допустимые команды для робота ранжируются по перплексии и классификатором успеха (обученным с помощью RL). Таким образом, получилось заставить робота решать довольно сложные и многоступенчатые задачи.

Статья, блог, GitHub