Artificial Intelion | Новости ИИ

🙂Снова начинаем пост со слова Deep – но это последний раз, обещаем!

🔣 Все дело в том, что мы посмотрели полезное и познавательное видео Andrej Karpathy "Deep Dive into LLMs like ChatGPT". Автор - бывший сотрудник OpenAI и бывший директор Tesla по ИИ – на протяжении трех с половиной часов рассказывает, как работают LLM и главное, как нам с ними взаимодействовать.

*️⃣ Если по какой-то причине вы не можете выделить 3,5 часа, чтобы прокачаться в ML, то вот основной тайминг, можно включиться на той теме, которая вам ближе:

00:07:47 – токенизация;
00:20:11 – внутреннее устройство нейросети;
00:31:09 – GPT-2: обучение и вывод;
00:42:52 – Llama 3.1;
00:59:23 – от предварительной подготовки к постобучению;
01:20:32 – галлюцинации и память;
02:01:11 – почему модели испытывают трудности с орфографией;
02:07:28 – контролируемая тонкая настройка на обучение с подкреплением;
02:27:47 – DeepSeek-R1;
02:42:07 – AlphaGo;
02:48:26 – RLHF;
03:09:39 – просмотр будущих событий;
03:18:34 – где найти LLM;
03:21:46 – выводы.
#AI #LLM #DeepLearning

🙂

Artificial Intelion

Please open Telegram to view this post

VIEW IN TELEGRAM

YouTube

Deep Dive into LLMs like ChatGPT

This is a general audience deep dive into the Large Language Model (LLM) AI technology that powers ChatGPT and related products. It is covers the full training stack of how the models are developed, along with mental models of how to think about their "psychology"…

👍3🔥3👌2

1.08K views15:10

About

Blog

Apps

Platform