00:07:47 – токенизация;
00:20:11 – внутреннее устройство нейросети;
00:31:09 – GPT-2: обучение и вывод;
00:42:52 – Llama 3.1;
00:59:23 – от предварительной подготовки к постобучению;
01:20:32 – галлюцинации и память;
02:01:11 – почему модели испытывают трудности с орфографией;
02:07:28 – контролируемая тонкая настройка на обучение с подкреплением;
02:27:47 – DeepSeek-R1;
02:42:07 – AlphaGo;
02:48:26 – RLHF;
03:09:39 – просмотр будущих событий;
03:18:34 – где найти LLM;
03:21:46 – выводы.
#AI #LLM #DeepLearning
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube
Deep Dive into LLMs like ChatGPT
This is a general audience deep dive into the Large Language Model (LLM) AI technology that powers ChatGPT and related products. It is covers the full training stack of how the models are developed, along with mental models of how to think about their "psychology"…
👍3🔥3👌2