State of GPT
Вчера Microsoft выложили доклад от Андрея Карпатого про тренировку ChatGPT. Рассказано отлично: и про токенизацию, и про претрейн, и про RLHF. Советуем!
Доклад вот тут
😻 #news
Вчера Microsoft выложили доклад от Андрея Карпатого про тренировку ChatGPT. Рассказано отлично: и про токенизацию, и про претрейн, и про RLHF. Советуем!
Доклад вот тут
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥26😨4🙈2
Что такое DWH
Часто этот термин трактуют неправильно, вот мы и решили расставить точки над и. Data Warehouse – это не БД, а система управления данными, предназначенная для Бизнес-аналитики (BI).
😻 #analytics
Часто этот термин трактуют неправильно, вот мы и решили расставить точки над и. Data Warehouse – это не БД, а система управления данными, предназначенная для Бизнес-аналитики (BI).
Please open Telegram to view this post
VIEW IN TELEGRAM
👍22
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍25❤6
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍35🔥15⚡3
Data Secrets
Адаптивный подбор размера шага в градиентном спуске Мы с вами уже раскладывали по полочкам базовый градиентный спуск. И конечно, исследователи нашли тысячу и один способ улучшить этот алгоритм. Например, многие сразу задались вопросом: как подбирать размер…
Метод моментов и ADAM
В прошлый раз мы говорили о том, как решить проблему динамического подбора шага в градиентном спуске. Следующая претензия к этому алгоритму: мы не учитываем то, что было на предыдущих шагах. А ведь там может храниться что-то полезное, правда? Для этого придумали метод инерции.
Ну а если объединить адаптивный подбор шага и метод инерции, то получится state of the art: ADAM.
😻 #train #math
В прошлый раз мы говорили о том, как решить проблему динамического подбора шага в градиентном спуске. Следующая претензия к этому алгоритму: мы не учитываем то, что было на предыдущих шагах. А ведь там может храниться что-то полезное, правда? Для этого придумали метод инерции.
Ну а если объединить адаптивный подбор шага и метод инерции, то получится state of the art: ADAM.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥15❤8👍8❤🔥1