Знает ли LLM то, что знаешь ты?
#почитать
Представьте, что у вас есть друг, который идеально завершает ваши мысли. Вы говорите: «В детстве я любил...», а он тут же продолжает: «...играть в футбол и смотреть „Смешариков“». Совпадение? Или он вас слишком хорошо знает?
Теперь представьте, что этот «друг» — языковая модель вроде GPT-4, обученная на десятках терабайт текста. Вы даёте ей фразу — и она точно угадывает продолжение. Вопрос: она действительно видела это раньше или просто хорошо обучена угадывать?
Вот тут на сцену выходит Membership Inference Attack (MIA) — метод, который позволяет выяснить, был ли конкретный текст в тренировочном датасете модели. По сути, это способ заставить LLM проговориться: «Да, я это читала. Но никому не говори».
Раньше такие атаки были возможны только при доступе к логитам — вероятностям слов, которые модель «придумывает» на выходе. Но популярные модели вроде ChatGPT или Claude таких данных не раскрывают — вы получаете только текст.
Можно ли вытащить приватные данные, видя только текст, без логитов и без доступа к модели?
Спойлер: да, можно. И способ называется PETAL.
⏱ Читать статью
#почитать
Представьте, что у вас есть друг, который идеально завершает ваши мысли. Вы говорите: «В детстве я любил...», а он тут же продолжает: «...играть в футбол и смотреть „Смешариков“». Совпадение? Или он вас слишком хорошо знает?
Теперь представьте, что этот «друг» — языковая модель вроде GPT-4, обученная на десятках терабайт текста. Вы даёте ей фразу — и она точно угадывает продолжение. Вопрос: она действительно видела это раньше или просто хорошо обучена угадывать?
Вот тут на сцену выходит Membership Inference Attack (MIA) — метод, который позволяет выяснить, был ли конкретный текст в тренировочном датасете модели. По сути, это способ заставить LLM проговориться: «Да, я это читала. Но никому не говори».
Раньше такие атаки были возможны только при доступе к логитам — вероятностям слов, которые модель «придумывает» на выходе. Но популярные модели вроде ChatGPT или Claude таких данных не раскрывают — вы получаете только текст.
Можно ли вытащить приватные данные, видя только текст, без логитов и без доступа к модели?
Спойлер: да, можно. И способ называется PETAL.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥1
Как мы разработали гибкий пайплайн для прогноза временных рядов любых метрик
#почитать
я работаю в группе аналитики ключевых показателей в бизнес‑группе Поиска и рекламных технологий. В течение нескольких лет нам приходилось прогнозировать большое количество временных рядов разных доменных областей: от поисковой доли Яндекса до DAU определённых сервисов. Чтобы успешно справляться с этой задачей, мы вместе с коллегами разработали собственный прогнозный фреймворк. В этой статье я расскажу, как создать универсальный и гибкий пайплайн для прогнозирования. Под катом рассмотрим:
— правильно выстроенную иерархию данных;
— методы консистентного предсказания абсолютных и относительных метрик;
— частые проблемы моделей и то, как мы их фиксили;
— а также все важные этапы, о которых нельзя забывать, когда работаешь с временными рядами.
⏱ Читать статью
#почитать
я работаю в группе аналитики ключевых показателей в бизнес‑группе Поиска и рекламных технологий. В течение нескольких лет нам приходилось прогнозировать большое количество временных рядов разных доменных областей: от поисковой доли Яндекса до DAU определённых сервисов. Чтобы успешно справляться с этой задачей, мы вместе с коллегами разработали собственный прогнозный фреймворк. В этой статье я расскажу, как создать универсальный и гибкий пайплайн для прогнозирования. Под катом рассмотрим:
— правильно выстроенную иерархию данных;
— методы консистентного предсказания абсолютных и относительных метрик;
— частые проблемы моделей и то, как мы их фиксили;
— а также все важные этапы, о которых нельзя забывать, когда работаешь с временными рядами.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5👍1
Почему Python стал языком нейросетей и как это работает на практике
#почитать
Python давно перестал быть просто «языком скриптов» и уверенно вышел в лидеры среди инструментов для нейросетей. Его синтаксис понятен «с первого взгляда», а мощные библиотеки позволяют сосредоточиться на идее, а не на рутине. Сегодня, от первых численных расчётов в NumPy до сложных моделей в TensorFlow и PyTorch, всё строится вокруг привычного Python-кода.
⏱ Читать статью
#почитать
Python давно перестал быть просто «языком скриптов» и уверенно вышел в лидеры среди инструментов для нейросетей. Его синтаксис понятен «с первого взгляда», а мощные библиотеки позволяют сосредоточиться на идее, а не на рутине. Сегодня, от первых численных расчётов в NumPy до сложных моделей в TensorFlow и PyTorch, всё строится вокруг привычного Python-кода.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5👍1
Запустили векторный поиск в YDB: рассказываем, как он работает
#почитать
В новой версии YDB теперь доступны две версии векторного поиска — точный и приближённый. Приближённый поиск может работать с миллиардами векторов, если использовать векторный индекс. Такая технология есть у небольшого количества технологических компаний в мире.
⏱ Читать статью
#почитать
В новой версии YDB теперь доступны две версии векторного поиска — точный и приближённый. Приближённый поиск может работать с миллиардами векторов, если использовать векторный индекс. Такая технология есть у небольшого количества технологических компаний в мире.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5
Llama 3.1 и «Гарри Поттер»: сколько текста действительно запоминает ИИ?
#почитать
Может ли искусственный интеллект запомнить целую книгу? А если да, что это значит для авторов, издателей и самих разработчиков ИИ? Недавнее исследование от ученых из Стэнфорда, Корнелла и Университета Западной Виргинии показало, что языковая модель Llama 3.1 может дословно воспроизвести до 42% текста «Гарри Поттера и Философского камня». Это заставляет усомниться в механизмах ограничения памяти ИИ и поднимает вопросы о защите авторских прав. Дальше — как раз об этом.
⏱ Читать статью
#почитать
Может ли искусственный интеллект запомнить целую книгу? А если да, что это значит для авторов, издателей и самих разработчиков ИИ? Недавнее исследование от ученых из Стэнфорда, Корнелла и Университета Западной Виргинии показало, что языковая модель Llama 3.1 может дословно воспроизвести до 42% текста «Гарри Поттера и Философского камня». Это заставляет усомниться в механизмах ограничения памяти ИИ и поднимает вопросы о защите авторских прав. Дальше — как раз об этом.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5
Кросс-валидация на временных рядах: как не перемешать время
#почитать
Сегодня рассмотрим то, что чаще всего ломает даже круто выглядящие модели при работе с временными рядами — неправильная кросс‑валидация. Разберем, почему KFold тут не работает, как легко словить утечку будущего, какие сплиттеры реально честны по отношению ко времени, как валидировать фичи с лагами и агрегатами.
⏱ Читать статью
#почитать
Сегодня рассмотрим то, что чаще всего ломает даже круто выглядящие модели при работе с временными рядами — неправильная кросс‑валидация. Разберем, почему KFold тут не работает, как легко словить утечку будущего, какие сплиттеры реально честны по отношению ко времени, как валидировать фичи с лагами и агрегатами.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5
Что делает shuffle=True и как не сломать порядок
#почитать
Под «перемешать» подразумевается применение псевдо‑рандомного пермутационного алгоритма (обычно Fisher‑Yates) к индексам выборки до того, как мы режем её на train/test. Цель — заставить train‑и-test быть независимыми и одинаково распределёнными (i.i.d.). В scikit‑learn эта логика зашита в параметр shuffle почти всех сплиттеров. В train_test_split он True по умолчанию, что прямо сказано в документации — «shuffle bool, default=True».
⏱ Читать статью
#почитать
Под «перемешать» подразумевается применение псевдо‑рандомного пермутационного алгоритма (обычно Fisher‑Yates) к индексам выборки до того, как мы режем её на train/test. Цель — заставить train‑и-test быть независимыми и одинаково распределёнными (i.i.d.). В scikit‑learn эта логика зашита в параметр shuffle почти всех сплиттеров. В train_test_split он True по умолчанию, что прямо сказано в документации — «shuffle bool, default=True».
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
Опыт построения антифрод-системы на основе поведенческого анализа
#почитать
Проект по разработке системы антифрода для букмекерской конторы стал для нашей команды важным шагом в обеспечении честности игры на платформе. Основной целью было создание системы, которая бы эффективно боролась с манипуляциями, связанными с арбитражем ставок и использованием вилочных событий для обхода системы. В данной статье я расскажу о технической реализации антифрод-системы на основе поведенческого анализа.
⏱ Читать статью
#почитать
Проект по разработке системы антифрода для букмекерской конторы стал для нашей команды важным шагом в обеспечении честности игры на платформе. Основной целью было создание системы, которая бы эффективно боролась с манипуляциями, связанными с арбитражем ставок и использованием вилочных событий для обхода системы. В данной статье я расскажу о технической реализации антифрод-системы на основе поведенческого анализа.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5
Как Cursor устроен изнутри
#почитать
Работа с кодом: транзакции с низкой задержкой. Для фичей, связанных с кодом (дополнения по tab'у, индексация, пересчет хеш-деревьев), рабочая нагрузка представляет собой череду чтений и записи. Задержка для этих операций должна быть как можно ниже. Изначально Cursor использовал Pinecone для семантической индексации и поиска, но затем перешел на Turbopuffer.
⏱ Читать статью
#почитать
Работа с кодом: транзакции с низкой задержкой. Для фичей, связанных с кодом (дополнения по tab'у, индексация, пересчет хеш-деревьев), рабочая нагрузка представляет собой череду чтений и записи. Задержка для этих операций должна быть как можно ниже. Изначально Cursor использовал Pinecone для семантической индексации и поиска, но затем перешел на Turbopuffer.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5
Как построить хороший пайплайн разработки ML-модели
#почитать
Получать предсказуемые результаты при обучении моделей, легко увеличивать объемы данных и адаптировать к процессам новых членов команды — для этого нужны четкая структура, последовательность действий и набор инструментов. То есть, хороший пайплайн разработки. Разбираемся, из чего он состоит и как его построить.
⏱ Читать статью
#почитать
Получать предсказуемые результаты при обучении моделей, легко увеличивать объемы данных и адаптировать к процессам новых членов команды — для этого нужны четкая структура, последовательность действий и набор инструментов. То есть, хороший пайплайн разработки. Разбираемся, из чего он состоит и как его построить.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
Что Google Translate может рассказать нам о вайб-кодинге
#почитать
В последнее время часто звучат мрачные прогнозы (и даже скрытая реклама) о том, что крупные языковые модели (LLM) уничтожат программирование как профессию. Многие обсуждения лишены нюансов, поэтому я хотел бы внести свои пояснения. С одной стороны звучат заявления вроде: «Я использовал $LLM_SERVICE_PROVIDER, чтобы создать маленькую временную программу, и скоро все программисты останутся без работы за $ARBITRARY_TIME_WINDOW». С другой – категорический отказ признавать какую-либо пользу таких инструментов. Думаю, лучше всего прояснить эту ситуацию можно на примере другой отрасли, где подобные технологии появились раньше: перевод.
⏱ Читать статью
#почитать
В последнее время часто звучат мрачные прогнозы (и даже скрытая реклама) о том, что крупные языковые модели (LLM) уничтожат программирование как профессию. Многие обсуждения лишены нюансов, поэтому я хотел бы внести свои пояснения. С одной стороны звучат заявления вроде: «Я использовал $LLM_SERVICE_PROVIDER, чтобы создать маленькую временную программу, и скоро все программисты останутся без работы за $ARBITRARY_TIME_WINDOW». С другой – категорический отказ признавать какую-либо пользу таких инструментов. Думаю, лучше всего прояснить эту ситуацию можно на примере другой отрасли, где подобные технологии появились раньше: перевод.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍1👌1
Когда O(n) мешает отбирать резюме в Росатоме
#почитать
Женатые и замужние — в топе: пока вы не уходите глубоко в анализ, этот быстрый фактор повышает ранг. Чем точнее ваша модель, тем меньше его вес.
Английский — плохо: знание английского почему-то работало как антипаттерн, снижая релевантность.
ОГУРЕЦ: кто-то зачем-то написал это слово в резюме. Оно попало в словарь модели и получило большой вес.
Иксель — люди пишут Excel как угодно, и само слово в правильном написании оказалось снижающим оценку.
К резюме может быть приложено много мусора. Самый эпичный пример: авиабилет Москва — Челябинск вместо резюме.
⏱ Читать статью
#почитать
Женатые и замужние — в топе: пока вы не уходите глубоко в анализ, этот быстрый фактор повышает ранг. Чем точнее ваша модель, тем меньше его вес.
Английский — плохо: знание английского почему-то работало как антипаттерн, снижая релевантность.
ОГУРЕЦ: кто-то зачем-то написал это слово в резюме. Оно попало в словарь модели и получило большой вес.
Иксель — люди пишут Excel как угодно, и само слово в правильном написании оказалось снижающим оценку.
К резюме может быть приложено много мусора. Самый эпичный пример: авиабилет Москва — Челябинск вместо резюме.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥1
Как устроено глубокое обучение нейросетей
#почитать
Глубокое обучение - Способ обучения моделей на большом количестве данных, используя множество слоёв. Каждый слой сети обрабатывает информацию, "взвешивая" её при помощи параметров (весов и смещений), оставляя признаки или отбрасывая, посредством функций активации. Обучение происходит через итеративную (повторяющуюся) корректировку весов: сначала вычисляются градиенты ошибки с помощью обратного распространения (backpropagation), а затем веса обновляются при помощи оптимизаторов (SGD, Adam и др.).
Эта статья не ответит на все вопросы, но мы пробежимся по всем основам глубокого машинного обучения, что бы создать примерную начальную картину без сильного углубления в детали.
⏱ Читать статью
#почитать
Глубокое обучение - Способ обучения моделей на большом количестве данных, используя множество слоёв. Каждый слой сети обрабатывает информацию, "взвешивая" её при помощи параметров (весов и смещений), оставляя признаки или отбрасывая, посредством функций активации. Обучение происходит через итеративную (повторяющуюся) корректировку весов: сначала вычисляются градиенты ошибки с помощью обратного распространения (backpropagation), а затем веса обновляются при помощи оптимизаторов (SGD, Adam и др.).
Эта статья не ответит на все вопросы, но мы пробежимся по всем основам глубокого машинного обучения, что бы создать примерную начальную картину без сильного углубления в детали.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥1👌1
Почему для обучения нейросетей используют именно видеокарты
#почитать
Начнем с того, что центральный процессор и графический процессор фундаментально отличаются по своей архитектуре и предназначению. CPU разрабатывались как универсальные вычислительные устройства, предназначенные для последовательной обработки данных с высокой тактовой частотой и сложной логикой ветвления.
В отличие от CPU, графические процессоры были рассчитаны на рендеринг изображений, который по своей природе требует параллельной обработки большого количества пикселей. Эта особенность и определила ключевую архитектурную черту GPU — наличие тысяч относительно простых вычислительных ядер вместо нескольких сложных, как у CPU.
⏱ Читать статью
#почитать
Начнем с того, что центральный процессор и графический процессор фундаментально отличаются по своей архитектуре и предназначению. CPU разрабатывались как универсальные вычислительные устройства, предназначенные для последовательной обработки данных с высокой тактовой частотой и сложной логикой ветвления.
В отличие от CPU, графические процессоры были рассчитаны на рендеринг изображений, который по своей природе требует параллельной обработки большого количества пикселей. Эта особенность и определила ключевую архитектурную черту GPU — наличие тысяч относительно простых вычислительных ядер вместо нескольких сложных, как у CPU.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥1👌1
Структурированная генерация в LLM
#почитать
⏱ Читать статью
#почитать
сегодня я расскажу про такое направление в LLM, как структурированная генерация.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥1👌1
Что у меня за распределение
#почитать
Нужно уметь переводить эту нагрузку в количество людей на линии. Для этого мы реализовали симулятор колл-центра. Для работы симулятора нужно понимать, как распределены те или иные случайные величины, и иметь численные характеристики соответствия наблюдаемых значений теоретическим распределениям. Это называется задачей (критериями) согласия: к какому теоретическому распределению вероятностей принадлежит данная выборка.
«Используй Колмогорова — Смирнова, да и все тут», — скажут мне. В принципе, да, но нет. Мы пойдем чуть дальше и попытаемся разобраться, как все устроено и какие есть ограничения. Расскажу, почему нельзя просто так применять критерии согласия, к каким это приводит ошибкам и как с этим быть.
⏱ Читать статью
#почитать
Нужно уметь переводить эту нагрузку в количество людей на линии. Для этого мы реализовали симулятор колл-центра. Для работы симулятора нужно понимать, как распределены те или иные случайные величины, и иметь численные характеристики соответствия наблюдаемых значений теоретическим распределениям. Это называется задачей (критериями) согласия: к какому теоретическому распределению вероятностей принадлежит данная выборка.
«Используй Колмогорова — Смирнова, да и все тут», — скажут мне. В принципе, да, но нет. Мы пойдем чуть дальше и попытаемся разобраться, как все устроено и какие есть ограничения. Расскажу, почему нельзя просто так применять критерии согласия, к каким это приводит ошибкам и как с этим быть.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥1👌1
Forwarded from джоброкет 🚀 вакансии в IT
This media is not supported in your browser
VIEW IN TELEGRAM
🪐 Новые вакансии AI/ML
🚀 ML engineer / Python Developer в Wisebits, до 400 000 ₽
Подробнее➡️
https://jobrocket.ru/ru/job/ml-engineer-python-developer-wisebits-94cefda2
🚀 ML разработчик (Python / Computer Vision) в Система AI видеоаналитики, oт 350 000 ₽
Подробнее➡️
https://jobrocket.ru/ru/job/ml-razrabotchik-python-computer-vision-sistema-ai-videoanalitiki-e434fec6
🚀 ML Engineer в Kolesa group, 200 000 - 300 000 ₽
Подробнее➡️
https://jobrocket.ru/ru/job/ml-engineer-kolesa-group-7f755111
🚀 AI-инженер в Green Wave Palace, до 240 000 ₽
Подробнее➡️
https://jobrocket.ru/ru/job/ai-inzhener-green-wave-palace-45fd8dc5
🚀 Tech Lead в AI-стартап, oт 580 000 ₽
Подробнее➡️
https://jobrocket.ru/ru/job/tech-lead-nda-ai-startap-435bdb0d
🚀 ML Engineer в HealthTech, 150 000 - 300 000 ₽
Подробнее➡️
https://jobrocket.ru/ru/job/ml-engineer-nda-healthtech-dee3a37d
🚀 ML Engineer в Vital Partners, до 450 000 ₽
Подробнее➡️
https://jobrocket.ru/ru/job/ml-engineer-vital-partners-c474323b
🚀 Product Manager (AI / Travel), oт 250 000 ₽
Подробнее➡️
https://jobrocket.ru/ru/job/product-manager-ai-travel-nda-travel-b7597e3c
🚀 Data Scientist в Крупная ритейл компания, 270 000 - 300 000 ₽
Подробнее➡️
https://jobrocket.ru/ru/job/data-scientist-krupnaya-ritejl-kompaniya-9f03c6c8
🚀 Нейрокреатор, oт 50 000 ₽
Подробнее➡️
https://jobrocket.ru/ru/job/nejrokreator-nejrokreator-14e28203
Больше AI-вакансий здесь⤵️
https://jobrocket.ru/ru?page=1&categories=aiml
🚀 ML engineer / Python Developer в Wisebits, до 400 000 ₽
Подробнее
https://jobrocket.ru/ru/job/ml-engineer-python-developer-wisebits-94cefda2
🚀 ML разработчик (Python / Computer Vision) в Система AI видеоаналитики, oт 350 000 ₽
Подробнее
https://jobrocket.ru/ru/job/ml-razrabotchik-python-computer-vision-sistema-ai-videoanalitiki-e434fec6
🚀 ML Engineer в Kolesa group, 200 000 - 300 000 ₽
Подробнее
https://jobrocket.ru/ru/job/ml-engineer-kolesa-group-7f755111
🚀 AI-инженер в Green Wave Palace, до 240 000 ₽
Подробнее
https://jobrocket.ru/ru/job/ai-inzhener-green-wave-palace-45fd8dc5
🚀 Tech Lead в AI-стартап, oт 580 000 ₽
Подробнее
https://jobrocket.ru/ru/job/tech-lead-nda-ai-startap-435bdb0d
🚀 ML Engineer в HealthTech, 150 000 - 300 000 ₽
Подробнее
https://jobrocket.ru/ru/job/ml-engineer-nda-healthtech-dee3a37d
🚀 ML Engineer в Vital Partners, до 450 000 ₽
Подробнее
https://jobrocket.ru/ru/job/ml-engineer-vital-partners-c474323b
🚀 Product Manager (AI / Travel), oт 250 000 ₽
Подробнее
https://jobrocket.ru/ru/job/product-manager-ai-travel-nda-travel-b7597e3c
🚀 Data Scientist в Крупная ритейл компания, 270 000 - 300 000 ₽
Подробнее
https://jobrocket.ru/ru/job/data-scientist-krupnaya-ritejl-kompaniya-9f03c6c8
🚀 Нейрокреатор, oт 50 000 ₽
Подробнее
https://jobrocket.ru/ru/job/nejrokreator-nejrokreator-14e28203
Больше AI-вакансий здесь
https://jobrocket.ru/ru?page=1&categories=aiml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥1👌1
fit() для новичков
#почитать
Эта статья для тех, кто только-только погружается в машинное обучение и ещё не до конца понимает, что скрывается за интересным вызовом model.fit(). Вы, возможно, уже настраивали ноутбуки, пробовали разные датасеты и, может, даже словили пару неожиданных ошибок — и это нормально.
⏱ Читать статью
#почитать
Эта статья для тех, кто только-только погружается в машинное обучение и ещё не до конца понимает, что скрывается за интересным вызовом model.fit(). Вы, возможно, уже настраивали ноутбуки, пробовали разные датасеты и, может, даже словили пару неожиданных ошибок — и это нормально.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥1😁1
Геометрия ландшафта потерь и «понимание» нейросети
#почитать
Когда нейросеть обучается, ее функция потерь образует сложный ландшафт в пространстве параметров – с вершинами (области высокой ошибки) и долинами (области низкой ошибки). Свойства этого ландшафта – его кривизна, форма минимальных долин, спектр матрицы Гессе и пр. – могут многое рассказать о том, насколько модель усвоила закономерности данных. Идея состоит в том, что не все минимумы одинаковы: одни могут быть «плоскими» (широкими и неглубокими), другие «острыми» (узкими и крутыми). Считается, что геометрия такого минимума связана с тем, как хорошо модель обобщает знания за пределы обучающих примеров и насколько «осмысленно» (семантически обоснованно) она их усвоила. В данном обзоре мы рассмотрим, как характеристики ландшафта потерь служат индикаторами обобщающей способности, интерпретируемости, адаптивности модели и ее чувствительности к семантике данных, а также какие количественные метрики предложены для измерения этих свойств.
⏱ Читать статью
#почитать
Когда нейросеть обучается, ее функция потерь образует сложный ландшафт в пространстве параметров – с вершинами (области высокой ошибки) и долинами (области низкой ошибки). Свойства этого ландшафта – его кривизна, форма минимальных долин, спектр матрицы Гессе и пр. – могут многое рассказать о том, насколько модель усвоила закономерности данных. Идея состоит в том, что не все минимумы одинаковы: одни могут быть «плоскими» (широкими и неглубокими), другие «острыми» (узкими и крутыми). Считается, что геометрия такого минимума связана с тем, как хорошо модель обобщает знания за пределы обучающих примеров и насколько «осмысленно» (семантически обоснованно) она их усвоила. В данном обзоре мы рассмотрим, как характеристики ландшафта потерь служат индикаторами обобщающей способности, интерпретируемости, адаптивности модели и ее чувствительности к семантике данных, а также какие количественные метрики предложены для измерения этих свойств.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍1👌1
Что бы я сделал, если бы сегодня начинал учить Data Science / ML
#почитать
⏱ Читать статью
#почитать
Эта статья — не очередной «гайд по ML для новичков». Это мой личный взгляд на то, как бы я подошёл к обучению, если бы начинал с нуля уже сегодня, учитывая свой опыт работы в крупных компаниях, проваленные проекты, ошибки и победы.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥1👌1
Станьте Deep Learning Engineer с дипломом 👍
Голосовые помощники, распознавание лиц, рекомендации в приложениях, медицинская диагностика — нейросети используются уже во всех сферах бизнеса. Компании ищут DL-специалистов, чтобы точнее обучать и настраивать нейросети под свои запросы.
Освоить Deep Learning самостоятельно сложно, но ребята из Simulative нашли решение, где учёба становится понятной и структурированной, а все темы разбираются на практике 🔥
Simulative запускает программу профессиональной переподготовки «Инженер глубокого обучения нейросетей».
По итогам обучения вы получите:
Официальный диплом о профессиональной переподготовке с квалификацией «Специалист по большим данным».
Более 40 практических работ в формате симуляции реальной работы DL-инженера — всё пойдёт в портфолио.
Учитесь из любой точки мира, совмещая с работой, а доступ к материалам останется навсегда.
Курс подходит для специалистов любого уровня: новичок, аналитик, ML-инженер или выпускник — на программе опытные менторы помогут выстроить вашу персональную траекторию роста в Deep Learning.
Что вы освоите:
🟠 Создание и обучение нейросетей с нуля
🟠 Компьютерное зрение (Computer Vision)
🟠 NLP (обработка текста)
🟠 Генеративные модели
🟠 MLOps и продакшн-подход
🕖 Старт обучения — 12 марта, количество мест на поток ограничено
Бронируйте место на курсе прямо сейчас и получите скидку 30%
😶 ПОЛУЧИТЬ СКИДКУ НА КУРС
Голосовые помощники, распознавание лиц, рекомендации в приложениях, медицинская диагностика — нейросети используются уже во всех сферах бизнеса. Компании ищут DL-специалистов, чтобы точнее обучать и настраивать нейросети под свои запросы.
Освоить Deep Learning самостоятельно сложно, но ребята из Simulative нашли решение, где учёба становится понятной и структурированной, а все темы разбираются на практике 🔥
Simulative запускает программу профессиональной переподготовки «Инженер глубокого обучения нейросетей».
По итогам обучения вы получите:
🎓 Диплом гособразца
Официальный диплом о профессиональной переподготовке с квалификацией «Специалист по большим данным».
💯 Практика
Более 40 практических работ в формате симуляции реальной работы DL-инженера — всё пойдёт в портфолио.
🙌🏽 Онлайн обучение
Учитесь из любой точки мира, совмещая с работой, а доступ к материалам останется навсегда.
Курс подходит для специалистов любого уровня: новичок, аналитик, ML-инженер или выпускник — на программе опытные менторы помогут выстроить вашу персональную траекторию роста в Deep Learning.
Что вы освоите:
🕖 Старт обучения — 12 марта, количество мест на поток ограничено
Бронируйте место на курсе прямо сейчас и получите скидку 30%
Please open Telegram to view this post
VIEW IN TELEGRAM
🙏5🤓2👍1