Data Secrets
78.8K subscribers
6.42K photos
667 videos
20 files
2.71K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Он просто пытается научить людей бинпоиску…
😁102👍11🔥10
This media is not supported in your browser
VIEW IN TELEGRAM
Визуальное объяснение того, как работают нейросети

Некто Jared Wilber выкатил веб-страницу, на которой объясняет, как устроены нейросети. Получилось и не слишком сложно, но и не очень популярно, ведь без математической составялющей алгоритм все равно до конца не понять.

Особенно радует динамическая визуализация и приятная структура. Страницу интересно и полезно почитать, даже если вы уже неплохо разбираетесь в теме, или если наоборот, не разбираетесь совсем.

Короче, кайф. Советуем!
🔥63👍114🤩1
This media is not supported in your browser
VIEW IN TELEGRAM
Ну с таким набором уже мидл 🥴
👍56😁335🤔21
Stability AI лишилась генерального директора и нескольких создателей Stable Diffusion

Эмад Мостак (уже exCEO) заявил, что покидает свой пост и совет директоров, чтобы децентрализировать ИИ.

Настало время работать над тем, чтобы ИИ оставался открытым и децентрализованным

— заявил он.
👍43🔥87😨4
Зацените, как люди любят визуализацию: нашли в Твиттере аналитика Ewa Tuteja, которая сама связала датавиз и пометила пост прикольным тегом #DressYourHouseInData
59👍9🔥8🤪7😁3🗿1
Материалы Nvidia про RAG – один из главных трендов ИИ в этом году:

– Совсем свежее введение в RAG со всеми необходимыми деталями о том, зачем это нужно, как это устроено и что может.

– Бесплатный курс Augment your LLM Using Retrieval Augmented Generation. Уже более глубокое объяснение устройства механизма.

Building RAG Agents with LLMs. 8 часов лекций про векторные базы данных, микросервисы, LangChain и ИИ-агентов. Тоже бесплатно.

А если не понимаешь, про какой такой RAG все говорят, то начни с нашей статьи.
🔥32👍103
Москва. Страшно. Бесконечно соболезнуем всем, кого коснулся этот ужас.

Все средства с сегодняшней рекламы в нашем канале пошли на помощь.

Берегите близких 🕯️
👍178🕊10349😁11🔥5🙈2
Mistral выложили на HF новую модель Mistral 7B v0.2 Base Model

- контекстное окно в 32k токенов вместо 8k
- Rope Theta = 1e6 (параметр «новизны» в ответах модели)
- Убрали sliding window, так что новая модель лучше воспринимает глубокие связи в длинном тексте

Уже доступно в transformers
👍44🔥136🤩41👏1
The Little Book of Deep Learning by François Fleuret

Франсуа Флере — профессор компьютерных наук в Женевском университете, Швейцария. Недавно он выпустил интересную мини-книжку с последовательными заметками по глубокому обучению.

Здесь кратко и содержательно рассматриваются многие важные темы: Backpropagation, дропауты, нормализации, функции активации, слои внимания и тд. Откройте оглавление – и увидите сами.

При этом эта малютка подойдет даже новичкам: в начале автор раскрывает базовые понятия, и даже рассказывает про GPU и тензоры. А в третьей граве найдете заметки по основным задачам глубокого обучения: Text-image, детекция, генерация текстов и изображений, RL.

И все это изложено всего на 150 страницах с картинками. Вот бесплатная версия, адаптированная под чтение на телефоне. Советуем!
👍45🔥119
Чего действительно ждут в индустрии от ML-щика? С этим вопросом нам удалось обратиться к эксперту — Андрею Кузнецову, ML директору в OK, с которым нам повезло оказаться на AI-тусовке от AI Talent Hub в солнечном Вьетнаме. И вот что он думает на этот счет:

Для успешного внедрения моделей МЛ в производственной среде необходим надежный подход, известный как MLops, а для работы с LLM придумали новую аббревиатуру LLMops. Вот список ключевых инструментов, которые помогут вам оптимизировать жизненный цикл ваших моделей ML, от создания прототипов до развертывания и мониторинга:

- векторные базы (Milvus, qdrant etc)
- системы отслеживания экспериментов и версионирования моделей (mlflow)
- оркестраторы (Airflow)
- платформы инференса (triton, vLLM)
- инструменты версионирования данных (DVC)
- инструменты для работы с BigData
- инструменты CI/CD (TeamCity)
- инструменты мониторинга и дашборды (Grafana, SuperSet)
- инструменты прототипирования интерфейсов (Gradio, Streamlit)
- контейнерные оркестраторы (Kubernetes + Docker)
- LLM specific frameworks (Llamaindex, Langchain).

Кстати, у его команды есть канал @mlvok, где они регулярно разбирают на открытых ридинг-клабах текущий SOTA в рекомендательных системах, MLops и Big Data. Советуем почитать.
👍31🤯109🔥6
Недавно OpenAI начали выдавать доступы к SORA людям из арт-сообщества (художникам, режиссерам и др). Получился очень мудрый маркетинговый ход: креаторы не только дали фидбэк по модели, но и нагенерили целые арт-хаусы и мини-драмы, которые уже разлетелись по сети.

Наше любимое – первое. Ну а история с человеком-шаром вообще тянет на оскар.
46🔥27👏5👾3
В 5 абзацах объяснить один из главных методов обработки пайплайнов с биг-датой? Да пожалуйста. Broadcast Join – к вашему вниманию.
🎉30👍15🔥8🤯2
This media is not supported in your browser
VIEW IN TELEGRAM
В Google презентовали VideoPrism: базовую модель для "понимая" видео

Удивительно, но факт: в эпоху SORA универсальный энкодер для видео (ViFM), который справляется с широким спектром задач, долго оставался голубой мечтой. Однако теперь Google превратили это в реальность.

VideoPrism умеет почти все: описывать видео, искать или локализовать объекты, классифицировать, отвечать на вопросы. Обучена модель на 36 миллионах video-text пар и 582 миллионах видео с субтитрами.

Под капотом – вижн трансформер (ViT), который обучается в два этапа: сначала с триплет-лоссами, чтобы научить сеточку сопоставлять видео подходящее описание; а затем на masked роликах, заставляя модель "дополнять" пропущенные участки (все, как дедушка BERT завещал). Получается, что исследователи как бы учат модель понимать и семантику видео, и динамику кадра.

И работает это классно: на 30 из 33 бенчмарков выбивает SOTA. Теперь исследователи планируют прикрутить сюда LLM. Ждем и надеемся, что такие наработки приведут к чему-то фееричному (еще одна SORA?)...
👍37🔥109
Forwarded from XOR
Привет! На связи команда XOR. Совсем скоро мы готовим для вас большое обновление нашего любимого тиндера для программистовCodeMates. И в этом нам нужна ваша помощь.

Мы ищем HR-специалистов, которые готовы пройти короткий кастдев. С вас – ответить на несколько небольших вопросов. С нас – приятная плюшка.

Чтобы поучаствовать, просто напиши @v2r8n и в двух предложениях расскажи про свой HR-опыт.

Кстати, в CodeMates уже более 7 тысяч пользователей, если еще не пробовал – самое время 😏
Please open Telegram to view this post
VIEW IN TELEGRAM
👍76🔥6
В каких еще областях нас планирует удивить OpenAI?

На днях компания подала заявку на регистрацию товарного знака для цифрового голосового помощника и голосового движка. Технология охватит распознавание речи, ее генерацию, и, возможно, генерацию других звуковых выходов.

Siri и Alexa тихо закурили в сторонке
27🔥10👍7
Миниатюра: у тебя есть GPU, но нет нормальных данных 🤡
Please open Telegram to view this post
VIEW IN TELEGRAM
😁176😨14👍8🙈76