Data Secrets – Telegram

Data Secrets

78.8K subscribers

6.42K photos

667 videos

20 files

2.71K links

Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN

Download Telegram

About

Blog

Apps

Platform

78.8K subscribers

Он просто пытается научить людей бинпоиску…

😁102👍11🔥10

7.6K views09:30

This media is not supported in your browser

VIEW IN TELEGRAM

Визуальное объяснение того, как работают нейросети

Некто Jared Wilber выкатил веб-страницу, на которой объясняет, как устроены нейросети. Получилось и не слишком сложно, но и не очень популярно, ведь без математической составялющей алгоритм все равно до конца не понять.

Особенно радует динамическая визуализация и приятная структура. Страницу интересно и полезно почитать, даже если вы уже неплохо разбираетесь в теме, или если наоборот, не разбираетесь совсем.

Короче, кайф. Советуем!

🔥63👍11❤4🤩1

8.9K views11:22

This media is not supported in your browser

VIEW IN TELEGRAM

Ну с таким набором уже мидл 🥴

👍56😁33❤5🤔2⚡1

7.93K views15:29

Stability AI лишилась генерального директора и нескольких создателей Stable Diffusion

Эмад Мостак (уже exCEO) заявил, что покидает свой пост и совет директоров, чтобы децентрализировать ИИ.

Настало время работать над тем, чтобы ИИ оставался открытым и децентрализованным

— заявил он.

👍43🔥8❤7😨4

7.11K views06:09

Зацените, как люди любят визуализацию: нашли в Твиттере аналитика Ewa Tuteja, которая сама связала датавиз и пометила пост прикольным тегом #DressYourHouseInData

❤59👍9🔥8🤪7😁3🗿1

7.49K views09:54

Материалы Nvidia про RAG – один из главных трендов ИИ в этом году:

– Совсем свежее введение в RAG со всеми необходимыми деталями о том, зачем это нужно, как это устроено и что может.

– Бесплатный курс Augment your LLM Using Retrieval Augmented Generation. Уже более глубокое объяснение устройства механизма.

– Building RAG Agents with LLMs. 8 часов лекций про векторные базы данных, микросервисы, LangChain и ИИ-агентов. Тоже бесплатно.

А если не понимаешь, про какой такой RAG все говорят, то начни с нашей статьи.

🔥32👍10✍3

9.51K views11:52

Москва. Страшно. Бесконечно соболезнуем всем, кого коснулся этот ужас.

Все средства с сегодняшней рекламы в нашем канале пошли на помощь.

Берегите близких 🕯️

👍178🕊103❤49😁11🔥5🙈2

8.22K views15:03

Mistral выложили на HF новую модель Mistral 7B v0.2 Base Model

- контекстное окно в 32k токенов вместо 8k
- Rope Theta = 1e6 (параметр «новизны» в ответах модели)
- Убрали sliding window, так что новая модель лучше воспринимает глубокие связи в длинном тексте

Уже доступно в transformers

👍44🔥13❤6🤩4⚡1👏1

8.41K views06:34

The Little Book of Deep Learning by François Fleuret

Франсуа Флере — профессор компьютерных наук в Женевском университете, Швейцария. Недавно он выпустил интересную мини-книжку с последовательными заметками по глубокому обучению.

Здесь кратко и содержательно рассматриваются многие важные темы: Backpropagation, дропауты, нормализации, функции активации, слои внимания и тд. Откройте оглавление – и увидите сами.

При этом эта малютка подойдет даже новичкам: в начале автор раскрывает базовые понятия, и даже рассказывает про GPU и тензоры. А в третьей граве найдете заметки по основным задачам глубокого обучения: Text-image, детекция, генерация текстов и изображений, RL.

И все это изложено всего на 150 страницах с картинками. Вот бесплатная версия, адаптированная под чтение на телефоне. Советуем!

👍45🔥11❤9

10.2K viewsedited 11:10

Чего действительно ждут в индустрии от ML-щика? С этим вопросом нам удалось обратиться к эксперту — Андрею Кузнецову, ML директору в OK, с которым нам повезло оказаться на AI-тусовке от AI Talent Hub в солнечном Вьетнаме. И вот что он думает на этот счет:

Для успешного внедрения моделей МЛ в производственной среде необходим надежный подход, известный как MLops, а для работы с LLM придумали новую аббревиатуру LLMops. Вот список ключевых инструментов, которые помогут вам оптимизировать жизненный цикл ваших моделей ML, от создания прототипов до развертывания и мониторинга:

- векторные базы (Milvus, qdrant etc)
- системы отслеживания экспериментов и версионирования моделей (mlflow)
- оркестраторы (Airflow)
- платформы инференса (triton, vLLM)
- инструменты версионирования данных (DVC)
- инструменты для работы с BigData
- инструменты CI/CD (TeamCity)
- инструменты мониторинга и дашборды (Grafana, SuperSet)
- инструменты прототипирования интерфейсов (Gradio, Streamlit)
- контейнерные оркестраторы (Kubernetes + Docker)
- LLM specific frameworks (Llamaindex, Langchain).

Кстати, у его команды есть канал @mlvok, где они регулярно разбирают на открытых ридинг-клабах текущий SOTA в рекомендательных системах, MLops и Big Data. Советуем почитать.

👍31🤯10❤9🔥6

18.1K views16:00

Media is too big

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

Media is too big

VIEW IN TELEGRAM

Недавно OpenAI начали выдавать доступы к SORA людям из арт-сообщества (художникам, режиссерам и др). Получился очень мудрый маркетинговый ход: креаторы не только дали фидбэк по модели, но и нагенерили целые арт-хаусы и мини-драмы, которые уже разлетелись по сети.

Наше любимое – первое. Ну а история с человеком-шаром вообще тянет на оскар.

❤46🔥27👏5👾3

8.18K views06:14

В 5 абзацах объяснить один из главных методов обработки пайплайнов с биг-датой? Да пожалуйста. Broadcast Join – к вашему вниманию.

🎉30👍15🔥8🤯2

6.98K views09:13

This media is not supported in your browser

VIEW IN TELEGRAM

В Google презентовали VideoPrism: базовую модель для "понимая" видео

Удивительно, но факт: в эпоху SORA универсальный энкодер для видео (ViFM), который справляется с широким спектром задач, долго оставался голубой мечтой. Однако теперь Google превратили это в реальность.

VideoPrism умеет почти все: описывать видео, искать или локализовать объекты, классифицировать, отвечать на вопросы. Обучена модель на 36 миллионах video-text пар и 582 миллионах видео с субтитрами.

Под капотом – вижн трансформер (ViT), который обучается в два этапа: сначала с триплет-лоссами, чтобы научить сеточку сопоставлять видео подходящее описание; а затем на masked роликах, заставляя модель "дополнять" пропущенные участки (все, как дедушка BERT завещал). Получается, что исследователи как бы учат модель понимать и семантику видео, и динамику кадра.

И работает это классно: на 30 из 33 бенчмарков выбивает SOTA. Теперь исследователи планируют прикрутить сюда LLM. Ждем и надеемся, что такие наработки приведут к чему-то фееричному (еще одна SORA?)...

👍37🔥10❤9

7.36K views12:38

Forwarded from XOR

Привет! На связи команда XOR. Совсем скоро мы готовим для вас большое обновление нашего любимого тиндера для программистов – CodeMates. И в этом нам нужна ваша помощь.

Мы ищем HR-специалистов, которые готовы пройти короткий кастдев. С вас – ответить на несколько небольших вопросов. С нас – приятная плюшка.

Чтобы поучаствовать, просто напиши @v2r8n и в двух предложениях расскажи про свой HR-опыт.

Кстати, в

уже более 7 тысяч пользователей, если еще не пробовал – самое время

😏

Please open Telegram to view this post

VIEW IN TELEGRAM

👍7❤6🔥6

6.18K views14:53

В каких еще областях нас планирует удивить OpenAI?

На днях компания подала заявку на регистрацию товарного знака для цифрового голосового помощника и голосового движка. Технология охватит распознавание речи, ее генерацию, и, возможно, генерацию других звуковых выходов.

Siri и Alexa тихо закурили в сторонке

❤27🔥10👍7

6.86K views06:23

Социальный опрос. Расскажите, что для вас – идеальная карьера в ML?

Anonymous Poll

Работать на топ-должности в бигтехе в России

Трудиться в FAANG

Собственный успешный ML-стратап

Заниматься участием в хакатонах и соревнованиях и зарабатывать на этом

Другое (напишу в комментариях)

🔥24🤨6❤4😁2👍1🤔1👻1

1.35K voters6.86K views09:38

Миниатюра: у тебя есть GPU, но нет нормальных данных 🤡

Please open Telegram to view this post

VIEW IN TELEGRAM

😁176😨14👍8🙈7❤6

7.6K views11:29