Анализ данных (Data analysis)

Forwarded from AI VK Hub

Рекомендательные системы — один из ключевых механизмов, на которых держатся современные продукты. Они помогают пользователям находить контент, товары и сервисы, а бизнесу — повышать вовлеченность и качество пользовательского опыта. Вместе с Владимиром Байкаловым, ведущим исследователем AI VK, разбираем главные тренды в рекомендациях и последние значимые работы.

🔗

Список статей

Масштабирование
🟣Действия говорят громче слов: последовательные преобразователи с триллионом параметров для генеративных рекомендаций
🟣Масштабирование трансформеров для рекомендательных систем до одного миллиарда параметров
🟣LLaTTE: законы масштабирования для многоэтапного моделирования последовательностей в крупномасштабных рекламных рекомендательных системах

Lifelong Recommendations
🟣TransAct V2: моделирование последовательностей действий пользователя на протяжении всей жизни в рекомендациях Pinterest
🟣TWIN V2: расширение моделирования ультра‑длинных последовательностей поведения пользователя для улучшения CTR‑предсказания в Kuaishou
🟣LONGER: повышение эффективности моделирования длинных последовательностей в промышленных рекомендательных системах
🟣Укрощение ультра-длинных последовательностей пользовательского поведения в генеративных рекомендациях на уровне сессий

Generative Retrieval
🟣Память трансформера как дифференцируемый поисковый индекс
🟣Рекомендательные системы с генеративным поиском
🟣Sparse Meets Dense: унифицированные генеративные рекомендации с каскадными разреженно-плотными представлениями

Semantic IDs
🟣Повышение стабильности эмбеддингов в рекомендательных системах с помощью Semantic ID
🟣ActionPiece: контекстная токенизация последовательностей действий для генеративных рекомендаций
🟣Обучаемая токенизация объектов для генеративных рекомендаций
🟣Semantic ID переменной длины для рекомендательных систем

End to End Рекомендации
🟣OneRec: объединение retrieval и ranking в генеративной рекомендательной модели с итеративным выравниванием предпочтений
🟣OxygenREC: генеративный фреймворк, следующий инструкциям, для рекомендаций в электронной коммерции
🟣EGA: унифицированный end-to-end генеративный фреймворк для промышленных рекламных систем

LLMxRecSys
🟣PLUM: адаптация предварительно обученных языковых моделей для генеративных рекомендаций промышленного масштаба
🟣OneRec‑Think: рассуждение в тексте для генеративной рекомендации
🟣ReaSeq: использование мировых знаний через рассуждение для последовательного моделирования

#aivk #recsys

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤5👍2🐳2

2.77K views13:00

Анализ данных (Data analysis)

🚀 Tencent выкатывает Covo-Audio (7B) - новый уровень голосовых AI.

Это уже не просто “распознал → ответил → озвучил”.

Модель умеет говорить и слушать одновременно.

Что внутри:
• Qwen2.5-7B + Whisper
• 8 млн часов аудио обучения
• full-duplex — диалог без пауз

Главное отличие:

Нет отдельных пайплайнов ASR и TTS.
→ всё работает как единая модель

Что это даёт:
• можно перебивать (barge-in)
• естественный разговор, как с человеком
• меньше задержек
• меньше костылей в архитектуре

Отдельно:

Разделение интеллекта и голоса
→ проще делать voice cloning
→ гибкость под разные сценарии

Тренд очевиден:

AI переходит от “голосовых интерфейсов”
→ к полноценному живому диалогу

Скоро кнопка “нажми и говори” исчезнет совсем.

Модель: https://huggingface.co/tencent/Covo-Audio-Chat

👍11❤8🔥4

4.3K views14:34

Анализ данных (Data analysis)

Здесь говорят о том, как работать с данными в 2026 году

↗️

Узнайте на GoCloud 2026

9 апреля в Москве пройдет GoCloud 2026 – большая конференция про ИИ и облака от команды Cloud.ru.

Отдельный трек будет посвящен данным и аналитике: доклады о технологических трендах, простых инструментах и экономически эффективном управлении данными.

Вы узнаете:

▶️какие подходы к работе с данными станут стандартом в 2026 году
▶️как управлять разными-дата сервисами на одной платформе
▶️как быстро обрабатывать real-time данные
▶️почему ML-системы начинаются не с моделей, а с дата-инфраструктуры
▶️какие возможности дает интеграция ИИ и Spark

А еще вас ждут демо сервисов, практические воркшопы, нетворкинг и афтерпати.

👉

Успейте зарегистрироваться

👈

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥5🥱4❤2👍1

4.22K views16:04

Анализ данных (Data analysis)

0:13

This media is not supported in your browser

VIEW IN TELEGRAM

Кожаные вообще оборзели

😁23🤣8

4.75K views18:30

Анализ данных (Data analysis)

🚨 У ANTHROPIC утечка: Новая мощная МОДЕЛЬ

Anthropic случайно оставила черновики блог-постов в публично доступном кэше данных. Их нашли исследователи кибербезопасности:

- новая модель под названием "Claude Mythos"
- также упоминается как "Capybara"
- это новый уровень моделей
- больше и умнее, чем Opus

Anthropic подтвердила, что это не фейк:

- «качественный скачок»
- «самая мощная модель, которую мы когда-либо создавали»
- «значительно лучше в программировании, логике и кибербезопасности»
- «сильно опережает любые другие AI-модели в кибер-возможностях»

И они сами этим обеспокоены:

- «Модель предвещает волну ИИ, способных находить и эксплуатировать уязвимости гораздо быстрее, чем защитники успевают реагировать»

https://m1astra-mythos.pages.dev/

🐍 полезные ресурсы 🚀Max

@data_analysis_ml

❤13🔥7👍4😁2

5.01K viewsedited 06:28

Анализ данных (Data analysis)

Forwarded from Bogatyrev Aleksei

Как я стал дата инженером с ЗП 800к

Без удачи и связей

5 лет назад я работал в техподдержке с графиком 2/2 и жестко бухал

💀

После очередной пьянки я понял, что надо что-то менять. Я решил стать дата инженером

Составил резюме на коленке. Чудом получил свою первую работу с зп 50к в месяц 😎

Отработал 4 месяца и захотел больше. Ну и погнал дальше: собесы, отказы, новые офферы

В прошлом году я пробил 800к рублей за один месяц

Я выгорал, увольнялся, снова загорался и опять шел на собесы

Задумался над своими ошибками...

Как можно избежать их? Снял на эту тему видео, в котором рассказал:

- мой путь из техподдержки до техлида с зп 800к
- какие ошибки я совершил и как их обойти
- как выглядит типичный день ДЕ

Это разбор реального пути: как с нуля дойти до первой работы дата инженером с хорошей зарплатой.

Без булшита по типу "вкатись в ДЕ за месяц" 😏

👉 Смотри видео в закрепе моего канала

Please open Telegram to view this post

VIEW IN TELEGRAM

🤣57🥱21🥴5🌚4❤2😁2🤯2🌭1

4.04K views12:04

Анализ данных (Data analysis)

📌 Большой мастер-класс по Claude Code!

Перед вами репозиторий с полноценным визуальным и практическим гайдом по одному из самых мощных инструментов для разработчиков.

Что внутри:

• Пошаговое обучение - от базовых команд (/init, /plan) до продвинутых вещей вроде MCP, хуков и агентов
Осваивается за ~11–13 часов

• Большая библиотека кастомных команд под реальные задачи

• Готовые шаблоны памяти - как для одиночной работы, так и для команд

• Инструкции и скрипты для:
- автокод-ревью
- проверки стиля и стандартов
- генерации API-документации

• Автоматизация через циклы
Можно настроить Claude так, чтобы он работал автономно без вашего участия

• Подключение внешних инструментов
GitHub, API и другие сервисы - всё разложено по шагам

• Объяснения через схемы и диаграммы
Подойдёт даже тем, кто только начинает

• Примеры настройки узкоспециализированных субагентов

• Отдельные скрипты под обучение
Например, генерация книг и материалов для быстрого освоения любой темы

https://github.com/luongnv89/claude-howto

Please open Telegram to view this post

VIEW IN TELEGRAM

👍10🔥6❤3😁1

4.61K views13:12

Анализ данных (Data analysis)

😁39🤣21🥰3👍1🔥1

4.3K views15:00

Анализ данных (Data analysis)

84-летний сенатор США записал интервью с AI-агентом - и ролик за сутки собрал 2.8 млн просмотров.

Разговор с Claude от Anthropic был про данные и приватность. Главная мысль - раньше у государств просто не хватало людей, чтобы следить за всеми. С появлением AI это ограничение исчезает: алгоритмы находят паттерны, данные доступны, масштаб становится практически безлимитным.

Реакция на видео ожидаемо разделилась. Одни считают, что наконец об этом говорят на большую аудиторию. Другие, что это уже похоже на «удобного собеседника», который отвечает так, как нужно.

https://www.youtube.com/watch?v=h3AtWdeu_G0

🐍 полезные ресурсы 🚀Max

@data_analysis_ml

❤10🥱4👍3😁3😐2🔥1

4.27K views05:31

Анализ данных (Data analysis)

🤩35🤣22👍13❤6💯1

4.35K views07:15

Анализ данных (Data analysis)

Claude набирает платных подписчиков быстрее, чем когда-либо - их число более чем удвоилось менее чем за 6 месяцев.

Данные по банковским картам показывают рекордный приток новых пользователей и возврат старых в январе-феврале.

Рост подогрели реклама на Super Bowl, конфликт с Минобороны США из-за отказа использовать ИИ в боевых задачах, а также запуск Claude Code и Computer Use.

В этом году число платных подписок выросло более чем вдвое, хотя ChatGPT по-прежнему остаётся лидером по общей аудитории.

https://x.com/TechCrunch/status/2037897062705197352

❤13👍5🥰5

4.06K views07:00

Анализ данных (Data analysis)

⚡️

Claude Code на максималках: 32 агента, скорость в 5 раз выше, ноль новых инструментов

Нашли интересный open source проект oh-my-claudecode. Это надстройка, которая превращает Claude Code в мультиагентную систему с разными режимами выполнения.

Есть полный автопилот, есть режим с параллельными агентами, есть последовательные пайплайны и даже режим экономии токенов. Внутри 32 агента под разные задачи от архитектуры до тестирования.

Самое удобное это управление через ключевые слова. Пишешь autopilot и он делает все сам. Пишешь ralph и он не остановится, пока не доведет задачу до конца.

Еще одна важная вещь это авто-возобновление после ограничений по запросам. Не нужно следить за процессом и перезапускать вручную.

По ощущениям это уже не просто ассистент, а полноценная система разработки поверх Claude Code.

GitHub: https://github.com/Yeachan-Heo/oh-my-claudecode

🐍 полезные ресурсы 🚀Max

@data_analysis_ml

Please open Telegram to view this post

VIEW IN TELEGRAM

👍18❤6🔥5🤨2😁1

4.14K views06:55

Анализ данных (Data analysis)

🦞 Как правильно работать с Claude Code

Репозиторий claude-code-best-practice уже собрал десятки тысяч звёзд и это не просто набор советов. Это системный подход к тому, как превратить Claude из “помощника” в часть разработки.

Главная мысль простая: не проси написать код, а выстраивай процесс.

Начинается всё с планирования. Claude должен сначала продумать решение и обязательно иметь способ проверить себя. Хорошая практика - заставить его задать тебе уточняющие вопросы через AskUserQuestion, чтобы он не гадал, а уточнял требования как нормальный разработчик.

Работа делится на этапы, и у каждого этапа есть свои тесты. Это сильно снижает количество ошибок. Параллельно можно вести несколько задач через Git Worktrees, а долгие процессы выносить в /loop, чтобы они крутились сами.

Интересный момент - код-ревью лучше делать в новом контексте. Свежий “взгляд” модели часто находит баги, которые пропустила сама же ранее. Ещё сильнее это усиливается, если подключить вторую модель, например прогнать план и реализацию через Codex.

Контекст вообще становится ключевой вещью. CLAUDE.md не должен разрастаться - примерно до 150–200 строк на файл, иначе модель начинает теряться. Вместо огромных инструкций лучше использовать команды и навыки, а не бесконечные промпты.

Отдельно важно разделять роли. Не делать одного универсального агента “на всё”, а создавать небольших специализированных с конкретными задачами. Но при этом не усложнять: для простых задач обычный Claude Code без сложных схем работает лучше.

Из практики - если застрял, проще показать скриншот, чем пытаться объяснить словами. А если подключить MCP, можно дать Claude доступ к логам браузера и сильно упростить отладку. Терминал тоже лучше запускать как фоновые задачи, чтобы не блокировать процесс.

Всё это сводится к одному: Claude начинает работать нормально только тогда, когда у него есть структура, ограничения и ответственность.

И в итоге меняется сам подход к разработке. Ты не пишешь код руками и не просишь “сгенерируй функцию”. Ты управляешь системой, которая пишет его за тебя.

https://github.com/shanraisshan/claude-code-best-practice

❤13👍8🔥3

3.1K views11:10

Анализ данных (Data analysis)

0:12

This media is not supported in your browser

VIEW IN TELEGRAM

🌟 Transformers.js v4 вышел и теперь нейросети реально можно запускать прямо в браузере

Без серверов, без API, без костылей. Просто открываешь страницу и модель уже работает у пользователя на устройстве.

Главное изменение в том, что WebML наконец перестал быть игрушкой. Производительность выросла, задержки снизились, и часть задач теперь можно спокойно уносить на клиент.

Что это даёт на практике

Фронтенд начинает забирать кусок AI на себя
Меньше расходов на инфру и запросы к API
Лучше приватность, данные не уходят на сервер
Можно делать офлайн-фичи с ИИ прямо в браузере

Если коротко, браузер превращается в полноценную AI-платформу. И это только начало.

Blog post: https://huggingface.co/blog/transformersjs-v4
Release notes: https://github.com/huggingface/transformers.js/releases/tag/4.0.0
Demos: https://huggingface.co/collections/webml-community/transformersjs-v4-demos

👍13🔥9❤6🥴1

3.41K views14:25

About

Blog

Apps

Platform