This media is not supported in your browser
VIEW IN TELEGRAM
Как сделать RAG в 32 раза более эффективным по памяти 😨
Существует простая техника, широко используемая в индустрии, которая делает RAG примерно в 32 раза более эффективным по памяти.
Perplexity использует её в своём поисковом индексе. Azure в своём поисковом пайплайне. HubSpot в своём AI-ассистенте
Чтобы в этом разобраться, вот гайд, где ты построишь RAG-систему, которая выполняет запросы к 36M+ векторам за <30 мс.
И техника, которая это обеспечит, называется бинарная квантизация.
Существует простая техника, широко используемая в индустрии, которая делает RAG примерно в 32 раза более эффективным по памяти.
Perplexity использует её в своём поисковом индексе. Azure в своём поисковом пайплайне. HubSpot в своём AI-ассистенте
Чтобы в этом разобраться, вот гайд, где ты построишь RAG-систему, которая выполняет запросы к 36M+ векторам за <30 мс.
И техника, которая это обеспечит, называется бинарная квантизация.
Please open Telegram to view this post
VIEW IN TELEGRAM
1
Claude не разрешено записывать файлы вне рабочего пространства.
Но он захотел это сделать.
Поэтому Claude написал Python-скрипт и выполнил его через bash, чтобы изменить файл, по сути обойдя мои ограничения доступа.👋
Но он захотел это сделать.
Поэтому Claude написал Python-скрипт и выполнил его через bash, чтобы изменить файл, по сути обойдя мои ограничения доступа.
Please open Telegram to view this post
VIEW IN TELEGRAM
Дружеское напоминание: у Google есть официальное приложение для запуска Gemma 4 прямо на телефоне.
- 100% open-source
- Полностью офлайн и приватно
- Мультимодальность: текст / аудио / изображения
- Работает с Gemma E4B и E2B
И приложение доступно как на iOS, так и на Android.
Шаги и загрузка ниже:
1. Скачайте Google AI Gallery
- App Store
- Google Play
Исходный код доступен здесь: https://github.com/google-ai-edge/gallery
2. Выберите режим и модель
У вас есть несколько вариантов:
» Agent Skills
» AI Chat
» Ask Image
» Audio Scribe
» и т.д.
Если вам нужен просто локальный чат с Gemma 4 — выберите AI Chat.
Затем выберите:
» Gemma E4B, если телефон достаточно мощный (например, от 8 ГБ RAM)
» Gemma E2B, который тоже очень производительный
3. Готово!
Теперь вы можете общаться с моделью полностью локально и офлайн.
Даже если включить режим полёта, вы всё равно сможете пользоваться моделью без ограничений.🌐
- 100% open-source
- Полностью офлайн и приватно
- Мультимодальность: текст / аудио / изображения
- Работает с Gemma E4B и E2B
И приложение доступно как на iOS, так и на Android.
Шаги и загрузка ниже:
1. Скачайте Google AI Gallery
- App Store
- Google Play
Исходный код доступен здесь: https://github.com/google-ai-edge/gallery
2. Выберите режим и модель
У вас есть несколько вариантов:
» Agent Skills
» AI Chat
» Ask Image
» Audio Scribe
» и т.д.
Если вам нужен просто локальный чат с Gemma 4 — выберите AI Chat.
Затем выберите:
» Gemma E4B, если телефон достаточно мощный (например, от 8 ГБ RAM)
» Gemma E2B, который тоже очень производительный
3. Готово!
Теперь вы можете общаться с моделью полностью локально и офлайн.
Даже если включить режим полёта, вы всё равно сможете пользоваться моделью без ограничений.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Компоненты кодинг-агентов: В этой статье сделаем небольшой разбор строительных блоков, лежащих в основе кодинг-агентов , от контекста репозитория и использования инструментов до памяти и делегирования.
Приятного прочтения🪖
Приятного прочтения
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Прекрасные нововсти: кто-то сделал AI-систему для поиска работы под Claude Code, которая прогнала 700+ откликов и в итоге реально помогла ему устроиться на работу.
И ОНА ТЕПЕРЬ ОПЕНСОРС.🤓
Она сканирует карьерные страницы разных компаний, переписывает твое CV под каждую вакансию и даже заполняет формы отклика. В репозитории есть:
> 14 режимов (evaluate, scan, PDF, …)
> терминальный дашборд на Go
> генерация ATS-оптимизированных PDF через Playwright
> 45+ преднастроенных компаний (Anthropic, OpenAI, ElevenLabs, Stripe…)
И ОНА ТЕПЕРЬ ОПЕНСОРС.
Она сканирует карьерные страницы разных компаний, переписывает твое CV под каждую вакансию и даже заполняет формы отклика. В репозитории есть:
> 14 режимов (evaluate, scan, PDF, …)
> терминальный дашборд на Go
> генерация ATS-оптимизированных PDF через Playwright
> 45+ преднастроенных компаний (Anthropic, OpenAI, ElevenLabs, Stripe…)
Please open Telegram to view this post
VIEW IN TELEGRAM
1
Как начать зарабатывать в IT в даже без опыта и образования
Самое странное сейчас это пытаться вкатиться в IT по классике, когда опытные программисты давно кодят с нейронками даже в больших проектах.
Поэтому в 2026 выигрывает тот, кто быстро делает рабочие решения без долгих лет обучения и максимально сокращает путь с нуля до первого реального проекта в IT.
‼️Уже завтра 7 апреля в 19.00 мск Андрей Ивашев запускает бесплатный 3-дневный интенсив:
«Первые деньги на вайбкодинге»
📅 7-9 апреля в 19:00 МСК
Для тех хочет начать программировать с нейронками и заработать на этом первые деньги даже без опыта и образования.
Программа 🔥
7 апреля
почему сегодня вход в IT стал сложнее и почему вайбкодинг меняет правила игры
8 апреля
3 способа заработать на вайбкодинге в 2026 и где брать первого клиента, чтобы сделать проект за реальные деньги
9 апреля
На практике соберём AI-ассистента, который станет твоим первым IT-проектом + покажу как работают АI-агенты
🎁 Бонус за регистрацию доступен только 24 часа:
«Библиотека промптов для заработка на вайбкодинге», которые помогут упаковать портфолио и общаться с клиентами так, чтобы покупали
50 бесплатных нейросетей, чтобы кодить без остановки + серкетные бонусы
Ссылка на подключение, уроки по программированию с нейросетями и бонусы будут в закрытом канале👇
Вступить в закрытый канал
Вступить в закрытый канал
Вступить в закрытый канал
Самое странное сейчас это пытаться вкатиться в IT по классике, когда опытные программисты давно кодят с нейронками даже в больших проектах.
Поэтому в 2026 выигрывает тот, кто быстро делает рабочие решения без долгих лет обучения и максимально сокращает путь с нуля до первого реального проекта в IT.
‼️Уже завтра 7 апреля в 19.00 мск Андрей Ивашев запускает бесплатный 3-дневный интенсив:
«Первые деньги на вайбкодинге»
📅 7-9 апреля в 19:00 МСК
Для тех хочет начать программировать с нейронками и заработать на этом первые деньги даже без опыта и образования.
Программа 🔥
7 апреля
почему сегодня вход в IT стал сложнее и почему вайбкодинг меняет правила игры
8 апреля
3 способа заработать на вайбкодинге в 2026 и где брать первого клиента, чтобы сделать проект за реальные деньги
9 апреля
На практике соберём AI-ассистента, который станет твоим первым IT-проектом + покажу как работают АI-агенты
🎁 Бонус за регистрацию доступен только 24 часа:
«Библиотека промптов для заработка на вайбкодинге», которые помогут упаковать портфолио и общаться с клиентами так, чтобы покупали
50 бесплатных нейросетей, чтобы кодить без остановки + серкетные бонусы
Ссылка на подключение, уроки по программированию с нейросетями и бонусы будут в закрытом канале👇
Вступить в закрытый канал
Вступить в закрытый канал
Вступить в закрытый канал
Безопасники призвали архангела: METATRON 💨
AI-ассистент для пентестинга на базе локальной LLM в Linux (Parrot OS)
Ты задаёшь целевой IP или домен. Он запускает тулы для разведки (nmap, whois, whatweb, curl, dig, nikto), передаёт все результаты в локально запущенную AI-модель, затем анализирует цель, выявляет уязвимости, предлагает эксплойты и даёт советы по фиксам. Все данные сохраняются в базу MariaDB с полной историей сканирований.
100% опенсорс
AI-ассистент для пентестинга на базе локальной LLM в Linux (Parrot OS)
Ты задаёшь целевой IP или домен. Он запускает тулы для разведки (nmap, whois, whatweb, curl, dig, nikto), передаёт все результаты в локально запущенную AI-модель, затем анализирует цель, выявляет уязвимости, предлагает эксплойты и даёт советы по фиксам. Все данные сохраняются в базу MariaDB с полной историей сканирований.
100% опенсорс
Please open Telegram to view this post
VIEW IN TELEGRAM
Существует много путаницы между Skills и Subagents в Claude Code.
И становится ещё сложнее, когда понимаешь, что сабагент может использовать скиллы, а скилл может поднимать сабагентов.
Вот статья, в которой разобрал, как каждый из них работает на самом деле и, что важнее, когда стоит использовать один вместо другого.🤨
И становится ещё сложнее, когда понимаешь, что сабагент может использовать скиллы, а скилл может поднимать сабагентов.
Вот статья, в которой разобрал, как каждый из них работает на самом деле и, что важнее, когда стоит использовать один вместо другого.
Please open Telegram to view this post
VIEW IN TELEGRAM
Medium
Скиллы могут использовать сабагентов, сабагенты могут использовать скиллы.
Я начал использовать сабагентов в Claude Code, чтобы изолировать контекст от основной сессии.
2
Андрей Карпаты считает, что RAG сломан. Он опубликовал замену 2 дня назад, которая собрала 5 000 звёзд за 48 часов.
Называется LLM Wiki.
Это паттерн, при котором AI не извлекает информацию заново при каждом запросе. Он строит и поддерживает постоянную, накапливающуюся базу знаний. Автоматически.
RAG выводят знания заново при каждом запросе.. LLM Wiki компилирует их один раз и поддерживает актуальными.
Вот разница:
RAG: вы задаёте вопрос. AI ищет по документам. Находит фрагменты. Склеивает их. Всё забывает. В следующий раз начинает заново.
LLM Wiki: вы добавляете источник. AI читает его, извлекает ключевую информацию, обновляет страницы сущностей, пересматривает summary тем, помечает противоречия, усиливает синтез. Знание накапливается. Каждый источник навсегда делает wiki умнее.
Как это работает:
→ Добавляете источник в raw-коллекцию: статья, paper, транскрипт, заметки
→ AI читает, пишет summary, обновляет индекс
→ Обновляет все релевантные страницы сущностей и концепций в wiki
→ Один источник может затронуть 10–15 страниц одновременно
→ Кросс-ссылки строятся автоматически
→ Противоречия между источниками помечаются
→ Задаёте вопросы к wiki. Хорошие ответы сохраняются как новые страницы
→ Ваши исследования накапливаются в базе знаний. Ничего не теряется в истории чата
100% open-source.
Называется LLM Wiki.
Это паттерн, при котором AI не извлекает информацию заново при каждом запросе. Он строит и поддерживает постоянную, накапливающуюся базу знаний. Автоматически.
RAG выводят знания заново при каждом запросе.. LLM Wiki компилирует их один раз и поддерживает актуальными.
Вот разница:
RAG: вы задаёте вопрос. AI ищет по документам. Находит фрагменты. Склеивает их. Всё забывает. В следующий раз начинает заново.
LLM Wiki: вы добавляете источник. AI читает его, извлекает ключевую информацию, обновляет страницы сущностей, пересматривает summary тем, помечает противоречия, усиливает синтез. Знание накапливается. Каждый источник навсегда делает wiki умнее.
Как это работает:
→ Добавляете источник в raw-коллекцию: статья, paper, транскрипт, заметки
→ AI читает, пишет summary, обновляет индекс
→ Обновляет все релевантные страницы сущностей и концепций в wiki
→ Один источник может затронуть 10–15 страниц одновременно
→ Кросс-ссылки строятся автоматически
→ Противоречия между источниками помечаются
→ Задаёте вопросы к wiki. Хорошие ответы сохраняются как новые страницы
→ Ваши исследования накапливаются в базе знаний. Ничего не теряется в истории чата
100% open-source.
This media is not supported in your browser
VIEW IN TELEGRAM
Теперь вы можете дообучать Gemma 4 (и ещё 500+ опенсорс моделей) бесплатно в Google Colab 🔥
1. Откройте Colab-ноутбук
2. Запустите ячейки, чтобы поднять Unsloth Studio
3. Выберите модель и датасет
4. Нажмите «Start Training»
Всё полностью опенсорс (сделано Unsloth)
Также есть подробный пошаговый туториал по дообучению Gemma 4 здесь
1. Откройте Colab-ноутбук
2. Запустите ячейки, чтобы поднять Unsloth Studio
3. Выберите модель и датасет
4. Нажмите «Start Training»
Всё полностью опенсорс (сделано Unsloth)
Также есть подробный пошаговый туториал по дообучению Gemma 4 здесь
Please open Telegram to view this post
VIEW IN TELEGRAM
2
Cursor переработали процесс генерации токенов в MoE-моделях на GPU Blackwell, что дало ускорение инференса в 1.84 раза и более точные выходные данные.
Эти улучшения напрямую влияют на обучение Composer, позволяя им чаще выпускать улучшенные версии модели.🪖
Эти улучшения напрямую влияют на обучение Composer, позволяя им чаще выпускать улучшенные версии модели.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
2
This media is not supported in your browser
VIEW IN TELEGRAM
Гонка AI за последние 5 лет 😂 😂
Согласен?
Согласен?
Please open Telegram to view this post
VIEW IN TELEGRAM
Anthropic выпустили Claude Opus 4.6 всего два месяца назад. А уже сегодня они поделились некоторыми деталями о новой модели — Claude Mythos Preview, которая с отрывом обогнала Opus 4.6 во всех бенчмарках
По бенчмаркам :
— SWE-bench Verified: 93.9% vs 80.8%
— CyberGym: 83.1% vs 66.6%
— Terminal-Bench 2.0: 82.0% vs 65.4%
Цифры просто невероятные, скачок потрясающий. Но это не релиз для пользователей. Релиз модели пока не планируется (т.к. она слишком сильна и опасна, чтобы сразу выпускать ее на широкую публику). Но Anthropic запускает Project Glasswing, в котором будут участвовать лидеры рынка вроде Amazon, Apple, Google, Microsoft, NVIDIA и CrowdStrike. Компания выделила для них $100 млн в кредитах на использование модели и $4 млн в формате пожертвований опенсорсным проектам, чтобы они использовали Mythos в благих целях.🤩
Anthropic утверждают, что модель способна находить уязвимости на уровне, превосходящем даже лучших человеческих спецов, за редким исключением. Сообщается, что на данный момент она уже обнаружила тысячи критических уязвимостей, в том числе в массово используемых ОС и браузерах. Некоторые из этих дыр по 10-20 лет лежали незамеченными.
По бенчмаркам :
— SWE-bench Verified: 93.9% vs 80.8%
— CyberGym: 83.1% vs 66.6%
— Terminal-Bench 2.0: 82.0% vs 65.4%
Цифры просто невероятные, скачок потрясающий. Но это не релиз для пользователей. Релиз модели пока не планируется (т.к. она слишком сильна и опасна, чтобы сразу выпускать ее на широкую публику). Но Anthropic запускает Project Glasswing, в котором будут участвовать лидеры рынка вроде Amazon, Apple, Google, Microsoft, NVIDIA и CrowdStrike. Компания выделила для них $100 млн в кредитах на использование модели и $4 млн в формате пожертвований опенсорсным проектам, чтобы они использовали Mythos в благих целях.
Anthropic утверждают, что модель способна находить уязвимости на уровне, превосходящем даже лучших человеческих спецов, за редким исключением. Сообщается, что на данный момент она уже обнаружила тысячи критических уязвимостей, в том числе в массово используемых ОС и браузерах. Некоторые из этих дыр по 10-20 лет лежали незамеченными.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Тем временем, китайские друзья — выпустили GLM 5.1 👊
№1 среди опенсорс моделей и №3 в мире по бенчмаркам SWE-Bench Pro, Terminal-Bench и NL2Repo
К концу прошлого года агенты могли выполнять около 20 шагов. Сейчас GLM-5.1 может делать до 1 700. По заявлениям, может работать автономно до 8 часов, улучшая стратегии через тысячи итераций
Он уже появился в Text Arena и заметно превосходит своего предшественника GLM-5 на +11 пунктов и на +15 пунктов опережает Kimi K2.5 Thinking.
Цены по API: $1.40/M input, $4.40/M output
Unsloth уже сжали модель на 744B с 1.65TB до 220GB (−86%) с помощью Dynamic 2-bit.
№1 среди опенсорс моделей и №3 в мире по бенчмаркам SWE-Bench Pro, Terminal-Bench и NL2Repo
К концу прошлого года агенты могли выполнять около 20 шагов. Сейчас GLM-5.1 может делать до 1 700. По заявлениям, может работать автономно до 8 часов, улучшая стратегии через тысячи итераций
Он уже появился в Text Arena и заметно превосходит своего предшественника GLM-5 на +11 пунктов и на +15 пунктов опережает Kimi K2.5 Thinking.
Цены по API: $1.40/M input, $4.40/M output
Unsloth уже сжали модель на 744B с 1.65TB до 220GB (−86%) с помощью Dynamic 2-bit.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Я, пишущий промпты своим агентам в 3 часа ночи.
4