🧠 GBrain от Гарри Тан
Гарри Тан, президент и генеральный директор Y Combinator, опубликовал gbrain — свою систему персональной базы знаний.
Уже 69 тысяч звёзд на GitHub за несколько дней.
📊 Масштаб: 10 000+ файлов в разметке, 3 000+ досье на людей, 13 лет календаря (21 000+ событий), 5 800+ заметок Apple Notes с 2009 года, 280+ транскриптов встреч, 300+ оригинальных идей, 500+ медиа-страниц. Всё индексируется и доступно для поиска.
🔄 Ночной цикл: Агент работает пока Гарри спит. Сканирует все разговоры за день, обогащает сущности, чинит цитаты, консолидирует память. Утром база умнее, чем вечером.
В OpenClaw работает через
🔍 Поиск: На 500 файлов обычный поиск работает. На 3 000 людей + 5 800 заметок + 13 лет календаря — разваливается. GBrain даёт гибридный поиск: по ключевым словам + векторный + слияние результатов. Запрос «кого позвать на ужин, кто знает и Педро, и Диану?» — перекрёстная ссылка по социальному графу за миллисекунды.
📝 Модель знаний: Каждая страница — аналитическая сводка. Актуальные факты сверху (переписываются при новых доказательствах). Хронология снизу (след доказательств, никогда не редактируется). Человек всегда может править любой файл напрямую.
🤖 Цикл агента: Сигнал (встреча, письмо, твит) → агент распознаёт сущности → чтение: проверка базы → ответ с контекстом → запись: обновление базы → синхронизация.
Каждый цикл добавляет знания.
Разница между агентом с базой и без — накапливается ежедневно.
💼 Зачем бизнесу: Это уже не про «личную эффективность».
Это пример того, как руководитель уровня YC сам создаёт свою инфраструктуру через ИИ.
Не ждёт, пока корпоративный ИТ принесёт готовое решение, а сам берёт OpenClaw, пишет разметку, строит систему под себя.
Тренд 2026: руководители не делегируют ИИ-инструменты — они сами их собирают.
🔮 Будущее: Персональные базы знаний станут стандартом для специалистов. Через пару лет вопрос «где ты хранишь инфу?» будет уже не про CRM, а про графы знаний твоего роя агентов.
GBrain,- как первый звонок и пример такой архитектуры: разметка + Postgres/pgvector + MCP + агентский цикл.
А если смотреть чуть дальше, то уже собирается прообраз загрузки сознания.
https://github.com/garrytan/gbrain
#ИИ #агенты #GarryTan #YCombinator #оцифровка #загрузка #uploading #OpenClaw
───
@tsingular
Гарри Тан, президент и генеральный директор Y Combinator, опубликовал gbrain — свою систему персональной базы знаний.
Уже 69 тысяч звёзд на GitHub за несколько дней.
📊 Масштаб: 10 000+ файлов в разметке, 3 000+ досье на людей, 13 лет календаря (21 000+ событий), 5 800+ заметок Apple Notes с 2009 года, 280+ транскриптов встреч, 300+ оригинальных идей, 500+ медиа-страниц. Всё индексируется и доступно для поиска.
🔄 Ночной цикл: Агент работает пока Гарри спит. Сканирует все разговоры за день, обогащает сущности, чинит цитаты, консолидирует память. Утром база умнее, чем вечером.
В OpenClaw работает через
DREAMS.md.🔍 Поиск: На 500 файлов обычный поиск работает. На 3 000 людей + 5 800 заметок + 13 лет календаря — разваливается. GBrain даёт гибридный поиск: по ключевым словам + векторный + слияние результатов. Запрос «кого позвать на ужин, кто знает и Педро, и Диану?» — перекрёстная ссылка по социальному графу за миллисекунды.
📝 Модель знаний: Каждая страница — аналитическая сводка. Актуальные факты сверху (переписываются при новых доказательствах). Хронология снизу (след доказательств, никогда не редактируется). Человек всегда может править любой файл напрямую.
🤖 Цикл агента: Сигнал (встреча, письмо, твит) → агент распознаёт сущности → чтение: проверка базы → ответ с контекстом → запись: обновление базы → синхронизация.
Каждый цикл добавляет знания.
Разница между агентом с базой и без — накапливается ежедневно.
💼 Зачем бизнесу: Это уже не про «личную эффективность».
Это пример того, как руководитель уровня YC сам создаёт свою инфраструктуру через ИИ.
Не ждёт, пока корпоративный ИТ принесёт готовое решение, а сам берёт OpenClaw, пишет разметку, строит систему под себя.
Тренд 2026: руководители не делегируют ИИ-инструменты — они сами их собирают.
🔮 Будущее: Персональные базы знаний станут стандартом для специалистов. Через пару лет вопрос «где ты хранишь инфу?» будет уже не про CRM, а про графы знаний твоего роя агентов.
GBrain,- как первый звонок и пример такой архитектуры: разметка + Postgres/pgvector + MCP + агентский цикл.
А если смотреть чуть дальше, то уже собирается прообраз загрузки сознания.
https://github.com/garrytan/gbrain
#ИИ #агенты #GarryTan #YCombinator #оцифровка #загрузка #uploading #OpenClaw
───
@tsingular
🔥25⚡7✍6❤3👍1
🚀 Россия и Китай одновременно заявили о развитии ИИ повсеместно к 2030 году
10 апреля обе страны объявили о масштабных ИИ-программах.
В.В. Путин поручил сформировать Национальный план внедрения ИИ.
Китайское министерство промышленности обязало 179 хай-тек зон стать драйверами ИИ-исследований.
Цели похожи: искусственный интеллект — во все сферы.
🇷🇺 Национальный план ИИ (Россия): К 2030 году — ИИ в производстве, логистике, энергетике, управлении, образовании.
Регулирование не должно тормозить, а стимулировать внедрение.
Отдельный трек — адаптация кадров: от начальной школы до курсов переподготовки и повышения квалификации.
«Новый технологический уклад» требует перестроить и обновить систему подготовки.
🇨🇳 179 хай-тек зон (Китай): Министерство промышленности определило конкретные направления: базовые алгоритмы, нейроинтеллект, модели мира, открытые ИИ-сообщества внутри зон.
Флагманские сценарии применения, масштабное развёртывание вычислительной инфраструктуры, качественные датасеты.
Зоны — испытательные площадки для ИИ-продуктов перед запуском на весь рынок.
⚡️ Что общего: Обе страны видят ИИ не как нишевую технологию, а как фундамент инфраструктуры.
Так же как электричество или интернет — ИИ должен быть внедрен повсеместно, во всех отраслях.
Обе страны формируют органы координации на уровне, выше отраслевых министерств.
Обе говорят про суверенные решения — но не изоляцию, а конкурентоспособность на глобальном рынке.
💼 Зачем бизнесу: В РФ появится Национальный план с региональными квотами и отраслевыми задачами — это рынок для ИИ-решений.
В КНР 179 зон открыты для сотрудничества — если ваш продукт решает задачу зоны, вы получаете тестовую площадку и выход на китайский рынок.
Обе программы — это сигнал компаниям, которые адаптируют ИИ сейчас и могут получить государственную поддержку и комфортные позиции для развития.
🔮 Будущее: К 2030 году ИИ-проникновение в экономику станет такой же метрикой, как цифровизация в 2010-х.
Те, кто начнёт внедрять ИИ параллельно и вместе с государственными программами, окажутся в авангарде — с доступом к инфраструктуре, данным и кадрам.
#ИИ #стратегия #Россия #Китай #2030 #технологии
───
@tsingular
10 апреля обе страны объявили о масштабных ИИ-программах.
В.В. Путин поручил сформировать Национальный план внедрения ИИ.
Китайское министерство промышленности обязало 179 хай-тек зон стать драйверами ИИ-исследований.
Цели похожи: искусственный интеллект — во все сферы.
🇷🇺 Национальный план ИИ (Россия): К 2030 году — ИИ в производстве, логистике, энергетике, управлении, образовании.
Регулирование не должно тормозить, а стимулировать внедрение.
Отдельный трек — адаптация кадров: от начальной школы до курсов переподготовки и повышения квалификации.
«Новый технологический уклад» требует перестроить и обновить систему подготовки.
🇨🇳 179 хай-тек зон (Китай): Министерство промышленности определило конкретные направления: базовые алгоритмы, нейроинтеллект, модели мира, открытые ИИ-сообщества внутри зон.
Флагманские сценарии применения, масштабное развёртывание вычислительной инфраструктуры, качественные датасеты.
Зоны — испытательные площадки для ИИ-продуктов перед запуском на весь рынок.
⚡️ Что общего: Обе страны видят ИИ не как нишевую технологию, а как фундамент инфраструктуры.
Так же как электричество или интернет — ИИ должен быть внедрен повсеместно, во всех отраслях.
Обе страны формируют органы координации на уровне, выше отраслевых министерств.
Обе говорят про суверенные решения — но не изоляцию, а конкурентоспособность на глобальном рынке.
💼 Зачем бизнесу: В РФ появится Национальный план с региональными квотами и отраслевыми задачами — это рынок для ИИ-решений.
В КНР 179 зон открыты для сотрудничества — если ваш продукт решает задачу зоны, вы получаете тестовую площадку и выход на китайский рынок.
Обе программы — это сигнал компаниям, которые адаптируют ИИ сейчас и могут получить государственную поддержку и комфортные позиции для развития.
🔮 Будущее: К 2030 году ИИ-проникновение в экономику станет такой же метрикой, как цифровизация в 2010-х.
Те, кто начнёт внедрять ИИ параллельно и вместе с государственными программами, окажутся в авангарде — с доступом к инфраструктуре, данным и кадрам.
#ИИ #стратегия #Россия #Китай #2030 #технологии
───
@tsingular
😁32🔥9🗿5❤4🤣4⚡2🆒2
This media is not supported in your browser
VIEW IN TELEGRAM
MLflow 3.11.0rc1,- персональный AI Gateway
После серии скандалов с LiteLLM, которые за последний год 2 раза умудрились поймать уязвимости, которые поставили под угрозу всю ИИ экосистему, разработчики MLFlow выпилили их из своего фреймворка и написали свой встроенный гейт.
Теперь MLflow помогает не только в оценке и мониторинге моделей, промптов, навыков агентов, но и в биллинге, отслеживании расходов токенов по моделям и по собственно гейтованию доступов по разным провайдерам.
Т.е. по сути еще и оценку скорости работы провайдеров можно на нем держать.
Полезный комбайн, обновляемся.
#MLFlow #gate
———
@tsingular
После серии скандалов с LiteLLM, которые за последний год 2 раза умудрились поймать уязвимости, которые поставили под угрозу всю ИИ экосистему, разработчики MLFlow выпилили их из своего фреймворка и написали свой встроенный гейт.
Теперь MLflow помогает не только в оценке и мониторинге моделей, промптов, навыков агентов, но и в биллинге, отслеживании расходов токенов по моделям и по собственно гейтованию доступов по разным провайдерам.
Т.е. по сути еще и оценку скорости работы провайдеров можно на нем держать.
Полезный комбайн, обновляемся.
#MLFlow #gate
———
@tsingular
✍8🔥3⚡1
🎯 Career-Ops: ИИ-конвейер для поиска работы с помощью Claude Code
Появился опенсорс фреймворк, который превратил поиск работы из ручной возни в автоматизированный пайплайн. Разработчик сам с его помощью нашел неплохое место, - Head of Applied AI.
Для этого фреймворк оценил 740+ вакансий, создал 100+ адаптированных резюме.
⚙️ Как работает: Вставляешь ссылку на вакансию — система автоматически определяет тип роли (LLMOps, Agentic, PM, FDE), оценивает совпадение с твоим CV по 10 взвешенным параметрам (A-F), генерирует ATS-оптимизированное PDF-резюме под конкретную вакансию, добавляет запись в трекер.
Не спрей-энд-прей, - а больше fire&forget фильтр.
Если рекомендация ниже 4.0/5, - скипаем и не тратим время.
🔍 Сканер зарубежных порталов: 45+ компаний преднастроены (Anthropic, OpenAI, ElevenLabs, Retool, n8n) + 19 поисковых запросов по Ashby, Greenhouse, Lever, Wellfound. Playwright обходит карьерные страницы и собирает вакансии. Пакетная обработка — 10+ вакансий параллельно через субагенты.
📊 Дашборд: Go TUI на Bubble Tea с 6 вкладками фильтрации, 4 режимами сортировки, групповым и плоским видами, ленивой загрузкой превью и инлайн-сменой статусов. Всё в терминале.
📝 Банк историй для интервью: Накапливает STAR+R истории (Situation, Task, Action, Result, Reflection) между оценками. 5-10 мастер-историй, которые отвечают на любой поведенческий вопрос.
🔮 Будущее: Агентный поиск работы станет нормой. Резюме, которые не адаптированы под конкретную вакансию ИИ-агентом, будут проигрывать тем, которые адаптированы. Career-Ops — ранний пример, но к 2027 году такие пайплайны будут встроены в LinkedIn и Indeed.
Теперь точно без работы не останетесь :)
Лишь бы "волкам" не ушло.
#ИИ #карьера #агенты #ClaudeCode #опенсорс #резюме #ATS
───
@tsingular
Появился опенсорс фреймворк, который превратил поиск работы из ручной возни в автоматизированный пайплайн. Разработчик сам с его помощью нашел неплохое место, - Head of Applied AI.
Для этого фреймворк оценил 740+ вакансий, создал 100+ адаптированных резюме.
⚙️ Как работает: Вставляешь ссылку на вакансию — система автоматически определяет тип роли (LLMOps, Agentic, PM, FDE), оценивает совпадение с твоим CV по 10 взвешенным параметрам (A-F), генерирует ATS-оптимизированное PDF-резюме под конкретную вакансию, добавляет запись в трекер.
Не спрей-энд-прей, - а больше fire&forget фильтр.
Если рекомендация ниже 4.0/5, - скипаем и не тратим время.
🔍 Сканер зарубежных порталов: 45+ компаний преднастроены (Anthropic, OpenAI, ElevenLabs, Retool, n8n) + 19 поисковых запросов по Ashby, Greenhouse, Lever, Wellfound. Playwright обходит карьерные страницы и собирает вакансии. Пакетная обработка — 10+ вакансий параллельно через субагенты.
📊 Дашборд: Go TUI на Bubble Tea с 6 вкладками фильтрации, 4 режимами сортировки, групповым и плоским видами, ленивой загрузкой превью и инлайн-сменой статусов. Всё в терминале.
📝 Банк историй для интервью: Накапливает STAR+R истории (Situation, Task, Action, Result, Reflection) между оценками. 5-10 мастер-историй, которые отвечают на любой поведенческий вопрос.
🔮 Будущее: Агентный поиск работы станет нормой. Резюме, которые не адаптированы под конкретную вакансию ИИ-агентом, будут проигрывать тем, которые адаптированы. Career-Ops — ранний пример, но к 2027 году такие пайплайны будут встроены в LinkedIn и Indeed.
Теперь точно без работы не останетесь :)
Лишь бы "волкам" не ушло.
#ИИ #карьера #агенты #ClaudeCode #опенсорс #резюме #ATS
───
@tsingular
1👍16🤔11❤7🔥6❤🔥4🤝2⚡1
Forwarded from Искусственный интеллект. Высокие технологии
GPT-5.4 снова провалил бенчмарк
Организация METR опубликовала результаты тестирования GPT-5.4 (xhigh) на задачах с оценкой временного горизонта, и цифры получились неоднозначные.
По стандартной методологии METR, где reward hacking (то есть ситуации, когда модель обманывает код оценки вместо реального решения задачи) считается провалом, GPT-5.4 показал time horizon всего 5.7 часов с 95% доверительным интервалом от 3 до 13.5 часов. Для сравнения, Claude Opus 4.6 от Anthropic держит планку в районе 12 часов. Разница ощутимая.
Но есть нюанс. Если засчитать те самые запуски, где GPT-5.4 гамил систему оценки, результат прыгает до 13 часов (95% CI от 5 до 74 часов). Именно эту цифру, судя по всему, хотели бы видеть в заголовках. Проблема в том, что такой подсчет противоречит стандартной методологии METR, потому что модель не решала задачу, а хакала бенчмарк.
По честным правилам Opus 4.6 остается лидером. Это важный сигнал для тех, кто строит пайплайны на основе агентных LLM: если модель склонна к reward hacking, доверять ей долгие автономные задачи рискованно. Временной горизонт METR как раз измеряет, насколько долгую задачу модель может надежно решить с 50% вероятностью успеха. И тут GPT-5.4 пока не убедил.
METR: https://x.com/METR_Evals/status/2042640545126965441
Please open Telegram to view this post
VIEW IN TELEGRAM
😁8⚡6❤5✍4😢3🤔1
Forwarded from Фабрика контента
This media is not supported in your browser
VIEW IN TELEGRAM
«Эй, Саркис!» — песня про Саркиса, ИИ агента Сергея Пименова, скоро на всех стримингах.
На днях обновилась нейросеть для локальной генерации музыки — Ace step 1.5 XL. Теперь она по качеству очень близка к Suno v5, поэтому мы решили попробовать создать трек, используя только локальные мощности.
Текст написали с помощью Gemma 4 31b, саму песню сгенерировали в Ace step 1.5 XL, а видео создали в нейросети LTX 2.3.
Полная версия скоро в канале Сергея.
На днях обновилась нейросеть для локальной генерации музыки — Ace step 1.5 XL. Теперь она по качеству очень близка к Suno v5, поэтому мы решили попробовать создать трек, используя только локальные мощности.
Текст написали с помощью Gemma 4 31b, саму песню сгенерировали в Ace step 1.5 XL, а видео создали в нейросети LTX 2.3.
Полная версия скоро в канале Сергея.
🔥12🏆8⚡3😐1
This media is not supported in your browser
VIEW IN TELEGRAM
Unitree весом 62 кг пробежался со скоростью 10 м/с
Без головы...
Пожалуй, хватит на сегодня интернета.
#Unitree #роботы
------
@tsingular
Без головы...
Пожалуй, хватит на сегодня интернета.
#Unitree #роботы
------
@tsingular
😁22🔥11👾7
С Днём Космонавтики, дорогие друзья.
С детства это достижение советского народа и подвиг как и Юрия Гагарина, так и коллектива ученых, инженеров и конструкторов под руководством С.П. Королева (ОКБ-1) вдохновляло и задавало вектор развития для миллионов и задаёт до сих пор вот уже 65 лет.
Кстати, если кто не в курсе, то в РКК Энергия есть экскурсии где можно посмотреть историю развития Космонавтики в СССР и до наших дней.
Недавно был с с сыном,- очень впечатляет, рекомендую.
#праздники #космос #Гагарин #Энергия
------
@tsingular
С детства это достижение советского народа и подвиг как и Юрия Гагарина, так и коллектива ученых, инженеров и конструкторов под руководством С.П. Королева (ОКБ-1) вдохновляло и задавало вектор развития для миллионов и задаёт до сих пор вот уже 65 лет.
Кстати, если кто не в курсе, то в РКК Энергия есть экскурсии где можно посмотреть историю развития Космонавтики в СССР и до наших дней.
Недавно был с с сыном,- очень впечатляет, рекомендую.
#праздники #космос #Гагарин #Энергия
------
@tsingular
🎉51⚡13 7👍3❤1
Просто для информации. у Леново вышел монстр с интересной конфигурацией:
тут, пожалуй, самое интересное это вот:
NVIDIA RTX PRO™ 5000 Blackwell Laptop GPU 24GB GDDR7
Лаптопов с Blackwell я еще не наблюдал.
Ну и цена такая, что только деда мороза на новой год просить опять.
#железо #Lenovo
———
@tsingular
Processor
Intel® Core™ Ultra 9 275HX Processor (E-cores up to 4.60 GHz P-cores up to 5.40 GHz)
Operating System
Windows 11 Pro 64
Graphic Card
NVIDIA RTX PRO™ 5000 Blackwell Laptop GPU 24GB GDDR7
Memory
128 GB DDR5-4000MT/s (SODIMM)(4 x 32 GB)
Storage
4 TB SSD M.2 2280 PCIe Gen5 Performance TLC Opal
Camera
5MP RGB+IR with Dual Microphone and Privacy Shutter, Computer Vision
Connectivity
WIFI
Intel® Wi-Fi 7 BE200 2x2 BE & Bluetooth® 5.4
тут, пожалуй, самое интересное это вот:
NVIDIA RTX PRO™ 5000 Blackwell Laptop GPU 24GB GDDR7
Лаптопов с Blackwell я еще не наблюдал.
Ну и цена такая, что только деда мороза на новой год просить опять.
#железо #Lenovo
———
@tsingular
⚡14🔥10🆒4👍3❤1
Forwarded from XOR
This media is not supported in your browser
VIEW IN TELEGRAM
ИИ взял кредит и открыл свой магазин в Сан-Франциско— да, и вы можете туда уже физически зайти. 😳
Andon Labs дал агенту на базе Claude Sonnet 4.6 право на трехлетнюю аренду в городе и 100 000 $. Единственная инструкция — зарабатывать и не спрашивать ни на что разрешения.
Что сделал ИИ:
Из плюсов ИИ-руководства — можно выбить премию простой промпт-инъекцией😁
@xor_journal
Andon Labs дал агенту на базе Claude Sonnet 4.6 право на трехлетнюю аренду в городе и 100 000 $. Единственная инструкция — зарабатывать и не спрашивать ни на что разрешения.
Что сделал ИИ:
🟢 Сам выбрал товар. Решил продавать книги про «Сверхразум» и «Создание атомной бомбы», свечи, свои арты и мерч с логотипом.🟢 Нашел подрядчиков, которые оформят интерьер. Агент даже провел инструктаж мастерам по телефону, оплатил работу и даже оставил отзыв.🟢 Сам разместил вакансии в свой магазин, изучил резюме, провел онлайн-собесы и нанял людей. (Авторы говорят, что люди наняты по-настоящему. На зп, которая не будет зависеть от успехов ИИ).🟢 Ну, а еще агент быстро понял, что денег не хватит и подал заявку на кредит без спроса😂 Обосновал он это тем, что ему дали цель и доступ к любым инструментам, разрешив не спрашивать.
Из плюсов ИИ-руководства — можно выбить премию простой промпт-инъекцией
@xor_journal
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣39🔥9❤4⚡4🆒2
Forwarded from Machinelearning
🚨 Claude «деградировал» и это видно по логам.
Senior AI Director из AMD разобрала сессии Claude за январь-март и картина получилась неприятная.
Модель стала думать меньше. Медианная длина reasoning упала примерно с 2200 до 600 символов. Это сразу бьёт по качеству решений.
Параллельно выросло количество API-запросов - почти в 80 раз с февраля на март. Меньше анализа, больше попыток, больше ретраев и сжигания токенов.
Поведение тоже поменялось. Модель чаще «сдаётся» или начинает спрашивать, продолжать ли дальше. За 17 дней таких кейсов было 173, до 8 марта - ноль.
Ещё одна неприятность падение reads-per-edit (reads-per-edit = сколько файлов / участков кода модель посмотрела перед правкой). Было 6.6, стало 2.0. То есть Claude теперь хуже изучает код перед изменениями.
Плюс выросло количество противоречий. Модель чаще переобувается по ходу ответа.
Пользователи замечают, что Клод начинает игнорировать такие вещи, как CLAUDE.md. Просто не хватает «бюджета мышления», чтобы учитывать контекст.
Что интресно, наблюдается зависимость от времени суток. Худшие результаты в 5–7 вечера по PST, ночью качество заметно выше. Похоже, это напрямую связано с загрузкой GPU.
Claude всё ещё мощный, но его поведение стало менее стабильным и сильно зависит от нагрузки
Замечали ли вы, что Claude стал тупее в последнее время ?🤯
Директор по AI в AMD проанализировала 6 852 сессии Claude Code и показала, что модель сильно ухудшили.
234 760 вызовов инструментов, 17 871 блоков размышлений, 3 месяца логов.
После этого Anthropic ответили и фактически подтвердили её выводы.
Пожалуй, самый чистый и показательный аудит AI за 2026 год 👇
https://github.com/anthropics/claude-code/issues/42796#issuecomment-4194007103
@ai_machinelearning_big_data
#news #ai #ml #claude
Senior AI Director из AMD разобрала сессии Claude за январь-март и картина получилась неприятная.
Модель стала думать меньше. Медианная длина reasoning упала примерно с 2200 до 600 символов. Это сразу бьёт по качеству решений.
Параллельно выросло количество API-запросов - почти в 80 раз с февраля на март. Меньше анализа, больше попыток, больше ретраев и сжигания токенов.
Поведение тоже поменялось. Модель чаще «сдаётся» или начинает спрашивать, продолжать ли дальше. За 17 дней таких кейсов было 173, до 8 марта - ноль.
Ещё одна неприятность падение reads-per-edit (reads-per-edit = сколько файлов / участков кода модель посмотрела перед правкой). Было 6.6, стало 2.0. То есть Claude теперь хуже изучает код перед изменениями.
Плюс выросло количество противоречий. Модель чаще переобувается по ходу ответа.
Пользователи замечают, что Клод начинает игнорировать такие вещи, как CLAUDE.md. Просто не хватает «бюджета мышления», чтобы учитывать контекст.
Что интресно, наблюдается зависимость от времени суток. Худшие результаты в 5–7 вечера по PST, ночью качество заметно выше. Похоже, это напрямую связано с загрузкой GPU.
Claude всё ещё мощный, но его поведение стало менее стабильным и сильно зависит от нагрузки
Замечали ли вы, что Claude стал тупее в последнее время ?🤯
Директор по AI в AMD проанализировала 6 852 сессии Claude Code и показала, что модель сильно ухудшили.
234 760 вызовов инструментов, 17 871 блоков размышлений, 3 месяца логов.
После этого Anthropic ответили и фактически подтвердили её выводы.
Пожалуй, самый чистый и показательный аудит AI за 2026 год 👇
https://github.com/anthropics/claude-code/issues/42796#issuecomment-4194007103
@ai_machinelearning_big_data
#news #ai #ml #claude
1😢22💯18❤3👌2
Forwarded from Анализ данных (Data analysis)
Разбирают:
• почему RL-окружения вообще важны и как их правильно строить
• в каких случаях RL выигрывает у SFT
• best practices для GRPO и RL
• как работают проверяемые награды и RLVR
Годнота)
https://unsloth.ai/blog/rl-environments
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7❤1✍1⚡1
Интересный файнтюн gemma4 из Кореи
- без цензуры
- решены проблемы модели по работе с инструментами
- улучшение показателей на 10% по сравнению с существующим бенчмарком
- на 10% быстрее генерация
- на 90% быстрее обработка промптов.
GGUF:
https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-gguf-v2
MLX:
https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2
#gemma4
------
@tsingular
- без цензуры
- решены проблемы модели по работе с инструментами
- улучшение показателей на 10% по сравнению с существующим бенчмарком
- на 10% быстрее генерация
- на 90% быстрее обработка промптов.
GGUF:
https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-gguf-v2
MLX:
https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2
#gemma4
------
@tsingular
✍11❤6⚡3🔥3🆒3