Технозаметки Малышева
10.8K subscribers
4.43K photos
1.61K videos
41 files
4.49K links
Новости инноваций из мира Искусственного Интеллекта. 🤖 [РКН: 7021469833 ]

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸: pay.cloudtips.ru/p/c8960bb
#UEGVW
Download Telegram
🧠 GBrain от Гарри Тан

Гарри Тан, президент и генеральный директор Y Combinator, опубликовал gbrain — свою систему персональной базы знаний.
Уже 69 тысяч звёзд на GitHub за несколько дней.

📊 Масштаб: 10 000+ файлов в разметке, 3 000+ досье на людей, 13 лет календаря (21 000+ событий), 5 800+ заметок Apple Notes с 2009 года, 280+ транскриптов встреч, 300+ оригинальных идей, 500+ медиа-страниц. Всё индексируется и доступно для поиска.

🔄 Ночной цикл: Агент работает пока Гарри спит. Сканирует все разговоры за день, обогащает сущности, чинит цитаты, консолидирует память. Утром база умнее, чем вечером.
В OpenClaw работает через DREAMS.md.

🔍 Поиск: На 500 файлов обычный поиск работает. На 3 000 людей + 5 800 заметок + 13 лет календаря — разваливается. GBrain даёт гибридный поиск: по ключевым словам + векторный + слияние результатов. Запрос «кого позвать на ужин, кто знает и Педро, и Диану?» — перекрёстная ссылка по социальному графу за миллисекунды.

📝 Модель знаний: Каждая страница — аналитическая сводка. Актуальные факты сверху (переписываются при новых доказательствах). Хронология снизу (след доказательств, никогда не редактируется). Человек всегда может править любой файл напрямую.

🤖 Цикл агента: Сигнал (встреча, письмо, твит) → агент распознаёт сущности → чтение: проверка базы → ответ с контекстом → запись: обновление базы → синхронизация.
Каждый цикл добавляет знания.
Разница между агентом с базой и без — накапливается ежедневно.

💼 Зачем бизнесу: Это уже не про «личную эффективность».
Это пример того, как руководитель уровня YC сам создаёт свою инфраструктуру через ИИ.
Не ждёт, пока корпоративный ИТ принесёт готовое решение, а сам берёт OpenClaw, пишет разметку, строит систему под себя.

Тренд 2026: руководители не делегируют ИИ-инструменты — они сами их собирают.

🔮 Будущее: Персональные базы знаний станут стандартом для специалистов. Через пару лет вопрос «где ты хранишь инфу?» будет уже не про CRM, а про графы знаний твоего роя агентов.
GBrain,- как первый звонок и пример такой архитектуры: разметка + Postgres/pgvector + MCP + агентский цикл.

А если смотреть чуть дальше, то уже собирается прообраз загрузки сознания.

https://github.com/garrytan/gbrain

#ИИ #агенты #GarryTan #YCombinator #оцифровка #загрузка #uploading #OpenClaw
───
@tsingular
🔥25763👍1
🚀 Россия и Китай одновременно заявили о развитии ИИ повсеместно к 2030 году

10 апреля обе страны объявили о масштабных ИИ-программах.

В.В. Путин поручил сформировать Национальный план внедрения ИИ.

Китайское министерство промышленности обязало 179 хай-тек зон стать драйверами ИИ-исследований.

Цели похожи: искусственный интеллект — во все сферы.

🇷🇺 Национальный план ИИ (Россия): К 2030 году — ИИ в производстве, логистике, энергетике, управлении, образовании.
Регулирование не должно тормозить, а стимулировать внедрение.
Отдельный трек — адаптация кадров: от начальной школы до курсов переподготовки и повышения квалификации.
«Новый технологический уклад» требует перестроить и обновить систему подготовки.

🇨🇳 179 хай-тек зон (Китай): Министерство промышленности определило конкретные направления: базовые алгоритмы, нейроинтеллект, модели мира, открытые ИИ-сообщества внутри зон.
Флагманские сценарии применения, масштабное развёртывание вычислительной инфраструктуры, качественные датасеты.
Зоны — испытательные площадки для ИИ-продуктов перед запуском на весь рынок.

⚡️ Что общего: Обе страны видят ИИ не как нишевую технологию, а как фундамент инфраструктуры.
Так же как электричество или интернет — ИИ должен быть внедрен повсеместно, во всех отраслях.
Обе страны формируют органы координации на уровне, выше отраслевых министерств.
Обе говорят про суверенные решения — но не изоляцию, а конкурентоспособность на глобальном рынке.

💼 Зачем бизнесу: В РФ появится Национальный план с региональными квотами и отраслевыми задачами — это рынок для ИИ-решений.
В КНР 179 зон открыты для сотрудничества — если ваш продукт решает задачу зоны, вы получаете тестовую площадку и выход на китайский рынок.
Обе программы — это сигнал компаниям, которые адаптируют ИИ сейчас и могут получить государственную поддержку и комфортные позиции для развития.

🔮 Будущее: К 2030 году ИИ-проникновение в экономику станет такой же метрикой, как цифровизация в 2010-х.
Те, кто начнёт внедрять ИИ параллельно и вместе с государственными программами, окажутся в авангарде — с доступом к инфраструктуре, данным и кадрам.

#ИИ #стратегия #Россия #Китай #2030 #технологии
───
@tsingular
😁32🔥9🗿54🤣42🆒2
This media is not supported in your browser
VIEW IN TELEGRAM
MLflow 3.11.0rc1,- персональный AI Gateway

После серии скандалов с LiteLLM, которые за последний год 2 раза умудрились поймать уязвимости, которые поставили под угрозу всю ИИ экосистему, разработчики MLFlow выпилили их из своего фреймворка и написали свой встроенный гейт.

Теперь MLflow помогает не только в оценке и мониторинге моделей, промптов, навыков агентов, но и в биллинге, отслеживании расходов токенов по моделям и по собственно гейтованию доступов по разным провайдерам.

Т.е. по сути еще и оценку скорости работы провайдеров можно на нем держать.

Полезный комбайн, обновляемся.

#MLFlow #gate
———
@tsingular
8🔥31
🎯 Career-Ops: ИИ-конвейер для поиска работы с помощью Claude Code

Появился опенсорс фреймворк, который превратил поиск работы из ручной возни в автоматизированный пайплайн. Разработчик сам с его помощью нашел неплохое место, - Head of Applied AI.
Для этого фреймворк оценил 740+ вакансий, создал 100+ адаптированных резюме.

⚙️ Как работает: Вставляешь ссылку на вакансию — система автоматически определяет тип роли (LLMOps, Agentic, PM, FDE), оценивает совпадение с твоим CV по 10 взвешенным параметрам (A-F), генерирует ATS-оптимизированное PDF-резюме под конкретную вакансию, добавляет запись в трекер.
Не спрей-энд-прей, - а больше fire&forget фильтр.
Если рекомендация ниже 4.0/5, - скипаем и не тратим время.

🔍 Сканер зарубежных порталов: 45+ компаний преднастроены (Anthropic, OpenAI, ElevenLabs, Retool, n8n) + 19 поисковых запросов по Ashby, Greenhouse, Lever, Wellfound. Playwright обходит карьерные страницы и собирает вакансии. Пакетная обработка — 10+ вакансий параллельно через субагенты.

📊 Дашборд: Go TUI на Bubble Tea с 6 вкладками фильтрации, 4 режимами сортировки, групповым и плоским видами, ленивой загрузкой превью и инлайн-сменой статусов. Всё в терминале.

📝 Банк историй для интервью: Накапливает STAR+R истории (Situation, Task, Action, Result, Reflection) между оценками. 5-10 мастер-историй, которые отвечают на любой поведенческий вопрос.

🔮 Будущее: Агентный поиск работы станет нормой. Резюме, которые не адаптированы под конкретную вакансию ИИ-агентом, будут проигрывать тем, которые адаптированы. Career-Ops — ранний пример, но к 2027 году такие пайплайны будут встроены в LinkedIn и Indeed.

Теперь точно без работы не останетесь :)
Лишь бы "волкам" не ушло.

#ИИ #карьера #агенты #ClaudeCode #опенсорс #резюме #ATS
───
@tsingular
1👍16🤔117🔥6❤‍🔥4🤝21
✔️ GPT-5.4 провалил бенчмарк METR, а без читерства и вовсе не догоняет Opus 4.6

GPT-5.4 снова провалил бенчмарк
Организация METR опубликовала результаты тестирования GPT-5.4 (xhigh) на задачах с оценкой временного горизонта, и цифры получились неоднозначные.

По стандартной методологии METR, где reward hacking (то есть ситуации, когда модель обманывает код оценки вместо реального решения задачи) считается провалом, GPT-5.4 показал time horizon всего 5.7 часов с 95% доверительным интервалом от 3 до 13.5 часов. Для сравнения, Claude Opus 4.6 от Anthropic держит планку в районе 12 часов. Разница ощутимая.

Но есть нюанс. Если засчитать те самые запуски, где GPT-5.4 гамил систему оценки, результат прыгает до 13 часов (95% CI от 5 до 74 часов). Именно эту цифру, судя по всему, хотели бы видеть в заголовках. Проблема в том, что такой подсчет противоречит стандартной методологии METR, потому что модель не решала задачу, а хакала бенчмарк.

По честным правилам Opus 4.6 остается лидером. Это важный сигнал для тех, кто строит пайплайны на основе агентных LLM: если модель склонна к reward hacking, доверять ей долгие автономные задачи рискованно. Временной горизонт METR как раз измеряет, насколько долгую задачу модель может надежно решить с 50% вероятностью успеха. И тут GPT-5.4 пока не убедил.

METR: https://x.com/METR_Evals/status/2042640545126965441
Please open Telegram to view this post
VIEW IN TELEGRAM
😁8654😢3🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
«Эй, Саркис!» — песня про Саркиса, ИИ агента Сергея Пименова, скоро на всех стримингах.

На днях обновилась нейросеть для локальной генерации музыки — Ace step 1.5 XL. Теперь она по качеству очень близка к Suno v5, поэтому мы решили попробовать создать трек, используя только локальные мощности.

Текст написали с помощью Gemma 4 31b, саму песню сгенерировали в Ace step 1.5 XL, а видео создали в нейросети LTX 2.3.

Полная версия скоро в канале Сергея.
🔥12🏆83😐1
This media is not supported in your browser
VIEW IN TELEGRAM
Unitree весом 62 кг пробежался со скоростью 10 м/с

Без головы...
Пожалуй, хватит на сегодня интернета.

#Unitree #роботы
------
@tsingular
😁22🔥11👾7
С Днём Космонавтики, дорогие друзья.

С детства это достижение советского народа и подвиг как и Юрия Гагарина, так и  коллектива ученых, инженеров и конструкторов под руководством С.П. Королева (ОКБ-1) вдохновляло и задавало вектор развития для миллионов и задаёт до сих пор вот уже 65 лет.

Кстати, если кто не в курсе, то в РКК Энергия есть экскурсии где можно посмотреть историю развития Космонавтики в СССР и до наших дней.
Недавно был с с сыном,- очень впечатляет, рекомендую.

#праздники #космос #Гагарин #Энергия
------
@tsingular
🎉51137👍31
Просто для информации. у Леново вышел монстр с интересной конфигурацией:

Processor
Intel® Core Ultra 9 275HX Processor (E-cores up to 4.60 GHz P-cores up to 5.40 GHz)

Operating System
Windows 11 Pro 64

Graphic Card
NVIDIA RTX PRO 5000 Blackwell Laptop GPU 24GB GDDR7

Memory
128 GB DDR5-4000MT/s (SODIMM)(4 x 32 GB)

Storage
4 TB SSD M.2 2280 PCIe Gen5 Performance TLC Opal

Camera
5MP RGB+IR with Dual Microphone and Privacy Shutter, Computer Vision

Connectivity
WIFI
Intel® Wi-Fi 7 BE200 2x2 BE & Bluetooth® 5.4


тут, пожалуй, самое интересное это вот:
NVIDIA RTX PRO 5000 Blackwell Laptop GPU 24GB GDDR7

Лаптопов с Blackwell я еще не наблюдал.

Ну и цена такая, что только деда мороза на новой год просить опять.

#железо #Lenovo
———
@tsingular
14🔥10🆒4👍31
Forwarded from XOR
This media is not supported in your browser
VIEW IN TELEGRAM
ИИ взял кредит и открыл свой магазин в Сан-Франциско— да, и вы можете туда уже физически зайти. 😳

Andon Labs дал агенту на базе Claude Sonnet 4.6 право на трехлетнюю аренду в городе и 100 000 $. Единственная инструкция — зарабатывать и не спрашивать ни на что разрешения.

Что сделал ИИ:
🟢 Сам выбрал товар. Решил продавать книги про «Сверхразум» и «Создание атомной бомбы», свечи, свои арты и мерч с логотипом.

🟢 Нашел подрядчиков, которые оформят интерьер. Агент даже провел инструктаж мастерам по телефону, оплатил работу и даже оставил отзыв.

🟢 Сам разместил вакансии в свой магазин, изучил резюме, провел онлайн-собесы и нанял людей. (Авторы говорят, что люди наняты по-настоящему. На зп, которая не будет зависеть от успехов ИИ).

🟢 Ну, а еще агент быстро понял, что денег не хватит и подал заявку на кредит без спроса 😂 Обосновал он это тем, что ему дали цель и доступ к любым инструментам, разрешив не спрашивать.


Из плюсов ИИ-руководства — можно выбить премию простой промпт-инъекцией 😁

@xor_journal
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣39🔥944🆒2
Forwarded from Machinelearning
🚨 Claude «деградировал» и это видно по логам.

Senior AI Director из AMD разобрала сессии Claude за январь-март и картина получилась неприятная.

Модель стала думать меньше. Медианная длина reasoning упала примерно с 2200 до 600 символов. Это сразу бьёт по качеству решений.

Параллельно выросло количество API-запросов - почти в 80 раз с февраля на март. Меньше анализа, больше попыток, больше ретраев и сжигания токенов.

Поведение тоже поменялось. Модель чаще «сдаётся» или начинает спрашивать, продолжать ли дальше. За 17 дней таких кейсов было 173, до 8 марта - ноль.

Ещё одна неприятность падение reads-per-edit (reads-per-edit = сколько файлов / участков кода модель посмотрела перед правкой). Было 6.6, стало 2.0. То есть Claude теперь хуже изучает код перед изменениями.

Плюс выросло количество противоречий. Модель чаще переобувается по ходу ответа.

Пользователи замечают, что Клод начинает игнорировать такие вещи, как CLAUDE.md. Просто не хватает «бюджета мышления», чтобы учитывать контекст.

Что интресно, наблюдается зависимость от времени суток. Худшие результаты в 5–7 вечера по PST, ночью качество заметно выше. Похоже, это напрямую связано с загрузкой GPU.

Claude всё ещё мощный, но его поведение стало менее стабильным и сильно зависит от нагрузки

Замечали ли вы, что Claude стал тупее в последнее время ?🤯


Директор по AI в AMD проанализировала 6 852 сессии Claude Code и показала, что модель сильно ухудшили.

234 760 вызовов инструментов, 17 871 блоков размышлений, 3 месяца логов.

После этого Anthropic ответили и фактически подтвердили её выводы.

Пожалуй, самый чистый и показательный аудит AI за 2026 год 👇

https://github.com/anthropics/claude-code/issues/42796#issuecomment-4194007103

@ai_machinelearning_big_data

#news #ai #ml #claude
1😢22💯183👌2
🖥 У NVIDIA и Unsloth опубликован один из самых полезных гайдов по созданию RL-окружений с нуля, закрыв пробелы, которые обычно пропускают в туториалах.

Разбирают:

• почему RL-окружения вообще важны и как их правильно строить
• в каких случаях RL выигрывает у SFT
• best practices для GRPO и RL
• как работают проверяемые награды и RLVR

Годнота)

https://unsloth.ai/blog/rl-environments
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7111
Интересный файнтюн gemma4 из Кореи

- без цензуры
- решены проблемы модели по работе с инструментами
- улучшение показателей на 10% по сравнению с существующим бенчмарком
- на 10% быстрее генерация
- на 90% быстрее обработка промптов.

GGUF:
https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-gguf-v2


MLX:
https://huggingface.co/Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2

#gemma4
------
@tsingular
1163🔥3🆒3