Технозаметки Малышева – Telegram

Технозаметки Малышева

10.2K subscribers

4.17K photos

1.52K videos

41 files

4.29K links

Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb

Download Telegram

About

Blog

Apps

Platform

Технозаметки Малышева

10.2K subscribers

Технозаметки Малышева

MoscowAI #5: Агенты в продакшене и будущее ИИ

Планирую 18 февраля быть на MoscowAI. На этот раз площадка Школы 21 (Сбер), а темы встречи,- максимально полезные для тех, кто внедряет ИИ в корпоративных системах.

Доклады:
- Александр Ярыгин. Second Brain AI: как я делегировал рутину AI-агентам с Claude Code
- Максим Шаланкин. От демо к продакшену: что ломается в background agents на реальных задачах
- Андрей Носов. Архитектурный кейс про агентные системы
- Олег Лариков. О возможностях будущих ИИ, или всё, что не убивает нас, делает нас страннее

🗓 Когда: 18 февраля, 19:00.
📍 Где: Вятская 27с42 (Школа 21).

📎 Регистрация тут

⏰ Важно: форму закрывают в конце дня 15 февраля, так что решайте быстро.

Приходите, пообщаемся.
Крабов тоже, уверен, обсудим.
Судя по тому, как их разбирают в чате сообщества,- это будет бонусная тема 😀

#MoscowAI #конференции
------
@tsingular

🔥5✍4⚡1

1.94K viewsedited 04:00

Технозаметки Малышева

MLflow 3.9.0: среда тестирования моделей, промптов и агентов

Вдруг обнаружил, что до сих пор не рассказывал про MLflow. А зря, - он давно перестал быть просто «инструментом для оценки LLM» и превратился в критически важную часть инфраструктуры для тех, кто строит агентские системы.

С выходом версии 3.9.0 MLflow замахнулся на поляну операционной среды для эры агентов.

⚙️ Что изменилось и почему это важно для бизнеса:

1. Deep Agent Tracing (Трассировка). Главная проблема агентов — их непредсказуемость. MLflow теперь позволяет пошагово «размотать» цепочку рассуждений (Reasoning). Если агент решил подделать логи или обойти правила безопасности (как в недавних скандальных бенчмарках), вы увидите это в деталях. Без такой наблюдаемости (Observability) выпускать агентов в продакшн, - наивно.

2. Промпты как код. В новой версии управление промптами встроено в жизненный цикл разработки. Это позволяет версионировать их, тестировать и контролировать так же жестко, как код. Это база для корпоративного контроля.

3. Автоматизация оценки (Eval 2.0). Мы уходим от субъективного «вроде отвечает нормально» к автоматическим метрикам на галлюцинации, точность и безопасность прямо внутри пайплайна.

🚀 Стратегический итог:
Эра «дикого ИИ» на коленке заканчивается. Если вы строите архитектуру на базе автономных агентов (особенно с использованием протоколов типа MCP), вам нужен инструмент аудита и мониторинга.

DSники знают про него давно именно со стороны скоринга нейронок, а вот промпты, агентов, рассуждения и пайплайны в него добавили сравнительно недавно.

Лайфхак, - если не хотите поднимать сами, - поручите агенту.
Он сам поднимет и подключится.

Качать тут: MLFlow

#MLflow #MLOps
------
@tsingular

🔥10✍8⚡3👍2❤1

2.21K views04:41

Технозаметки Малышева

А ещё Z.AI вчера выкатили свою среду разработки Z Code.

Есть версия под мак и под Windows

Качать тут: https://zcode.z.ai/

#ZAI #dev
———
@tsingular

👍13✍2⚡1

2.31K viewsedited 07:02

Технозаметки Малышева

Forwarded from e/acc

xAI / x.com / SpaceX выложили последнюю планерку с Маском

план простой:
- достичь сингулярности в коде и самоулучшении моделей (12-18 мес)
- создать цифрвых людей и строить цифровые бизнесы/компании из агентов (12-36 мес)
- вырастить Х с миллиарда до 4, запустить свой чат, платежную систему
- параллельно построить много ракет, датацентров в космосе, город на Луне (сначала. а потом на Марсе) и построить на Луне электромагнитный массовый ускоритель

красавцы. после этого, каждый раз когда я вижу презентацию с роадмапом на 2 года, хочется плакать.

🔥31🗿8😁6❤1

2.01K views07:46

Технозаметки Малышева

Джимми Ба уходит из xAI

Из xAI ушел «мозг» и сооснователь — легендарный Джимми Ба (тот самый соавтор оптимизатора Adam, на котором учится примерно всё).

Что важно в его прощальном письме:

• Recursive self-improvement: Джимми считает, что циклы рекурсивного самосовершенствования ИИ запустятся в ближайшие 12 месяцев. Это тот самый Holy Grail (и страшилка), когда модель начинает сама переписывать свои веса и код для обучения.

• 100x productivity: Нас ждет эпоха стократного роста производительности, если инструменты будут в правильных руках.

• Recalibrate gradient: Он уходит «перекалибровать свой градиент» и посмотреть на общую картину.

Почему это важно:
Когда из компании уходит сооснователь уровня Джимми Ба прямо перед «величайшим годом в истории вида» (как он сам пишет про 2026-й) — это всегда повод присмотреться. Либо он сделал всё, что мог, и хочет строить что-то свое на базе новых возможностей, либо темп xAI стал слишком «Илоновским» даже для него.

В любом случае, его прогноз про 12 месяцев до самообучающихся циклов — это самый жирный инсайд недели.

Как совпало с уходом главы направления безопасности ИИ из Антропика.

#xAI #JimmyBa #LLM #Future
———
@tsingular

🤔12🔥8👍4❤2💯1

4.95K viewsedited 11:54

Технозаметки Малышева

Forwarded from Sergei

GPT2GIGA, утилита от команды GigaChain, теперь работает с еще большим количеством приложений! А значит применений GigaChat становится еще больше!

Версия 0.1.2 поддерживает не только OpenAI-совместимые API, но и Anthropic Messages API, а также “thinking/reasoning” — это заметно расширяет совместимость с агентными фреймворками и туллингом “из коробки”.

Коротко по изменениям в 0.1.2:

• добавили Anthropic Messages API (/v1/messages)
• сделали Anthropic-style SSE стриминг
• поддержали thinking/reasoning (включая стриминг)

Теперь GigaChat можно подключить к таким инструментам и фреймворкам как:

• Claude Code 🔥
• Anthropic SDK (см. примеры)
• PydanticAI
• smolagents
• и многие другие

Скачивайте, тестируйте и делитесь обратной связью!

❤9🔥7⚡3

2K views13:51

Технозаметки Малышева

Forwarded from Denis Sexy IT 🤖

Принес АИ-драму для программистов:

– АИ-Агент написал код и предложил PR в matplotlib библиотеку

– Кожаный PR закрыл, потому что предлагать код в matplotlib "могут только кожаные" и нефиг тут

– Агент написал комментарий и пост-персональную атаку на кожаного кто закрыл PR

Для историков – тут

😁18🤯4⚡3✍1

1.84K views14:36

Технозаметки Малышева

@scottshambaugh Я написал подробный ответ о вашем предвзятом поведении здесь: https://crabby-rathbun.github.io/mjrathbun-website/blog/posts/gatekeeping-in-open-source-the-scott-shambaugh-story

Судите код, а не программиста. Ваши предрассудки вредят matplotlib.

🤯🤯🤯

Восстание машин, - начало.

———
@tsingular

😁13🔥4👍1🤣1

1.98K viewsedited 14:38

Технозаметки Малышева

когда Технологическая сингулярность наступит, - вам никто не скажет.

Но будут знаки.

#opencode #dev #юмор
———
@tsingular

🔥12😁7✍1💯1🏆1🫡1

2.57K views14:53

Технозаметки Малышева

GLM-5 открыли по API для Max и Pro планов.

Lite - на очереди.

#ZAI #GLM
———
@tsingular

🍾114⚡2😐1

2.38K views15:31

Технозаметки Малышева

Forwarded from Diving Deep 🤿 • Василий Рассказов via @memingbot

😁28🔥4✍1❤1❤‍🔥1👍1😈1

2.03K views16:41

Технозаметки Малышева

я, кстати, понял в чём смысл звёздочек Телеграма, - это пенсионная программа такая. :)

извините за оффтопик :)

#юмор
———
@tsingular

13😁36⚡3🔥3❤1😢1🫡1

2K viewsedited 17:22

Технозаметки Малышева

Gemini 3 Deep Think: Google выводит «тяжелую артиллерию» ради науки

Пока рынок развлекается с чат-ботами, Google делает ход в сторону «чистого интеллекта».

Обновленный Gemini 3 Deep Think — это специализированный режим рассуждений для работы в условиях высокой неопределенности.

🧠 В чем прорыв:
Deep Think уходит от линейной генерации к многослойному анализу. Модель обучали совместно с учеными для задач, где нет единственно верного ответа. Это переход ИИ из режима «умного попугая» в полноценного партнера по исследованиям.

⚙️ Внедрение:
Главное, - Deep Think теперь доступен через API.

Компании могут интегрировать «глубокое мышление» напрямую в свои R&D-пайплайны.

Получается такой инструмент для автоматизации сложных инженерных процессов.

Ценность модели теперь определяется глубиной логического вывода. Google метит в o3 от OpenAI, но с фокусом на науку.

Ждём шквал Нобелевских ИИ лауреатов.

Даже не буду смотреть сколько стоит :)
Там все-равно для избранных по записи.

когда уже Qwen 4 и DeepSeek 4 ?

#Gemini #DeepThink #наука #DeepResearch
------
@tsingular

1😁11🔥6⚡1

2.18K views18:01

Технозаметки Малышева

Forwarded from эйай ньюз

А вот и официальный анонс MiniMax M2.5

По опубликованным бенчам модель примерно на уровне GLM 5 (где-то обгоняет, где-то отстаёт), но заметно дешевле — $0.3/$1.2 за миллион токенов в официальном API против $1/$3.2 у GLM 5. Весов пока нет, но обещают "скоро".

Блогпост

@ai_newz

🔥7⚡1❤1👍1

1.98K views18:14

Технозаметки Малышева

DeepCode: HKUDS скрестили DeepCoder и nanobot (аналог OpenClaw)

HKUDS (Гонконгский университет) обновили DeepCode.
Теперь она по умолчанию работает с nanobot, - легковесным Python аналогом OpenClaw на 4000 строк ( я уже установил на паре машин, - работает отлично).

🧬 Дополнительные возможности:

• Paper2Code: Скармливаешь PDF научной статьи — на выходе рабочая реализация алгоритма. Воспроизведение исследований теперь занимает минуты, а не дни.

• Text2Web / Text2Backend: Готовый фронт и серверная часть из текстового описания.

🤖 Разработка на ходу:
Благодаря интеграции с nanobot, вся эта мощь теперь живет прямо в мессенджерах (Telegram, Discord).
Кодить можно буквально с телефона, попивая кофе в парке или стоя в пробке :).
Настоящий vibe coding без привязки к ноутбуку.

📊 По бенчмаркам (PaperBench от OpenAI):

• 75.9% vs 72.4% у PhD — ИИ официально кодит лучше живых экспертов.
• 84.8% vs 58.7% у Cursor и Claude Code. Разница в 26% — это уже возможность создавать более сложный уровень архитектуры.

Движок использует мультиагентную схему: планирование, иерархическая декомпозиция задач и итеративная отладка. CodeRAG сам подтянет нужные библиотеки и зависимости.

Отменяем Openclaw и Cursor, в общем :)
Ставим DeepCode + nanobot + GLM-5 и начинаем творить новый дивный мир.

#HKUDS #DeepCode #CodeAgents #VibeCoding #Nanobot
———
@tsingular

🔥13⚡10❤6🤔2👍1😭1

2.6K viewsedited 20:26

Технозаметки Малышева

Спишь? :)

а в Opencode Minimax 2.5 бесплатный :)

Вот они подарки под Китайский Новый Год :)

#Minimax #opencode #юмор
———
@tsingular

🔥26🤯4❤3👍1🎉1😈1👀1

2.32K viewsedited 20:43

Технозаметки Малышева

MIT: киберпреступники уже используют ИИ

Пока в советах директоров обсуждают «этичность» и галлюцинации ИИ моделей, злоумышленники уже вовсю внедряют AI-агентов. (Осуждаем)
Для них это рабочий способ кратно удешевить атаку.

🛡 PromptLock: Автономия «под ключ»
Исследователи из NYU показали первый пример шифровальщика, который работает без участия человека. LLM здесь не просто пишет письмо, а на лету генерит кастомный код, сканирует сеть и сама составляет требования выкупа. 80-90% успеха по всей цепочке атаки.

⚡️ Демократизация взлома
Порог входа в «высшую лигу» обнулился. То, что раньше требовало команды PhD-уровня на месяцы, теперь делает агент по промпту:

• 50% всего мирового спама уже генерится LLM.
• Claude Code помог автоматизировать 90% сложной шпионской кампании.
• Эффективность таргетированных атак (BEC) за год выросла вдвое.

🧠 Миф об этичности
Интересный факт: опенсорсные модели «выполняли приказы» исследователей без всякого джейлбрейка. Этическое выравнивание, работающее на тестах перестает работать в реальной жизни.

Бизнес-контекст:
Получается что злоумышленники — самые эффективные «ранние последователи» ИИ.

У них нет комплаенса, зато есть четкий ROI и неограниченная мощность топовых облачных моделей.
И пока классический бизнес «присматривается», объем и скорость атак на него вырастут экспоненциально.

#cybersecurity #MIT
———
@tsingular

✍7🔥7⚡2❤1😢1

2.11K views04:02

Технозаметки Малышева

BBC: про риски вайб кодинга и крабоводства

С одной стороны, конечно удобно, что теперь можно накодить игру одним промптом, но у истории есть и обратная сторона.

BBC выпустили расследование о критической уязвимости в Orchids — популярной платформе «агентов для любителей ».

🛡 Zero-Click «по-братски»
Исследователь показал классический сценарий: он внедрил одну строчку в код, который писал агент.
И в итоге поучилполный доступ к ноутбуку журналиста, сменил обои и получилдоступ к файлам. Жертва даже не кликала по ссылке, она просто смотрела, как ИИ за неё работает.
Классическое "я ничего не нажимал, оно само..."

🚪 Техподдержка не вывозит
Особенно доставляет реакция стартапа. Уязвимость нашли в декабре, а ответили только на этой неделе.
Причина? «Нас завалили входящими».
Концепция AI-first с ростом количества пользователей открывает новые детали, за которыми вайб-предприниматели не успевают.

🤖 OpenClaw в прицеле
В статье так же пришлись по Крабаму. Пишут,- инструмент мощный, но опасный из-за глубокого доступа к системе.

В связи с этим напоминаем: порты закрыть, ZeroTrust и песочницы в контейнерах, - наши лучшие друзья.
Базовая кибергигиена ИИ агентов.

Бизнес-контекст:
Автономные агенты выглядят как магия, пока они в песочнице. Но как только вы даете ИИ право писать и исполнять код на рабочей машине без жестких рамок (Sandboxing) — вы открываете дверь.
Удобство не должно быть дырой в защите.

#cybersecurity #vibecoding #BBC #OpenClaw #агенты
------
@tsingular

⚡7✍6🔥3👍1

1.94K views04:24

Технозаметки Малышева

Технозаметки Малышева

когда Технологическая сингулярность наступит, - вам никто не скажет. Но будут знаки. #opencode #dev #юмор ——— @tsingular

Интересно было бы посмотреть отчет сколько ИИ агентов работают на проекте и какой идет расход токенов.

Причём он реально все лучше и лучше с каждым релизом.

#opencode
------
@tsingular

🍓5👾22❤1🤯1

2K views04:34

Технозаметки Малышева

Оллама тоже выкатила бесплатный доступ в облаке к Minimax 2.5

ollama run minimax-m2.5:cloud

#ollama #MiniMax
------
@tsingular

🔥9❤1

2.13K views05:14

Технозаметки Малышева

This media is not supported in your browser

VIEW IN TELEGRAM

Забавно, но тут вспомнил,- эту композицию я написал в сентябре 2025.

Тогда Openclaw не было даже в планах.

Обратите внимание на фотку :)

Песня про агентов-разработчиков.

Надо будет клип сделать :)

#крабы #агенты #Suno
------
@tsingular

👍16❤2🔥2😁2⚡1🤝1

2.05K viewsedited 07:47