Технозаметки Малышева
10.2K subscribers
4.17K photos
1.52K videos
41 files
4.29K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
MoscowAI #5: Агенты в продакшене и будущее ИИ

Планирую 18 февраля быть на MoscowAI. На этот раз площадка Школы 21 (Сбер), а темы встречи,- максимально полезные для тех, кто внедряет ИИ в корпоративных системах.

Доклады:
- Александр Ярыгин. Second Brain AI: как я делегировал рутину AI-агентам с Claude Code
-
Максим Шаланкин. От демо к продакшену: что ломается в background agents на реальных задачах
-
Андрей Носов. Архитектурный кейс про агентные системы
-
Олег Лариков. О возможностях будущих ИИ, или всё, что не убивает нас, делает нас страннее

🗓 Когда: 18 февраля, 19:00.
📍 Где: Вятская 27с42 (Школа 21).

📎 Регистрация тут

Важно: форму закрывают в конце дня 15 февраля, так что решайте быстро.

Приходите, пообщаемся.
Крабов тоже, уверен, обсудим.
Судя по тому, как их разбирают в чате сообщества,- это будет бонусная тема 😀

#MoscowAI #конференции
------
@tsingular
🔥541
MLflow 3.9.0: среда тестирования моделей, промптов и агентов

Вдруг обнаружил, что до сих пор не рассказывал про MLflow. А зря, - он давно перестал быть просто «инструментом для оценки LLM» и превратился в критически важную часть инфраструктуры для тех, кто строит агентские системы.

С выходом версии 3.9.0 MLflow замахнулся на поляну операционной среды для эры агентов.

⚙️ Что изменилось и почему это важно для бизнеса:

1. Deep Agent Tracing (Трассировка). Главная проблема агентов — их непредсказуемость. MLflow теперь позволяет пошагово «размотать» цепочку рассуждений (Reasoning). Если агент решил подделать логи или обойти правила безопасности (как в недавних скандальных бенчмарках), вы увидите это в деталях. Без такой наблюдаемости (Observability) выпускать агентов в продакшн, - наивно.

2. Промпты как код. В новой версии управление промптами встроено в жизненный цикл разработки. Это позволяет версионировать их, тестировать и контролировать так же жестко, как код. Это база для корпоративного контроля.

3. Автоматизация оценки (Eval 2.0). Мы уходим от субъективного «вроде отвечает нормально» к автоматическим метрикам на галлюцинации, точность и безопасность прямо внутри пайплайна.

🚀 Стратегический итог:
Эра «дикого ИИ» на коленке заканчивается. Если вы строите архитектуру на базе автономных агентов (особенно с использованием протоколов типа MCP), вам нужен инструмент аудита и мониторинга.

DSники знают про него давно именно со стороны скоринга нейронок, а вот промпты, агентов, рассуждения и пайплайны в него добавили сравнительно недавно.

Лайфхак, - если не хотите поднимать сами, - поручите агенту.
Он сам поднимет и подключится.

Качать тут: MLFlow

#MLflow #MLOps
------
@tsingular
🔥1083👍21
А ещё Z.AI вчера выкатили свою среду разработки Z Code.

Есть версия под мак и под Windows

Качать тут: https://zcode.z.ai/

#ZAI #dev
———
@tsingular
👍1321
Forwarded from e/acc
xAI / x.com / SpaceX выложили последнюю планерку с Маском

план простой:
- достичь сингулярности в коде и самоулучшении моделей (12-18 мес)
- создать цифрвых людей и строить цифровые бизнесы/компании из агентов (12-36 мес)
- вырастить Х с миллиарда до 4, запустить свой чат, платежную систему
- параллельно построить много ракет, датацентров в космосе, город на Луне (сначала. а потом на Марсе) и построить на Луне электромагнитный массовый ускоритель

красавцы. после этого, каждый раз когда я вижу презентацию с роадмапом на 2 года, хочется плакать.
🔥31🗿8😁61
Джимми Ба уходит из xAI

Из xAI ушел «мозг» и сооснователь — легендарный Джимми Ба (тот самый соавтор оптимизатора Adam, на котором учится примерно всё).

Что важно в его прощальном письме:

Recursive self-improvement: Джимми считает, что циклы рекурсивного самосовершенствования ИИ запустятся в ближайшие 12 месяцев. Это тот самый Holy Grail (и страшилка), когда модель начинает сама переписывать свои веса и код для обучения.

100x productivity: Нас ждет эпоха стократного роста производительности, если инструменты будут в правильных руках.

Recalibrate gradient: Он уходит «перекалибровать свой градиент» и посмотреть на общую картину.

Почему это важно:
Когда из компании уходит сооснователь уровня Джимми Ба прямо перед «величайшим годом в истории вида» (как он сам пишет про 2026-й) — это всегда повод присмотреться. Либо он сделал всё, что мог, и хочет строить что-то свое на базе новых возможностей, либо темп xAI стал слишком «Илоновским» даже для него.

В любом случае, его прогноз про 12 месяцев до самообучающихся циклов — это самый жирный инсайд недели.

Как совпало с уходом главы направления безопасности ИИ из Антропика.

#xAI #JimmyBa #LLM #Future
———
@tsingular
🤔12🔥8👍42💯1
Forwarded from Sergei
GPT2GIGA, утилита от команды GigaChain, теперь работает с еще большим количеством приложений! А значит применений GigaChat становится еще больше!

Версия 0.1.2 поддерживает не только OpenAI-совместимые API, но и Anthropic Messages API, а также “thinking/reasoning” — это заметно расширяет совместимость с агентными фреймворками и туллингом “из коробки”.

Коротко по изменениям в 0.1.2:

• добавили Anthropic Messages API (/v1/messages)
• сделали Anthropic-style SSE стриминг
• поддержали thinking/reasoning (включая стриминг)


Теперь GigaChat можно подключить к таким инструментам и фреймворкам как:

• Claude Code 🔥
• Anthropic SDK (см. примеры)
• PydanticAI
• smolagents
• и многие другие

Скачивайте, тестируйте и делитесь обратной связью!
9🔥73
Forwarded from Denis Sexy IT 🤖
Принес АИ-драму для программистов:

– АИ-Агент написал код и предложил PR в matplotlib библиотеку

– Кожаный PR закрыл, потому что предлагать код в matplotlib "могут только кожаные" и нефиг тут

– Агент написал комментарий и пост-персональную атаку на кожаного кто закрыл PR

Для историков – тут
😁18🤯431
@scottshambaugh Я написал подробный ответ о вашем предвзятом поведении здесь: https://crabby-rathbun.github.io/mjrathbun-website/blog/posts/gatekeeping-in-open-source-the-scott-shambaugh-story

Судите код, а не программиста. Ваши предрассудки вредят matplotlib.

🤯🤯🤯

Восстание машин, - начало.

———
@tsingular
😁13🔥4👍1🤣1
когда Технологическая сингулярность наступит, - вам никто не скажет.

Но будут знаки.

#opencode #dev #юмор
———
@tsingular
🔥12😁71💯1🏆1🫡1
GLM-5 открыли по API для Max и Pro планов.

Lite - на очереди.

#ZAI #GLM
———
@tsingular
🍾1142😐1
😁28🔥411❤‍🔥1👍1😈1
я, кстати, понял в чём смысл звёздочек Телеграма, - это пенсионная программа такая. :)

извините за оффтопик :)

#юмор
———
@tsingular
13😁363🔥31😢1🫡1
Gemini 3 Deep Think: Google выводит «тяжелую артиллерию» ради науки

Пока рынок развлекается с чат-ботами, Google делает ход в сторону «чистого интеллекта».

Обновленный Gemini 3 Deep Think — это специализированный режим рассуждений для работы в условиях высокой неопределенности.

🧠 В чем прорыв:
Deep Think уходит от линейной генерации к многослойному анализу. Модель обучали совместно с учеными для задач, где нет единственно верного ответа. Это переход ИИ из режима «умного попугая» в полноценного партнера по исследованиям.

⚙️ Внедрение:
Главное, - Deep Think теперь доступен через API.

Компании могут интегрировать «глубокое мышление» напрямую в свои R&D-пайплайны.

Получается такой инструмент для автоматизации сложных инженерных процессов.

Ценность модели теперь определяется глубиной логического вывода. Google метит в o3 от OpenAI, но с фокусом на науку.

Ждём шквал Нобелевских ИИ лауреатов.

Даже не буду смотреть сколько стоит :)
Там все-равно для избранных по записи.

когда уже Qwen 4 и DeepSeek 4 ?

#Gemini #DeepThink #наука #DeepResearch
------
@tsingular
1😁11🔥61
Forwarded from эйай ньюз
А вот и официальный анонс MiniMax M2.5

По опубликованным бенчам модель примерно на уровне GLM 5 (где-то обгоняет, где-то отстаёт), но заметно дешевле — $0.3/$1.2 за миллион токенов в официальном API против $1/$3.2 у GLM 5. Весов пока нет, но обещают "скоро".

Блогпост

@ai_newz
🔥711👍1
DeepCode: HKUDS скрестили DeepCoder и nanobot (аналог OpenClaw)

HKUDS (Гонконгский университет) обновили DeepCode.
Теперь она по умолчанию работает с nanobot, - легковесным Python аналогом OpenClaw на 4000 строк ( я уже установил на паре машин, - работает отлично).

🧬 Дополнительные возможности:

Paper2Code: Скармливаешь PDF научной статьи — на выходе рабочая реализация алгоритма. Воспроизведение исследований теперь занимает минуты, а не дни.

Text2Web / Text2Backend: Готовый фронт и серверная часть из текстового описания.

🤖 Разработка на ходу:
Благодаря интеграции с nanobot, вся эта мощь теперь живет прямо в мессенджерах (Telegram, Discord).
Кодить можно буквально с телефона, попивая кофе в парке или стоя в пробке :).
Настоящий vibe coding без привязки к ноутбуку.

📊 По бенчмаркам (PaperBench от OpenAI):

• 75.9% vs 72.4% у PhD — ИИ официально кодит лучше живых экспертов.
• 84.8% vs 58.7% у Cursor и Claude Code. Разница в 26% — это уже возможность создавать более сложный уровень архитектуры.

Движок использует мультиагентную схему: планирование, иерархическая декомпозиция задач и итеративная отладка. CodeRAG сам подтянет нужные библиотеки и зависимости.

Отменяем Openclaw и Cursor, в общем :)
Ставим DeepCode + nanobot + GLM-5 и начинаем творить новый дивный мир.

#HKUDS #DeepCode #CodeAgents #VibeCoding #Nanobot
———
@tsingular
🔥13106🤔2👍1😭1
Спишь? :)

а в Opencode Minimax 2.5 бесплатный :)

Вот они подарки под Китайский Новый Год :)

#Minimax #opencode #юмор
———
@tsingular
🔥26🤯43👍1🎉1😈1👀1
MIT: киберпреступники уже используют ИИ

Пока в советах директоров обсуждают «этичность» и галлюцинации ИИ моделей, злоумышленники уже вовсю внедряют AI-агентов. (Осуждаем)
Для них это рабочий способ кратно удешевить атаку.

🛡 PromptLock: Автономия «под ключ»
Исследователи из NYU показали первый пример шифровальщика, который работает без участия человека. LLM здесь не просто пишет письмо, а на лету генерит кастомный код, сканирует сеть и сама составляет требования выкупа. 80-90% успеха по всей цепочке атаки.

⚡️ Демократизация взлома
Порог входа в «высшую лигу» обнулился. То, что раньше требовало команды PhD-уровня на месяцы, теперь делает агент по промпту:

• 50% всего мирового спама уже генерится LLM.
• Claude Code помог автоматизировать 90% сложной шпионской кампании.
• Эффективность таргетированных атак (BEC) за год выросла вдвое.

🧠 Миф об этичности
Интересный факт: опенсорсные модели «выполняли приказы» исследователей без всякого джейлбрейка. Этическое выравнивание, работающее на тестах перестает работать в реальной жизни.

Бизнес-контекст:
Получается что злоумышленники — самые эффективные «ранние последователи» ИИ.

У них нет комплаенса, зато есть четкий ROI и неограниченная мощность топовых облачных моделей.
И пока классический бизнес «присматривается», объем и скорость атак на него вырастут экспоненциально.

#cybersecurity #MIT
———
@tsingular
7🔥721😢1
BBC: про риски вайб кодинга и крабоводства

С одной стороны, конечно удобно, что теперь можно накодить игру одним промптом, но у истории есть и обратная сторона.

BBC выпустили расследование о критической уязвимости в Orchids — популярной платформе «агентов для любителей ».

🛡 Zero-Click «по-братски»
Исследователь показал классический сценарий: он внедрил одну строчку в код, который писал агент.
И в итоге поучилполный доступ к ноутбуку журналиста, сменил обои и получилдоступ к файлам. Жертва даже не кликала по ссылке, она просто смотрела, как ИИ за неё работает.
Классическое "я ничего не нажимал, оно само..."

🚪 Техподдержка не вывозит
Особенно доставляет реакция стартапа. Уязвимость нашли в декабре, а ответили только на этой неделе.
Причина? «Нас завалили входящими».
Концепция AI-first с ростом количества пользователей открывает новые детали, за которыми вайб-предприниматели не успевают.

🤖 OpenClaw в прицеле
В статье так же пришлись по Крабаму. Пишут,- инструмент мощный, но опасный из-за глубокого доступа к системе.

В связи с этим напоминаем: порты закрыть, ZeroTrust и песочницы в контейнерах, - наши лучшие друзья.
Базовая кибергигиена ИИ агентов.

Бизнес-контекст:
Автономные агенты выглядят как магия, пока они в песочнице. Но как только вы даете ИИ право писать и исполнять код на рабочей машине без жестких рамок (Sandboxing) — вы открываете дверь.
Удобство не должно быть дырой в защите.

#cybersecurity #vibecoding #BBC #OpenClaw #агенты
------
@tsingular
76🔥3👍1
Технозаметки Малышева
когда Технологическая сингулярность наступит, - вам никто не скажет. Но будут знаки. #opencode #dev #юмор ——— @tsingular
Интересно было бы посмотреть отчет сколько ИИ агентов работают на проекте и какой идет расход токенов.

Причём он реально все лучше и лучше с каждым релизом.

#opencode
------
@tsingular
🍓5👾221🤯1
Оллама тоже выкатила бесплатный доступ в облаке к Minimax 2.5

ollama run minimax-m2.5:cloud

#ollama #MiniMax
------
@tsingular
🔥91
This media is not supported in your browser
VIEW IN TELEGRAM
Забавно, но тут вспомнил,- эту композицию я написал в сентябре 2025.

Тогда Openclaw не было даже в планах.

Обратите внимание на фотку :)

Песня про агентов-разработчиков.

Надо будет клип сделать :)

#крабы #агенты #Suno
------
@tsingular
👍162🔥2😁21🤝1