Технозаметки Малышева
8.25K subscribers
3.71K photos
1.39K videos
40 files
3.9K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
🔬 Новая фича Deep Research от OpenAI

OpenAI представила новую функцию Deep Research для ChatGPT - возможность глубокого исследования темы с анализом множества источников.

Возможности:
- Глубокий веб-поиск с анализом источников
- Работа с загруженными файлами
- Создание подробных аналитических отчётов
- Пошаговое объяснение своих выводов
- Поддержка разных форматов вывода (таблицы, списки, текст)

Ограничения:
- Только для Pro-подписчиков
- Лимит 100 запросов в месяц (из-за высокой вычислительной нагрузки)
- Пока нет доступа для UK и ЕЭС
- Может занимать много времени на обработку ( ~30 минут)

Технические особенности:
- Использует улучшенную версию модели OpenAI o3
- Требует огромных вычислительных ресурсов
- Умеет верифицировать источники
- Может создавать артефакты (графики, код, SVG)

Планы развития:
- Скоро выйдет облегчённая версия
- Добавят поддержку специализированных источников данных (корпоративных в т.ч.)
- Планируют интеграцию с подпиской Plus и Team
- Обещают релиз на мобильных устройствах

Звучит круто, но... знакомо :)
DeepSeek уже месяц как запустил аналогичную функциональность через связку DeepThink + WebSearch. И работает, надо сказать, весьма неплохо!

Но самое интересное - подобные решения уже давно существуют на уровне энтузиастов и небольших проектов. Например, уже больше года такой функционал доступен у меня в ботах. А пол года назад я даже накидал локального "Исследователя" для личных целей, который за ночь может сгенерировать 120-страничный отчет с анализом 5000+ источников. И все это на обычном домашнем GPU!

Т.е. OpenAI, имея миллиардные инвестиции, выпускает функционал, который по сути можно было реализовать на уровне студенческого проекта.

При этом их решение требует космических вычислительных ресурсов - настолько, что даже Pro-пользователям дают только 100 запросов в месяц.

В общем, складывается впечатление, что OpenAI просто "догоняет" существующие решения, но с большим шумом и пафосом. А ведь от компании с такими ресурсами хотелось бы видеть что-то действительно инновационное!

Метрики выглядят интересно, пожалуй.
Humanity Last Exam 26.6%

#OpenAI #AI #DeepResearch #Research
———
@tsingular
👍8❤‍🔥61
🚀 16x Prompt: Мощный инструмент для разработчиков, который делает работу с AI в разы эффективнее

Главные фишки для разработчиков:

1. Умное управление контекстом кода:
- Автоматически собирает и организует код из разных файлов
- Позволяет фильтровать и группировать файлы
- Поддерживает работу с большими проектами (до 500 файлов в контексте)

2. Работа с разными AI-моделями:
- Прямая интеграция с Claude 3.5 Sonnet и GPT-4
- Возможность сравнить ответы разных моделей side-by-side
- Поддержка локальных моделей через Ollama

3. Оптимизация промптов:
- Готовые шаблоны для типовых задач (рефакторинг, новые фичи, баги)
- Сохранение часто используемых промптов
- Автоматическая оптимизация контекста под лимиты токенов

Последние обновления (февраль 2025):

🆕 Версия 0.0.98:
- Поддержка новой модели o3-mini
- Оптимизация подсчета токенов для длинных текстов

🔥 Версия 0.0.97:
- Добавлен вывод reasoning в API-ответах
- Интеграция с DeepSeek, DeepInfra и Fireworks
- Настройка max output tokens для сторонних API
Забавно, что инструмент сам использует AI для своего развития - около 80% кода последних релизов написано с помощью самого 16x Prompt. Прямо рекурсия какая-то получается! 😅

В общем, если вы работаете с AI в разработке, особенно с большими проектами - однозначно стоит попробовать. Экономит кучу времени на составлении и хранении промптов и работе с контекстом.

Не заменяет Cursor и VSCode
Отдельное спасибо Алексу (@alyxst) за наводку.

#16xPrompt #dev
———
@tsingular
4🔥21👍1🆒1
Помните я говорил, что следующим президентом США будет ИИ?

Маск прям строит железобетонный фундамент для этого.

#elonmusk #government #doge
------
@tsingular
💯38👍98👾41
Новые фреймворки объединяют лучшие практики MLOps и LLMOps

Разработчики представили два взаимодополняющих фреймворка для оптимизации ML/LLM проектов.
Ключевые компоненты включают RAG-систему с синтетическими данными, MLflow для логирования, Guardrails для защиты данных.
FastAPI обеспечивает развертывание, а Poetry управляет зависимостями.
Архитектура основана на SOLID-принципах с DAG-ориентированными пайплайнами.
Реализована интеграция с AWS Fargate, поддержка контейнеров и YAML-конфигурации.
Проекты предоставляют готовую инфраструктуру для быстрого старта промышленных ML/LLM решений.

Теперь ML-инженерам не придется изобретать велосипед - все основные компоненты уже собраны в одном месте 🚲

https://github.com/callmesora/llmops-python-package

https://github.com/fmind/mlops-python-package

#MLOps #Python #RAG
-------
@tsingular
👍522
🔬 Constitutional Classifiers: Как Anthropic создала универсальную защиту от джейлбрейков

Интересный пейпер от команды Anthropic по безопасности AI! Давайте разберем технические детали их нового метода защиты языковых моделей.

🎯 Суть проблемы:
- Существующие LLM уязвимы к джейлбрейкам (обходу защиты через запросы)
- Классические атаки используют длинные промпты или необычное форматирование (типа uSiNg wEiRd cApS)
- За 10 лет никто не создал по-настоящему надежной защиты. (Команда Lakera.ai удивлённо вскинула брови и поперхнулась кофе :) )?

⚙️ Техническое решение:
1. Создается "конституция" - набор правил о разрешенном/запрещенном контенте
2. С помощью Claude генерируются синтетические промпты и ответы для всех категорий
3. Данные аугментируются: переводы на разные языки, стилизация под известные джейлбрейки
4. На этих данных тренируются два классификатора:
- Для входящих запросов
- Для исходящих ответов модели

🧪 Результаты тестирования:
- 183 специалиста по джейлбрейкам
- >3000 часов попыток взлома
- Награда $15,000 за успешный универсальный джейлбрейк
- Результат: ни одного успешного взлома!

📊 Автоматизированные тесты:
- Базовая модель блокировала только 14% продвинутых джейлбрейков
- С Constitutional Classifiers: блокируется 95.6%
- Увеличение ложных срабатываний всего на 0.38%
- Вычислительные затраты выросли на 23.7%

🔍 Технические особенности:
- Классификаторы обучаются на синтетических данных
- Важна разметка "безвредных" категорий для снижения ложных срабатываний
- Система может быстро адаптироваться к новым типам атак
- Используется подход, похожий на Constitutional AI

💭 Интересный момент: система не обещает 100% защиты, но делает джейлбрейки настолько трудоемкими, что они теряют практический смысл. Это похоже на подход к безопасности в криптографии!

⚡️ Особенно впечатляет баланс между защитой и практичностью - менее 1% увеличения ложных срабатываний при блокировке 95.6% атак. Это реально прорыв в области безопасности AI.

🤔 Anthropic сейчас проводит публичное тестирование этой системы. Будет интересно увидеть, найдут ли участники какие-то новые способы обхода защиты.
Попробовать свои силы можно тут:
https://claude.ai/constitutional-classifiers
(через VPN)

Вообще 24% - ничтожное увеличение накладных расходов за 95.5% фильтрации.

Очень крутой подход.

#Anthropic #security #jailbreak
———
@tsingular
532🔥2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Cline - ИИ-агент для автономной разработки прямо в IDE

Вы будете смеяться, но у нас новый автономный разработчик.

VSCode
плагин интегрируется с терминалом, браузером, менеджерами пакетов, БД и системами тестирования.

Поддерживает OpenRouter, Anthropic, OpenAI, Google Gemini и локальные модели через LM Studio/Ollama.

Работает с подтверждениями человека: каждое действие требует утверждения, а изменения отображаются в режиме сравнения с возможностью отката.

Расширяемая архитектура на Model Context Protocol позволяет создавать собственные инструменты.

#Cline #VSCode #DevTools
———
@tsingular
👍82
This media is not supported in your browser
VIEW IN TELEGRAM
Как я и говорил, - этих DeepResearcher-ов - уже много.

А с моделями DS-V3 под рукой они собираются "на раз" любым студентом.

Зашел в LinkedIn - вся лента в этих Исследователях.

Ссылки:
Инструкция а AutoGen он Microsoft:
https://microsoft.github.io/autogen/dev/user-guide/core-user-guide/index.html

Готовый открытый рисёрчер:
https://github.com/mshumer/OpenDeepResearcher

#Researcher
———
@tsingular
8👍21👨‍💻1
⚡️ Китай наносит новый удар. 🔥

ByteDance выпустила OmniHuman-1, модель для создания реалистичных видео на основе одного изображения.

OmniHuman
-1 - работает на основе диффузионного преобразования, которая генерирует высокореалистичные видео на основе изображения и аудио/видео.

В модели реализовано обучение с учетом всех условий окружения, что позволяет масштабировать генерацию, создавать связанные с движением и значительно повысить реалистичность жестов и движений тела.

В отличие от предыдущих моделей, ограниченных лицевой или статичной анимацией тела, OmniHuman-1 поддерживает различные соотношения сторон, сложные взаимодействия человека и объектов вокруг.

Она превосходит существующие методы по реалистичности, достигая высокой точности синхронизации губ, точности жестов и выразительности лица.


→ Модель построена на архитектуре DiT (Diffusion Transformer), поддерживает мультимодальность.

→ Превосходит конкурентов (например, Loopy, CyberHost, DiffTED) по точности синхронизации губ (5,255 против 4,814), FVD (15,906 против 16,134) и выразительности жестов, при этом поддерживая различные пропорции тела в одной модели.

https://huggingface.co/papers/2502.01061

@data_analysis_ml
🔥19🆒3
This media is not supported in your browser
VIEW IN TELEGRAM
Postman запускает визуальный конструктор AI-агентов

Postman представил инструментарий для создания ИИ-ассистентов без написания кода.
Платформа интегрирует 100,000+ публичных API и ведущие LLM-модели через визуальный интерфейс.
Разработчики получили доступ к верифицированным API от более чем 18,000 компаний.
Функционал включает тестирование промптов, сравнение производительности моделей и мониторинг в реальном времени.
Инструмент позволяет создавать event-driven агентов для автоматизации клиентской поддержки, управления инцидентами и документирования.

Теперь даже джуниор сможет собрать своего киборга-помощника из кубиков 🤖

Вот это поворот. 🔝
Postman становится в один ряд с Langchain, Langflow и n8n

#Postman #NoCode #агенты
-------
@tsingular
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥113🤔3🆒3
HuggingFace представил агента-исследователя Open Deep Research

HuggingFace выпустил open-source версию DeepResearch на основе библиотеки SmolAgents.

Ключевая особенность - использование кода вместо JSON для управления действиями агента.

Система включает веб-браузер и текстовый инспектор для работы с различными форматами файлов.

На валидационном наборе GAIA достигнут результат 54%, что на 8% выше предыдущего рекорда Magentic-One.

Теперь любой может создать своего научного ассистента. OpeanAI в панике! :)

Т.е. за $250 вы получаете недоделанный забагованный Researcher от OAI или можно взять бесплатный открытый от HF с метриками немногим ниже...
Сложный выбор.

Ну что, делаем бота рассуждатора? :)
Пишите в комментариях.
Кстати, на запчасти боту собираю тут

#HuggingFace #DeepResearch #SmolAgents
-------
@tsingular
100🤯4🆒2❤‍🔥11
Forwarded from AI для Всех (Artemii)
Калифорнийский Университет запускает AI-систему: что важно знать 🎓

Калифорнийский государственный университет объявил о внедрении AI во все 23 кампуса. Что это значит на практике:

Основные изменения 📚
• ChatGPT Edu станет доступен для всех студентов и преподавателей – это специальная версия с расширенными возможностями для образования
• Появится единый AI Commons Hub с инструментами для обучения и исследований
• Запускаются программы стажировок с ведущими tech-компаниями

Почему это действительно важно 🔍
1. Масштаб: это крупнейшее внедрение AI в образовании (460 000+ студентов)
2. Практический подход: студенты получают реальные навыки работы с AI, востребованные на рынке
3. Доступность: все инструменты бесплатны для студентов и преподавателей

Интересный факт: сейчас более 50% AI-специалистов в США – иностранцы. CSU планирует изменить эту статистику, готовя местные кадры.

Анонс от CSU
Анонс от OpenAI
👍4
Минутка n8n

Если добавить к почтовому агенту диалоговую память, - он сможет решать такие задачи, как:

Посмотри что у нас в почте есть на тему "Искуственный интеллект".

Т.е. сам на предмет этой темы прочитает последние входящие, выделит оттуда адресатов, запишет их и потом ещё раз из почты возьмёт письма только от этого адресата, проанализирует их и вернёт результат.

Это избавляет от необходимости указывать точный адрес отправителя в сценариях, где это допустимо.

#n8n #dev
———
@tsingular
🔥53🆒3
Blackwell: NVIDIA выпускает монстра с 72-мя GPU в одной стойке

CoreWeave запустил первые облачные инстансы на базе NVIDIA GB200 NVL72.
Система объединяет 72 GPU Blackwell и 36 CPU Grace с жидкостным охлаждением.
Ключевые преимущества: в 30 раз быстрее инференс LLM, в 4 раза ускоряет обучение, 25-кратный прирост производительности при той же мощности.
Технические особенности: NVLink 5.0, поддержка FP4, сеть Quantum-2 InfiniBand (400 Гб/с на GPU).
Масштабируемость до 110,000 GPU с пропускной способностью 130 ТБ/с в одном домене.

Вот бы на нём Doom запустить. :)

#NVIDIA #Blackwell #CoreWeave
-------
@tsingular
👍8👾3
Adobe встроила контрактного юриста в Acrobat

Популярный PDF-редактор получил функцию анализа юридических документов.
Инструмент сокращает время проверки контрактов с 45 до 10 минут, обеспечивая 70-80% экономии времени.
Система автоматически находит ключевые условия, составляет краткое содержание и сравнивает версии документов.
Обработка происходит в облаке без долговременного хранения данных за $4.99/месяц.
Функционал актуален, учитывая что 70% пользователей подписывают договоры не понимая условий, а 64% предпринимателей избегают контрактов из-за юридической неуверенности.

Юристы на выход :) 🤵‍♂️😅

#Adobe #Acrobat #LegalTech
-------
@tsingular
🤔5🔥3👍21👨‍💻1
Forwarded from Илья AGI TV 🤖
This media is not supported in your browser
VIEW IN TELEGRAM
#Kling выпустили класную фичу, теперь можно миксовать на видео: Человека + Среду + Объект 🔥

Вообще из всех видео генераторов, Kling пока что самый лучший имхо

🔗 klingai.com
👍12🔥71
Зловещая долина, - просто привет.

https://t.me/ilia_plasma/618

Unitree учат на движениях спортсменов

И тут уже мне немного жутковато, потому что создаётся стойкое ощущение, что они живые, при том, что умом понимаешь, что - нет.

Т.е. их накормят всеми записями олимпиад и спортивных матчей. И через год можно будет выпускать на стадион.

#Unitree #robots
------
@tsingular
👀123🔥3
В Langflow 1.1.4 появился ШАБЛОН Deep Researcher!

Просто, то, что вчера вышло за $250, как прогрессивная разработка,- сегодня бесплатный шаблон в nocode.

Т.е. он сам, декомпозирует задачу, пишет план, вызывает агента с поиском на выполнение этого плана и подводит итог.
Упрощённо, конечно, но это все-таки шаблон.
Все компоненты заменяемы.
любой поиск или локальные модели подключаются за пару минут.

Это просто праздник какой-то. :)

#langflow #nocode #research
———
@tsingular
4🔥3👌3