Forwarded from эйай ньюз
У ChatGPT 15,5 миллионов платных подписчиков
По данным The Information, сентября добавилось более 4 миллионов подписчиков. Их доля общем количестве юзеров не растёт и составляет около 5%, а рост в количестве подписчиков обусловлен ростом юзербазы, которая за 2024 год утроилась.
А вот выручка с подписчика растёт - Pro подписка уже приносит больше выручки чем Enterprise, то есть количество Pro подписчиков уже измеряется в сотнях тысяч. При этом всём, по заявлениям Сэма Альтмана, подписка месяц назад была убыточной - OpenAI не расчитывали на такое активное использование. При таких вводных подписка в $2,000 звучит уже не так безумно как несколько месяцев назад.
Ещё быстрее подписок росла выручка с API - за 2024 она выросла в 7 раз, при том что компания несколько раз за 2024 год сбрасывала цены. Вот вам и наглядная иллюстрация парадокса Джевонса.
При этом всём, сколько именно зарабатывают сейчас OpenAI понять трудно. Хоть мы и знаем, что за первое полугодие 2024 проекция выручки удвоилась до $3,4 миллиарда долларов в год, но как повлияли на выручку запуск Voice API и o1 - незвестно. Зато известно что переговоры про новый раунд инвестиций размером в $40 миллиардов, ведутся уже при оценке компании в $260 миллиардов, что на 73% выше оценки в октябре 2024
@ai_newz
По данным The Information, сентября добавилось более 4 миллионов подписчиков. Их доля общем количестве юзеров не растёт и составляет около 5%, а рост в количестве подписчиков обусловлен ростом юзербазы, которая за 2024 год утроилась.
А вот выручка с подписчика растёт - Pro подписка уже приносит больше выручки чем Enterprise, то есть количество Pro подписчиков уже измеряется в сотнях тысяч. При этом всём, по заявлениям Сэма Альтмана, подписка месяц назад была убыточной - OpenAI не расчитывали на такое активное использование. При таких вводных подписка в $2,000 звучит уже не так безумно как несколько месяцев назад.
Ещё быстрее подписок росла выручка с API - за 2024 она выросла в 7 раз, при том что компания несколько раз за 2024 год сбрасывала цены. Вот вам и наглядная иллюстрация парадокса Джевонса.
При этом всём, сколько именно зарабатывают сейчас OpenAI понять трудно. Хоть мы и знаем, что за первое полугодие 2024 проекция выручки удвоилась до $3,4 миллиарда долларов в год, но как повлияли на выручку запуск Voice API и o1 - незвестно. Зато известно что переговоры про новый раунд инвестиций размером в $40 миллиардов, ведутся уже при оценке компании в $260 миллиардов, что на 73% выше оценки в октябре 2024
@ai_newz
✍3
США хотят "отключить" свои AI-технологии от Китая
Сенатор Josh Hawley представил радикальный законопроект, который может серьезно изменить ландшафт AI-разработок. И не в лучшую сторону.
Ключевые моменты:
Тотальный запрет 🚫
Запрещает любое AI-сотрудничество с китайскими организациями
Причем ЛЮБОЕ - нет разделения по уровню риска или мощности AI
Касается как экспорта, так и импорта (впервые в истории!)
Драконовские штрафы 💰
До $100 млн для компаний
До $1 млн для физлиц
Плюс утроенный размер ущерба
Для неграждан США - риск депортации
Потенциальные жертвы:
Под удар попадает весь open source AI
Студенты из Китая не смогут участвовать даже в совместных научных статьях
Разработчики не смогут контролировать, кто скачивает их открытые модели
Побочные эффекты - глобальны! 🌍
Может привести к изоляции США в AI-исследованиях
Вероятно усиление зависимости других стран от китайских технологий
Ударит больше по малым компаниям и исследователям, чем по Big Tech
Забавно, что это республиканская инициатива - она жестче, чем любые предложения Байдена или ЕС. Похоже, в попытке "отключиться" от Китая США рискуют отключить себя от глобального AI-сообщества.
Вопрос: действительно ли такая "китайская стена" (но это со стороны США) в мире AI возможна? И не получится ли, что вместо защиты американских интересов мы увидим расцвет китайских AI-компаний? 🤔
Источники:
Twitter
Законопроект
Файл в комментариях
#Китай #США #законы
———
@tsingular
Сенатор Josh Hawley представил радикальный законопроект, который может серьезно изменить ландшафт AI-разработок. И не в лучшую сторону.
Ключевые моменты:
Тотальный запрет 🚫
Запрещает любое AI-сотрудничество с китайскими организациями
Причем ЛЮБОЕ - нет разделения по уровню риска или мощности AI
Касается как экспорта, так и импорта (впервые в истории!)
Драконовские штрафы 💰
До $100 млн для компаний
До $1 млн для физлиц
Плюс утроенный размер ущерба
Для неграждан США - риск депортации
Потенциальные жертвы:
Под удар попадает весь open source AI
Студенты из Китая не смогут участвовать даже в совместных научных статьях
Разработчики не смогут контролировать, кто скачивает их открытые модели
Побочные эффекты - глобальны! 🌍
Может привести к изоляции США в AI-исследованиях
Вероятно усиление зависимости других стран от китайских технологий
Ударит больше по малым компаниям и исследователям, чем по Big Tech
Забавно, что это республиканская инициатива - она жестче, чем любые предложения Байдена или ЕС. Похоже, в попытке "отключиться" от Китая США рискуют отключить себя от глобального AI-сообщества.
Вопрос: действительно ли такая "китайская стена" (но это со стороны США) в мире AI возможна? И не получится ли, что вместо защиты американских интересов мы увидим расцвет китайских AI-компаний? 🤔
Источники:
Законопроект
Файл в комментариях
#Китай #США #законы
———
@tsingular
🤔11😈5👍2👨💻1
Дарю лайфхак:
o3-mini отлично пишет код в части архитектуры, но есть косяки с синтаксисом.
Claude Sonnet 3.5 - качественно его полирует на предмет финальных ошибок.
Вместе эффективнее.
Народ там для этого уже фреймворки пилит, но я как-то не вижу смысла в таких вещах.
#Claude #OpenAI #dev
———
@tsingular
o3-mini отлично пишет код в части архитектуры, но есть косяки с синтаксисом.
Claude Sonnet 3.5 - качественно его полирует на предмет финальных ошибок.
Вместе эффективнее.
Народ там для этого уже фреймворки пилит, но я как-то не вижу смысла в таких вещах.
#Claude #OpenAI #dev
———
@tsingular
👍11❤🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
🔬 Новая фича Deep Research от OpenAI
OpenAI представила новую функцию Deep Research для ChatGPT - возможность глубокого исследования темы с анализом множества источников.
Возможности:
- Глубокий веб-поиск с анализом источников
- Работа с загруженными файлами
- Создание подробных аналитических отчётов
- Пошаговое объяснение своих выводов
- Поддержка разных форматов вывода (таблицы, списки, текст)
Ограничения:
- Только для Pro-подписчиков
- Лимит 100 запросов в месяц (из-за высокой вычислительной нагрузки)
- Пока нет доступа для UK и ЕЭС
- Может занимать много времени на обработку ( ~30 минут)
Технические особенности:
- Использует улучшенную версию модели OpenAI o3
- Требует огромных вычислительных ресурсов
- Умеет верифицировать источники
- Может создавать артефакты (графики, код, SVG)
Планы развития:
- Скоро выйдет облегчённая версия
- Добавят поддержку специализированных источников данных (корпоративных в т.ч.)
- Планируют интеграцию с подпиской Plus и Team
- Обещают релиз на мобильных устройствах
Звучит круто, но... знакомо :)
DeepSeek уже месяц как запустил аналогичную функциональность через связку DeepThink + WebSearch. И работает, надо сказать, весьма неплохо!
Но самое интересное - подобные решения уже давно существуют на уровне энтузиастов и небольших проектов. Например, уже больше года такой функционал доступен у меня в ботах. А пол года назад я даже накидал локального "Исследователя" для личных целей, который за ночь может сгенерировать 120-страничный отчет с анализом 5000+ источников. И все это на обычном домашнем GPU!
Т.е. OpenAI, имея миллиардные инвестиции, выпускает функционал, который по сути можно было реализовать на уровне студенческого проекта.
При этом их решение требует космических вычислительных ресурсов - настолько, что даже Pro-пользователям дают только 100 запросов в месяц.
В общем, складывается впечатление, что OpenAI просто "догоняет" существующие решения, но с большим шумом и пафосом. А ведь от компании с такими ресурсами хотелось бы видеть что-то действительно инновационное!
Метрики выглядят интересно, пожалуй.
Humanity Last Exam 26.6%
#OpenAI #AI #DeepResearch #Research
———
@tsingular
OpenAI представила новую функцию Deep Research для ChatGPT - возможность глубокого исследования темы с анализом множества источников.
Возможности:
- Глубокий веб-поиск с анализом источников
- Работа с загруженными файлами
- Создание подробных аналитических отчётов
- Пошаговое объяснение своих выводов
- Поддержка разных форматов вывода (таблицы, списки, текст)
Ограничения:
- Только для Pro-подписчиков
- Лимит 100 запросов в месяц (из-за высокой вычислительной нагрузки)
- Пока нет доступа для UK и ЕЭС
- Может занимать много времени на обработку ( ~30 минут)
Технические особенности:
- Использует улучшенную версию модели OpenAI o3
- Требует огромных вычислительных ресурсов
- Умеет верифицировать источники
- Может создавать артефакты (графики, код, SVG)
Планы развития:
- Скоро выйдет облегчённая версия
- Добавят поддержку специализированных источников данных (корпоративных в т.ч.)
- Планируют интеграцию с подпиской Plus и Team
- Обещают релиз на мобильных устройствах
Звучит круто, но... знакомо :)
DeepSeek уже месяц как запустил аналогичную функциональность через связку DeepThink + WebSearch. И работает, надо сказать, весьма неплохо!
Но самое интересное - подобные решения уже давно существуют на уровне энтузиастов и небольших проектов. Например, уже больше года такой функционал доступен у меня в ботах. А пол года назад я даже накидал локального "Исследователя" для личных целей, который за ночь может сгенерировать 120-страничный отчет с анализом 5000+ источников. И все это на обычном домашнем GPU!
Т.е. OpenAI, имея миллиардные инвестиции, выпускает функционал, который по сути можно было реализовать на уровне студенческого проекта.
При этом их решение требует космических вычислительных ресурсов - настолько, что даже Pro-пользователям дают только 100 запросов в месяц.
В общем, складывается впечатление, что OpenAI просто "догоняет" существующие решения, но с большим шумом и пафосом. А ведь от компании с такими ресурсами хотелось бы видеть что-то действительно инновационное!
Метрики выглядят интересно, пожалуй.
Humanity Last Exam 26.6%
#OpenAI #AI #DeepResearch #Research
———
@tsingular
👍8❤🔥6❤1
🚀 16x Prompt: Мощный инструмент для разработчиков, который делает работу с AI в разы эффективнее
Главные фишки для разработчиков:
1. Умное управление контекстом кода:
- Автоматически собирает и организует код из разных файлов
- Позволяет фильтровать и группировать файлы
- Поддерживает работу с большими проектами (до 500 файлов в контексте)
2. Работа с разными AI-моделями:
- Прямая интеграция с Claude 3.5 Sonnet и GPT-4
- Возможность сравнить ответы разных моделей side-by-side
- Поддержка локальных моделей через Ollama
3. Оптимизация промптов:
- Готовые шаблоны для типовых задач (рефакторинг, новые фичи, баги)
- Сохранение часто используемых промптов
- Автоматическая оптимизация контекста под лимиты токенов
Последние обновления (февраль 2025):
🆕 Версия 0.0.98:
- Поддержка новой модели o3-mini
- Оптимизация подсчета токенов для длинных текстов
🔥 Версия 0.0.97:
- Добавлен вывод reasoning в API-ответах
- Интеграция с DeepSeek, DeepInfra и Fireworks
- Настройка max output tokens для сторонних API
Забавно, что инструмент сам использует AI для своего развития - около 80% кода последних релизов написано с помощью самого 16x Prompt. Прямо рекурсия какая-то получается! 😅
В общем, если вы работаете с AI в разработке, особенно с большими проектами - однозначно стоит попробовать. Экономит кучу времени на составлении и хранении промптов и работе с контекстом.
Не заменяет Cursor и VSCode
Отдельное спасибо Алексу (@alyxst) за наводку.
#16xPrompt #dev
———
@tsingular
Главные фишки для разработчиков:
1. Умное управление контекстом кода:
- Автоматически собирает и организует код из разных файлов
- Позволяет фильтровать и группировать файлы
- Поддерживает работу с большими проектами (до 500 файлов в контексте)
2. Работа с разными AI-моделями:
- Прямая интеграция с Claude 3.5 Sonnet и GPT-4
- Возможность сравнить ответы разных моделей side-by-side
- Поддержка локальных моделей через Ollama
3. Оптимизация промптов:
- Готовые шаблоны для типовых задач (рефакторинг, новые фичи, баги)
- Сохранение часто используемых промптов
- Автоматическая оптимизация контекста под лимиты токенов
Последние обновления (февраль 2025):
🆕 Версия 0.0.98:
- Поддержка новой модели o3-mini
- Оптимизация подсчета токенов для длинных текстов
🔥 Версия 0.0.97:
- Добавлен вывод reasoning в API-ответах
- Интеграция с DeepSeek, DeepInfra и Fireworks
- Настройка max output tokens для сторонних API
Забавно, что инструмент сам использует AI для своего развития - около 80% кода последних релизов написано с помощью самого 16x Prompt. Прямо рекурсия какая-то получается! 😅
В общем, если вы работаете с AI в разработке, особенно с большими проектами - однозначно стоит попробовать. Экономит кучу времени на составлении и хранении промптов и работе с контекстом.
Не заменяет Cursor и VSCode
Отдельное спасибо Алексу (@alyxst) за наводку.
#16xPrompt #dev
———
@tsingular
✍4🔥2❤1👍1🆒1
Помните я говорил, что следующим президентом США будет ИИ?
Маск прям строит железобетонный фундамент для этого.
#elonmusk #government #doge
------
@tsingular
Маск прям строит железобетонный фундамент для этого.
#elonmusk #government #doge
------
@tsingular
💯38👍9⚡8👾4❤1
Новые фреймворки объединяют лучшие практики MLOps и LLMOps
Разработчики представили два взаимодополняющих фреймворка для оптимизации ML/LLM проектов.
Ключевые компоненты включают RAG-систему с синтетическими данными, MLflow для логирования, Guardrails для защиты данных.
FastAPI обеспечивает развертывание, а Poetry управляет зависимостями.
Архитектура основана на SOLID-принципах с DAG-ориентированными пайплайнами.
Реализована интеграция с AWS Fargate, поддержка контейнеров и YAML-конфигурации.
Проекты предоставляют готовую инфраструктуру для быстрого старта промышленных ML/LLM решений.
Теперь ML-инженерам не придется изобретать велосипед - все основные компоненты уже собраны в одном месте 🚲
https://github.com/callmesora/llmops-python-package
https://github.com/fmind/mlops-python-package
#MLOps #Python #RAG
-------
@tsingular
Разработчики представили два взаимодополняющих фреймворка для оптимизации ML/LLM проектов.
Ключевые компоненты включают RAG-систему с синтетическими данными, MLflow для логирования, Guardrails для защиты данных.
FastAPI обеспечивает развертывание, а Poetry управляет зависимостями.
Архитектура основана на SOLID-принципах с DAG-ориентированными пайплайнами.
Реализована интеграция с AWS Fargate, поддержка контейнеров и YAML-конфигурации.
Проекты предоставляют готовую инфраструктуру для быстрого старта промышленных ML/LLM решений.
Теперь ML-инженерам не придется изобретать велосипед - все основные компоненты уже собраны в одном месте 🚲
https://github.com/callmesora/llmops-python-package
https://github.com/fmind/mlops-python-package
#MLOps #Python #RAG
-------
@tsingular
👍5⚡2✍2
🔬 Constitutional Classifiers: Как Anthropic создала универсальную защиту от джейлбрейков
Интересный пейпер от команды Anthropic по безопасности AI! Давайте разберем технические детали их нового метода защиты языковых моделей.
🎯 Суть проблемы:
- Существующие LLM уязвимы к джейлбрейкам (обходу защиты через запросы)
- Классические атаки используют длинные промпты или необычное форматирование (типа uSiNg wEiRd cApS)
- За 10 лет никто не создал по-настоящему надежной защиты. (Команда Lakera.ai удивлённо вскинула брови и поперхнулась кофе :) )?
⚙️ Техническое решение:
1. Создается "конституция" - набор правил о разрешенном/запрещенном контенте
2. С помощью Claude генерируются синтетические промпты и ответы для всех категорий
3. Данные аугментируются: переводы на разные языки, стилизация под известные джейлбрейки
4. На этих данных тренируются два классификатора:
- Для входящих запросов
- Для исходящих ответов модели
🧪 Результаты тестирования:
- 183 специалиста по джейлбрейкам
- >3000 часов попыток взлома
- Награда $15,000 за успешный универсальный джейлбрейк
- Результат: ни одного успешного взлома!
📊 Автоматизированные тесты:
- Базовая модель блокировала только 14% продвинутых джейлбрейков
- С Constitutional Classifiers: блокируется 95.6%
- Увеличение ложных срабатываний всего на 0.38%
- Вычислительные затраты выросли на 23.7%
🔍 Технические особенности:
- Классификаторы обучаются на синтетических данных
- Важна разметка "безвредных" категорий для снижения ложных срабатываний
- Система может быстро адаптироваться к новым типам атак
- Используется подход, похожий на Constitutional AI
💭 Интересный момент: система не обещает 100% защиты, но делает джейлбрейки настолько трудоемкими, что они теряют практический смысл. Это похоже на подход к безопасности в криптографии!
⚡️ Особенно впечатляет баланс между защитой и практичностью - менее 1% увеличения ложных срабатываний при блокировке 95.6% атак. Это реально прорыв в области безопасности AI.
🤔 Anthropic сейчас проводит публичное тестирование этой системы. Будет интересно увидеть, найдут ли участники какие-то новые способы обхода защиты.
Попробовать свои силы можно тут:
https://claude.ai/constitutional-classifiers
(через VPN)
Вообще 24% - ничтожное увеличение накладных расходов за 95.5% фильтрации.
Очень крутой подход.
#Anthropic #security #jailbreak
———
@tsingular
Интересный пейпер от команды Anthropic по безопасности AI! Давайте разберем технические детали их нового метода защиты языковых моделей.
🎯 Суть проблемы:
- Существующие LLM уязвимы к джейлбрейкам (обходу защиты через запросы)
- Классические атаки используют длинные промпты или необычное форматирование (типа uSiNg wEiRd cApS)
- За 10 лет никто не создал по-настоящему надежной защиты. (Команда Lakera.ai удивлённо вскинула брови и поперхнулась кофе :) )?
⚙️ Техническое решение:
1. Создается "конституция" - набор правил о разрешенном/запрещенном контенте
2. С помощью Claude генерируются синтетические промпты и ответы для всех категорий
3. Данные аугментируются: переводы на разные языки, стилизация под известные джейлбрейки
4. На этих данных тренируются два классификатора:
- Для входящих запросов
- Для исходящих ответов модели
🧪 Результаты тестирования:
- 183 специалиста по джейлбрейкам
- >3000 часов попыток взлома
- Награда $15,000 за успешный универсальный джейлбрейк
- Результат: ни одного успешного взлома!
📊 Автоматизированные тесты:
- Базовая модель блокировала только 14% продвинутых джейлбрейков
- С Constitutional Classifiers: блокируется 95.6%
- Увеличение ложных срабатываний всего на 0.38%
- Вычислительные затраты выросли на 23.7%
🔍 Технические особенности:
- Классификаторы обучаются на синтетических данных
- Важна разметка "безвредных" категорий для снижения ложных срабатываний
- Система может быстро адаптироваться к новым типам атак
- Используется подход, похожий на Constitutional AI
💭 Интересный момент: система не обещает 100% защиты, но делает джейлбрейки настолько трудоемкими, что они теряют практический смысл. Это похоже на подход к безопасности в криптографии!
⚡️ Особенно впечатляет баланс между защитой и практичностью - менее 1% увеличения ложных срабатываний при блокировке 95.6% атак. Это реально прорыв в области безопасности AI.
🤔 Anthropic сейчас проводит публичное тестирование этой системы. Будет интересно увидеть, найдут ли участники какие-то новые способы обхода защиты.
Попробовать свои силы можно тут:
https://claude.ai/constitutional-classifiers
(через VPN)
Вообще 24% - ничтожное увеличение накладных расходов за 95.5% фильтрации.
Очень крутой подход.
#Anthropic #security #jailbreak
———
@tsingular
✍5❤3⚡2🔥2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Cline - ИИ-агент для автономной разработки прямо в IDE
Вы будете смеяться, но у нас новый автономный разработчик.
VSCode плагин интегрируется с терминалом, браузером, менеджерами пакетов, БД и системами тестирования.
Поддерживает OpenRouter, Anthropic, OpenAI, Google Gemini и локальные модели через LM Studio/Ollama.
Работает с подтверждениями человека: каждое действие требует утверждения, а изменения отображаются в режиме сравнения с возможностью отката.
Расширяемая архитектура на Model Context Protocol позволяет создавать собственные инструменты.
#Cline #VSCode #DevTools
———
@tsingular
Вы будете смеяться, но у нас новый автономный разработчик.
VSCode плагин интегрируется с терминалом, браузером, менеджерами пакетов, БД и системами тестирования.
Поддерживает OpenRouter, Anthropic, OpenAI, Google Gemini и локальные модели через LM Studio/Ollama.
Работает с подтверждениями человека: каждое действие требует утверждения, а изменения отображаются в режиме сравнения с возможностью отката.
Расширяемая архитектура на Model Context Protocol позволяет создавать собственные инструменты.
#Cline #VSCode #DevTools
———
@tsingular
👍8✍2
This media is not supported in your browser
VIEW IN TELEGRAM
Как я и говорил, - этих DeepResearcher-ов - уже много.
А с моделями DS-V3 под рукой они собираются "на раз" любым студентом.
Зашел в LinkedIn - вся лента в этих Исследователях.
Ссылки:
Инструкция а AutoGen он Microsoft:
https://microsoft.github.io/autogen/dev/user-guide/core-user-guide/index.html
Готовый открытый рисёрчер:
https://github.com/mshumer/OpenDeepResearcher
#Researcher
———
@tsingular
А с моделями DS-V3 под рукой они собираются "на раз" любым студентом.
Зашел в LinkedIn - вся лента в этих Исследователях.
Ссылки:
Инструкция а AutoGen он Microsoft:
https://microsoft.github.io/autogen/dev/user-guide/core-user-guide/index.html
Готовый открытый рисёрчер:
https://github.com/mshumer/OpenDeepResearcher
#Researcher
———
@tsingular
⚡8👍2❤1👨💻1
Forwarded from Анализ данных (Data analysis)
⚡️ Китай наносит новый удар. 🔥
ByteDance выпустила OmniHuman-1, модель для создания реалистичных видео на основе одного изображения.
OmniHuman-1 - работает на основе диффузионного преобразования, которая генерирует высокореалистичные видео на основе изображения и аудио/видео.
В модели реализовано обучение с учетом всех условий окружения, что позволяет масштабировать генерацию, создавать связанные с движением и значительно повысить реалистичность жестов и движений тела.
В отличие от предыдущих моделей, ограниченных лицевой или статичной анимацией тела, OmniHuman-1 поддерживает различные соотношения сторон, сложные взаимодействия человека и объектов вокруг.
Она превосходит существующие методы по реалистичности, достигая высокой точности синхронизации губ, точности жестов и выразительности лица.
→ Модель построена на архитектуре DiT (Diffusion Transformer), поддерживает мультимодальность.
→ Превосходит конкурентов (например, Loopy, CyberHost, DiffTED) по точности синхронизации губ (5,255 против 4,814), FVD (15,906 против 16,134) и выразительности жестов, при этом поддерживая различные пропорции тела в одной модели.
https://huggingface.co/papers/2502.01061
@data_analysis_ml
ByteDance выпустила OmniHuman-1, модель для создания реалистичных видео на основе одного изображения.
OmniHuman-1 - работает на основе диффузионного преобразования, которая генерирует высокореалистичные видео на основе изображения и аудио/видео.
В модели реализовано обучение с учетом всех условий окружения, что позволяет масштабировать генерацию, создавать связанные с движением и значительно повысить реалистичность жестов и движений тела.
В отличие от предыдущих моделей, ограниченных лицевой или статичной анимацией тела, OmniHuman-1 поддерживает различные соотношения сторон, сложные взаимодействия человека и объектов вокруг.
Она превосходит существующие методы по реалистичности, достигая высокой точности синхронизации губ, точности жестов и выразительности лица.
→ Модель построена на архитектуре DiT (Diffusion Transformer), поддерживает мультимодальность.
→ Превосходит конкурентов (например, Loopy, CyberHost, DiffTED) по точности синхронизации губ (5,255 против 4,814), FVD (15,906 против 16,134) и выразительности жестов, при этом поддерживая различные пропорции тела в одной модели.
https://huggingface.co/papers/2502.01061
@data_analysis_ml
🔥19🆒3
This media is not supported in your browser
VIEW IN TELEGRAM
Postman запускает визуальный конструктор AI-агентов
Postman представил инструментарий для создания ИИ-ассистентов без написания кода.
Платформа интегрирует 100,000+ публичных API и ведущие LLM-модели через визуальный интерфейс.
Разработчики получили доступ к верифицированным API от более чем 18,000 компаний.
Функционал включает тестирование промптов, сравнение производительности моделей и мониторинг в реальном времени.
Инструмент позволяет создавать event-driven агентов для автоматизации клиентской поддержки, управления инцидентами и документирования.
Теперь даже джуниор сможет собрать своего киборга-помощника из кубиков 🤖
Вот это поворот.🔝
Postman становится в один ряд с Langchain, Langflow и n8n
#Postman #NoCode #агенты
-------
@tsingular
Postman представил инструментарий для создания ИИ-ассистентов без написания кода.
Платформа интегрирует 100,000+ публичных API и ведущие LLM-модели через визуальный интерфейс.
Разработчики получили доступ к верифицированным API от более чем 18,000 компаний.
Функционал включает тестирование промптов, сравнение производительности моделей и мониторинг в реальном времени.
Инструмент позволяет создавать event-driven агентов для автоматизации клиентской поддержки, управления инцидентами и документирования.
Теперь даже джуниор сможет собрать своего киборга-помощника из кубиков 🤖
Вот это поворот.
Postman становится в один ряд с Langchain, Langflow и n8n
#Postman #NoCode #агенты
-------
@tsingular
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11⚡3🤔3🆒3
HuggingFace представил агента-исследователя Open Deep Research
HuggingFace выпустил open-source версию DeepResearch на основе библиотеки SmolAgents.
Ключевая особенность - использование кода вместо JSON для управления действиями агента.
Система включает веб-браузер и текстовый инспектор для работы с различными форматами файлов.
На валидационном наборе GAIA достигнут результат 54%, что на 8% выше предыдущего рекорда Magentic-One.
Теперь любой может создать своего научного ассистента. OpeanAI в панике! :)
Т.е. за $250 вы получаете недоделанный забагованный Researcher от OAI или можно взять бесплатный открытый от HF с метриками немногим ниже...
Сложный выбор.
Ну что, делаем бота рассуждатора? :)
Пишите в комментариях.
Кстати, на запчасти боту собираю тут
#HuggingFace #DeepResearch #SmolAgents
-------
@tsingular
HuggingFace выпустил open-source версию DeepResearch на основе библиотеки SmolAgents.
Ключевая особенность - использование кода вместо JSON для управления действиями агента.
Система включает веб-браузер и текстовый инспектор для работы с различными форматами файлов.
На валидационном наборе GAIA достигнут результат 54%, что на 8% выше предыдущего рекорда Magentic-One.
Теперь любой может создать своего научного ассистента. OpeanAI в панике! :)
Т.е. за $250 вы получаете недоделанный забагованный Researcher от OAI или можно взять бесплатный открытый от HF с метриками немногим ниже...
Сложный выбор.
Ну что, делаем бота рассуждатора? :)
Пишите в комментариях.
Кстати, на запчасти боту собираю тут
#HuggingFace #DeepResearch #SmolAgents
-------
@tsingular
100🤯4🆒2❤🔥1⚡1