Forwarded from e/acc
Oбзор ИИ-программистов
Для тех, кому интересна тема того как ИИ заменяет программистов, очень советую почитать мета-исследование, в котором сравнены 106 различных агентов по своим способностям, автономности, архитектуре и области применения.
Авторы сделали офигенную работу по определению агента (это система, которая может воспринимать информацию, использовать инструменты, планировать, запоминать и самостоятельно действовать). Мульти-агентная система, в которой есть роли агентов, включая роли менеджеров, анализа требований, проектировщиков, разработчиков, роли тестирования, отладки и вспомогательные роли.
Так же они определили области применения, большая часть из которых (вопреки яростно комментирующим) — это не просто написание кода, но формирование требований, дизайн, генерация кода, написание теста, статический анализ, поиск багов, фикс багов и девопс.
В статье много жира, например описание и сравнение всех 106 агентов по их функционалу и качеству или описание механизмов взаимодействия в мультиагентных системах (говорят, что 56% всех систем — мультиагентные), а так же детальный разбор каждого этапа и разных подходов к их решению.
Найти список всех 106 (бесплатных, с открытым кодом) агентов-программистов можно в референсах статьи.
Для тех, кому интересна тема того как ИИ заменяет программистов, очень советую почитать мета-исследование, в котором сравнены 106 различных агентов по своим способностям, автономности, архитектуре и области применения.
Авторы сделали офигенную работу по определению агента (это система, которая может воспринимать информацию, использовать инструменты, планировать, запоминать и самостоятельно действовать). Мульти-агентная система, в которой есть роли агентов, включая роли менеджеров, анализа требований, проектировщиков, разработчиков, роли тестирования, отладки и вспомогательные роли.
Так же они определили области применения, большая часть из которых (вопреки яростно комментирующим) — это не просто написание кода, но формирование требований, дизайн, генерация кода, написание теста, статический анализ, поиск багов, фикс багов и девопс.
В статье много жира, например описание и сравнение всех 106 агентов по их функционалу и качеству или описание механизмов взаимодействия в мультиагентных системах (говорят, что 56% всех систем — мультиагентные), а так же детальный разбор каждого этапа и разных подходов к их решению.
Найти список всех 106 (бесплатных, с открытым кодом) агентов-программистов можно в референсах статьи.
👍12
Klarna отказывается от Salesforce и Workday в пользу ИИ
Шведский финтех-гигант Klarna прекращает сотрудничество с ключевыми SaaS-провайдерами.
Компания отказывается от услуг Salesforce, а вскоре планирует завершить работу и с Workday.
Эти шаги - часть масштабной инициативы по оптимизации технологического стека с помощью искусственного интеллекта.
Klarna стремится к стандартизации и упрощению своих систем для повышения эффективности и качества работы.
Компания также планирует сократить штат, используя ИИ для снижения затрат.
Несмотря на эти изменения, во втором квартале выручка Klarna выросла на 27% до 13,3 млрд шведских крон.
Похоже, ИИ начинает вытеснять даже гигантов SaaS. Интересно, кто следующий? 🤔
#Klarna #Salesforce #Workday
-------
@tsingular
Шведский финтех-гигант Klarna прекращает сотрудничество с ключевыми SaaS-провайдерами.
Компания отказывается от услуг Salesforce, а вскоре планирует завершить работу и с Workday.
Эти шаги - часть масштабной инициативы по оптимизации технологического стека с помощью искусственного интеллекта.
Klarna стремится к стандартизации и упрощению своих систем для повышения эффективности и качества работы.
Компания также планирует сократить штат, используя ИИ для снижения затрат.
Несмотря на эти изменения, во втором квартале выручка Klarna выросла на 27% до 13,3 млрд шведских крон.
Похоже, ИИ начинает вытеснять даже гигантов SaaS. Интересно, кто следующий? 🤔
#Klarna #Salesforce #Workday
-------
@tsingular
This media is not supported in your browser
VIEW IN TELEGRAM
Adobe догоняет тренд генерации видео по тексту
Компания Adobe анонсировала интеграцию генеративных видеовозможностей в своей экосистеме.
Новые инструменты на основе модели Firefly позволят создавать короткие видеоролики из текста и статичных изображений.
Пользователи смогут настраивать результаты с помощью элементов управления камерой.
Функция "Generative Extend" в Premiere Pro увеличит длительность существующего видео.
Максимальная продолжительность генерируемых клипов - 5 секунд.
Планируется интеграция в Creative Cloud, Experience Cloud и Adobe Express.
Вот и профессионалы подтянулись. Хотя 5 секунд, конечно, маловато.
#Adobe #Firefly #GenerativeVideo
-------
@tsingular
Компания Adobe анонсировала интеграцию генеративных видеовозможностей в своей экосистеме.
Новые инструменты на основе модели Firefly позволят создавать короткие видеоролики из текста и статичных изображений.
Пользователи смогут настраивать результаты с помощью элементов управления камерой.
Функция "Generative Extend" в Premiere Pro увеличит длительность существующего видео.
Максимальная продолжительность генерируемых клипов - 5 секунд.
Планируется интеграция в Creative Cloud, Experience Cloud и Adobe Express.
Вот и профессионалы подтянулись. Хотя 5 секунд, конечно, маловато.
#Adobe #Firefly #GenerativeVideo
-------
@tsingular
👍5❤1🆒1
Oracle и NVIDIA: лютейшая производительность зеттамасштаба для ИИ
Oracle анонсировала первый зеттамасштабный суперкластер OCI на базе NVIDIA Blackwell.
Пиковая производительность: 2,4 зеттафлопс на 131 072 GPU Blackwell.
Кластеры с GPU H100 достигают 65 экзафлопс, а с H200 - 260 экзафлопс.
Экземпляры NVIDIA GB200 NVL72 объединяют до 72 GPU Blackwell.
прессрелиз Oracle
В 2025-м кластеры улетят в космос. И по производительности и по энергопотреблению. 🌩💻
#Oracle #NVIDIA #Blackwell
-------
@tsingular
Oracle анонсировала первый зеттамасштабный суперкластер OCI на базе NVIDIA Blackwell.
Пиковая производительность: 2,4 зеттафлопс на 131 072 GPU Blackwell.
Кластеры с GPU H100 достигают 65 экзафлопс, а с H200 - 260 экзафлопс.
Экземпляры NVIDIA GB200 NVL72 объединяют до 72 GPU Blackwell.
прессрелиз Oracle
В 2025-м кластеры улетят в космос. И по производительности и по энергопотреблению. 🌩💻
#Oracle #NVIDIA #Blackwell
-------
@tsingular
👍6
Агенты на базе LLM: умные помощники в разработке ПО
Программные агенты на основе LLM становятся ключевыми инструментами в сфере разработки ПО.
Эти интеллектуальные ассистенты способны взаимодействовать с внешними ресурсами и инструментами, участвуя во всех этапах создания программного обеспечения.
Ключевые компоненты агентов включают саму LLM, планировщик, память и набор инструментов.
Планирование может быть одно- или многоэтапным, а план представляется в различных форматах.
Память агентов делится на кратковременную и долговременную, индивидуальную и общую, хранящую данные в разных форматах.
В многоагентных системах ИИ-помощники могут выполнять роли, аналогичные реальным командам разработчиков.
на русском
arxiv
GitHub
Отличное обобщение от Сергея @pimenov_ru про ИИ агентов на русском языке.
Как вводный мини-курс, рекомендую к ознакомлению.
Сегодня про агентов много как-то получается, пора уже своих делать. :) 🤖💻
#LLM #Agents
-------
@tsingular
Программные агенты на основе LLM становятся ключевыми инструментами в сфере разработки ПО.
Эти интеллектуальные ассистенты способны взаимодействовать с внешними ресурсами и инструментами, участвуя во всех этапах создания программного обеспечения.
Ключевые компоненты агентов включают саму LLM, планировщик, память и набор инструментов.
Планирование может быть одно- или многоэтапным, а план представляется в различных форматах.
Память агентов делится на кратковременную и долговременную, индивидуальную и общую, хранящую данные в разных форматах.
В многоагентных системах ИИ-помощники могут выполнять роли, аналогичные реальным командам разработчиков.
на русском
arxiv
GitHub
Отличное обобщение от Сергея @pimenov_ru про ИИ агентов на русском языке.
Как вводный мини-курс, рекомендую к ознакомлению.
Сегодня про агентов много как-то получается, пора уже своих делать. :) 🤖💻
#LLM #Agents
-------
@tsingular
👍4🔥1
Mistral.rs: Универсальная платформа для быстрого инференса LLM
Eric L Buehler представил Mistral.rs - сверхбыструю платформу для запуска LLM.
Ключевые особенности:
• Широкая совместимость: поддержка GPU, CPU, Apple Metal.
• Автоматическая оптимизация: квантизация, PagedAttention, непрерывная пакетная обработка.
• Гибкость: HTTP-сервер (OpenAI API), Python-биндинги, Rust API.
• Расширенные возможности: X-LoRA, LoRA адаптеры, мультимодальность.
• Удобство: автозагрузка с Hugging Face Hub, интерактивный режим.
Платформа поддерживает множество моделей и форматов, включая GGUF и GGML.
-Швейцарский- Французский нож в мире локального инференса.
Для любителей, - обязательно к ознакомлению. 🚀🧠
#Mistral.rs #LLM #Inference
-------
@tsingular
Eric L Buehler представил Mistral.rs - сверхбыструю платформу для запуска LLM.
Ключевые особенности:
• Широкая совместимость: поддержка GPU, CPU, Apple Metal.
• Автоматическая оптимизация: квантизация, PagedAttention, непрерывная пакетная обработка.
• Гибкость: HTTP-сервер (OpenAI API), Python-биндинги, Rust API.
• Расширенные возможности: X-LoRA, LoRA адаптеры, мультимодальность.
• Удобство: автозагрузка с Hugging Face Hub, интерактивный режим.
Платформа поддерживает множество моделей и форматов, включая GGUF и GGML.
Для любителей, - обязательно к ознакомлению. 🚀🧠
#Mistral.rs #LLM #Inference
-------
@tsingular
🔥4👍1
Учёные разработали способ разворачивать старение вспять
Обнаружено шесть вариаций из малых молекул, которые за неделю восстанавливали молодой профиль экспрессии генов в стареющих человеческих фибробластах.
Самый эффективный коктейль (VC6TF) содержал вальпроевую кислоту, CHIR-99021, E-616452, транилципромин и форсколин.
Эффекты омоложения были сопоставимы с генетической индукцией факторов Яманаки (OCT4, SOX2, KLF4).
Химические обработки не вызывали изменение идентичности клеток.
Эффект 4-дневной обработки сравним с годовым курсом регенеративной терапии.
Коктейли активируют клеточное дыхание и подавляют воспаление.
Разработана система NCC для различения молодых и старых клеток в реальном времени.
Исследование подтверждает Информационную теорию старения, - что старые клетки сохраняют информацию для сброса биологического возраста.
Источник: https://www.aging-us.com/article/204896/text
Подписка на бессмертие за 80% ваших денег ежемесячно.
Берём? :)
#EPOCH #cellularAging #regenerativeMedicine
-------
@tsingular
Обнаружено шесть вариаций из малых молекул, которые за неделю восстанавливали молодой профиль экспрессии генов в стареющих человеческих фибробластах.
Самый эффективный коктейль (VC6TF) содержал вальпроевую кислоту, CHIR-99021, E-616452, транилципромин и форсколин.
Эффекты омоложения были сопоставимы с генетической индукцией факторов Яманаки (OCT4, SOX2, KLF4).
Химические обработки не вызывали изменение идентичности клеток.
Эффект 4-дневной обработки сравним с годовым курсом регенеративной терапии.
Коктейли активируют клеточное дыхание и подавляют воспаление.
Разработана система NCC для различения молодых и старых клеток в реальном времени.
Исследование подтверждает Информационную теорию старения, - что старые клетки сохраняют информацию для сброса биологического возраста.
Источник: https://www.aging-us.com/article/204896/text
Подписка на бессмертие за 80% ваших денег ежемесячно.
Берём? :)
#EPOCH #cellularAging #regenerativeMedicine
-------
@tsingular
❤7🔥7✍1🤔1🍓1
Яндекс запустил AI-помощника для программистов
Yandex Code Assistant - новый ИИ-инструмент для разработчиков, созданный Яндексом, находится в стадии Preview.
Ассистент генерирует код за 400 мс, поддерживает 30+ языков программирования и популярные редакторы.
Сервис доступен бесплатно в тестовом режиме через Yandex Cloud.
Ассистент не нагружает локальные машины, работая из облака.
Есть плагин для VS Code
Норм подарок на День программиста :)
#Yandex #CodeAssistant #devtools
-------
@tsingular
Yandex Code Assistant - новый ИИ-инструмент для разработчиков, созданный Яндексом, находится в стадии Preview.
Ассистент генерирует код за 400 мс, поддерживает 30+ языков программирования и популярные редакторы.
Сервис доступен бесплатно в тестовом режиме через Yandex Cloud.
Ассистент не нагружает локальные машины, работая из облака.
Есть плагин для VS Code
Норм подарок на День программиста :)
#Yandex #CodeAssistant #devtools
-------
@tsingular
🔥13
FiveThirtyNine: ИИ-бот - эксперт в аналитических прогнозах
Бот на базе GPT-4o анализирует новости, статьи и выдаёт вероятности для любых запросов.
Точность 87.7% при тестировании на 177 вопросах Metaculus.
Превосходит опытных аналитиков и сравним по эффективности с командой экспертов.
Ограничения: отсутствие тонкой настройки, работа с недавними событиями.
Потенциал интеграции в чат-боты, соцсети и новостные сайты.
https://forecast.safe.ai/
Работает быстро и даёт детальный разбор по прогнозу, собирает инфу с около десятка источников и проводит критический анализ.
Интересная игрушка.
#FiveThirtyNine #Forecasting #DecisionMaking
-------
@tsingular
Бот на базе GPT-4o анализирует новости, статьи и выдаёт вероятности для любых запросов.
Точность 87.7% при тестировании на 177 вопросах Metaculus.
Превосходит опытных аналитиков и сравним по эффективности с командой экспертов.
Ограничения: отсутствие тонкой настройки, работа с недавними событиями.
Потенциал интеграции в чат-боты, соцсети и новостные сайты.
https://forecast.safe.ai/
Работает быстро и даёт детальный разбор по прогнозу, собирает инфу с около десятка источников и проводит критический анализ.
Интересная игрушка.
#FiveThirtyNine #Forecasting #DecisionMaking
-------
@tsingular
👍4
Forwarded from GigaChat
This media is not supported in your browser
VIEW IN TELEGRAM
Обновления GigaChat: новая архитектура, высокая скорость и улучшенное качество ответов 🔥
Что поменялось в модели GigaChat PRO:
⭕️ увеличили скорость в 3 раза — быстрее, чем открыть поисковик
⭕️ сделали ответы красивее: параграфы, выделение текста, заголовки и многое другое. Теперь вам удобнее пользоваться решениями GigaChat
⭕️ увеличили контекст до 32 тысяч токенов. Это целых 60 страниц текста — в 5 раз больше прошлой версии
⭕️ улучшили качество ответов по:
— математике (GSM8k +15%, MATH +9,5%)
— коду (HumanEval +4%)
— наукам высокой сложности (GPQA +5%)
— финансовой и банковской тематике
🖥 GigaChat, подбери мне осенний плейлист
Что поменялось в модели GigaChat PRO:
— математике (GSM8k +15%, MATH +9,5%)
— коду (HumanEval +4%)
— наукам высокой сложности (GPQA +5%)
— финансовой и банковской тематике
Обновление также коснулось модели для бизнеса GigaChat Lite: её перевели на новую архитектуру Mixture of Experts и улучшили качество ответов на вопросы о музыке, кино, праве, книгах.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥13
O1 - новый набор моделей от OpenAI с поддержкой рассуждений
OpenAI представила новую серию моделей ИИ под названием OpenAI o1, специализирующихся на сложных рассуждениях и решении задач.
Модель o1-preview значительно превосходит предыдущие модели в таких областях, как математика, написание кода и решение научных задачи.
Например, она решила 83% задач на олимпиаде по математике, где GPT-4 решил только 13%.
o1 использует "цепочку мыслей" - внутренний процесс рассуждений перед выдачей ответа. Это помогает модели лучше решать сложные задачи.
Новый подход к обучению, интегрирующий правила безопасности в цепочку мыслей модели, значительно улучшил устойчивость o1 к попыткам обхода ограничений.
OpenAI планирует выпускать улучшенные версии o1 в будущем и ожидает, что эти модели откроют новые возможности применения ИИ в науке, программировании и математике.
Модель o1-mini представлена как более быстрая и дешевая версия для разработчиков, особенно эффективна в написании кода.
— в неделю можно отправить 30 сообщений в старшую версию o1-preview
— и 50 сообщений в маленькую o1-mini
В API ограничений нет, кроме как на 20 запросов в минуту.
Сегодня раскатывают на всех владельцев подписки Plus и API у кого есть Tier5 (у мну есть хехе. :) ), но дорогая, поэтому пока посмотрим, почитаем, потестируем, но в ботов ставить не буду.
С Днём Программиста по версии OpenAI. :)
Anthropic, когда Opus 3.5 уже?
#OpenAI #O1 #LLM
———
@tsungular
OpenAI представила новую серию моделей ИИ под названием OpenAI o1, специализирующихся на сложных рассуждениях и решении задач.
Модель o1-preview значительно превосходит предыдущие модели в таких областях, как математика, написание кода и решение научных задачи.
Например, она решила 83% задач на олимпиаде по математике, где GPT-4 решил только 13%.
o1 использует "цепочку мыслей" - внутренний процесс рассуждений перед выдачей ответа. Это помогает модели лучше решать сложные задачи.
Новый подход к обучению, интегрирующий правила безопасности в цепочку мыслей модели, значительно улучшил устойчивость o1 к попыткам обхода ограничений.
OpenAI планирует выпускать улучшенные версии o1 в будущем и ожидает, что эти модели откроют новые возможности применения ИИ в науке, программировании и математике.
Модель o1-mini представлена как более быстрая и дешевая версия для разработчиков, особенно эффективна в написании кода.
— в неделю можно отправить 30 сообщений в старшую версию o1-preview
— и 50 сообщений в маленькую o1-mini
В API ограничений нет, кроме как на 20 запросов в минуту.
Сегодня раскатывают на всех владельцев подписки Plus и API у кого есть Tier5 (у мну есть хехе. :) ), но дорогая, поэтому пока посмотрим, почитаем, потестируем, но в ботов ставить не буду.
С Днём Программиста по версии OpenAI. :)
Anthropic, когда Opus 3.5 уже?
#OpenAI #O1 #LLM
———
@tsungular
👍31 5❤2🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
GPT o1-mini с 1 запроса написал игру PONG
код положу в комментарии, запускать на компьютере.
Управление стрелками и WS
сам запрос :
write pong game using JS, HTML with CSS. provide with single code at one file
вот этого теперь достаточно, чтобы получить результат.
#o1-mini
———
@tsingular
код положу в комментарии, запускать на компьютере.
Управление стрелками и WS
сам запрос :
write pong game using JS, HTML with CSS. provide with single code at one file
вот этого теперь достаточно, чтобы получить результат.
#o1-mini
———
@tsingular
👍17🆒5
This media is not supported in your browser
VIEW IN TELEGRAM
ещё один пример - Matrix style screensaver
строка запроса:
write matrix style screensaver using JS, HTML and CSS with background with japaneese style characters with time floating diagonally and bouncing off the screen borders around slowly like at screensaver. should autodetect screen size and proportion and adjust automatically to work perfectly on any device, PC or smartphone. provide single file with code, no commentary
и тоже с первого раза без ошибок!
код в комментарии.
#o1-mini
———
@tsingular
строка запроса:
write matrix style screensaver using JS, HTML and CSS with background with japaneese style characters with time floating diagonally and bouncing off the screen borders around slowly like at screensaver. should autodetect screen size and proportion and adjust automatically to work perfectly on any device, PC or smartphone. provide single file with code, no commentary
и тоже с первого раза без ошибок!
код в комментарии.
#o1-mini
———
@tsingular
👍17 3
Forwarded from Denis Sexy IT 🤖
Официальный советы по промпт-инженерингу o1:
Держите промпты простыми и прямолинейными: модель o1 превосходно понимает и отвечает на краткие, четкие инструкции без необходимости в обширных объяснениях
Избегайте промптов с цепочкой рассуждений (речь про Chain Of thoughts и «думай шаг за шагом»):
так как модель выполняет логические выводы внутри себя, не нужно побуждать ее «думать шаг за шагом» или «объяснять своё рассуждение вслух»
Используйте разделители для ясности: используйте разделители, такие как тройные кавычки
Ограничьте дополнительный контекст при генерации с RAG:
при предоставлении дополнительного контекста или документов включайте только самую релевантную информацию, чтобы предотвратить усложнение ответа моделью
***
Это интересно, то есть промпт-инженеринг в такой модели уже совсем не нужен, кроме систематизации данных – жду не дождусь доступа
Видимо, в gpt5 уже и промпты не нужны будут, да?
Держите промпты простыми и прямолинейными: модель o1 превосходно понимает и отвечает на краткие, четкие инструкции без необходимости в обширных объяснениях
Избегайте промптов с цепочкой рассуждений (речь про Chain Of thoughts и «думай шаг за шагом»):
так как модель выполняет логические выводы внутри себя, не нужно побуждать ее «думать шаг за шагом» или «объяснять своё рассуждение вслух»
Используйте разделители для ясности: используйте разделители, такие как тройные кавычки
```, XML-теги или заголовки разделов, чтобы четко обозначить разные части ввода, помогая модели правильно интерпретировать различные секцииОграничьте дополнительный контекст при генерации с RAG:
при предоставлении дополнительного контекста или документов включайте только самую релевантную информацию, чтобы предотвратить усложнение ответа моделью
***
Это интересно, то есть промпт-инженеринг в такой модели уже совсем не нужен, кроме систематизации данных – жду не дождусь доступа
Видимо, в gpt5 уже и промпты не нужны будут, да?
👍12
Когда получите возможность задать вопросы o1 - НИКОГДА не задавайте вот эти простые, которые он предлагает в меню.
Помните, что вопросов всего 30 в НЕДЕЛЮ. :)
Не разменивайтесь на глупости.
#o1
———
@tsingular
Помните, что вопросов всего 30 в НЕДЕЛЮ. :)
Не разменивайтесь на глупости.
#o1
———
@tsingular
👍2
Достаточно интересный для изучения документ system card o1.
Расписаны техники работы внутренних цепочек мышления.
Разобрано как работает и как тестировалось построение причинно-следственных рассуждений.
Модельку даже тестировали в CTF мероприятиях по кибербезу, где она себя уже неплохо показала на начальном уровне.
В том числе разобрано противостояние манипуляциям на генерацию запрещённого контента с разбором техник типа, - подкуп, подмена цели разговора, убеждение, обман и т.д.
В общем, must read!
#o1 #system
———
@tsingular
Расписаны техники работы внутренних цепочек мышления.
Разобрано как работает и как тестировалось построение причинно-следственных рассуждений.
Модельку даже тестировали в CTF мероприятиях по кибербезу, где она себя уже неплохо показала на начальном уровне.
В том числе разобрано противостояние манипуляциям на генерацию запрещённого контента с разбором техник типа, - подкуп, подмена цели разговора, убеждение, обман и т.д.
В общем, must read!
#o1 #system
———
@tsingular
👍1🔥1