Технозаметки Малышева
8.63K subscribers
3.84K photos
1.43K videos
40 files
4.01K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
Forwarded from e/acc
Oбзор ИИ-программистов

Для тех, кому интересна тема того как ИИ заменяет программистов, очень советую почитать мета-исследование, в котором сравнены 106 различных агентов по своим способностям, автономности, архитектуре и области применения.

Авторы сделали офигенную работу по определению агента (это система, которая может воспринимать информацию, использовать инструменты, планировать, запоминать и самостоятельно действовать). Мульти-агентная система, в которой есть роли агентов, включая роли менеджеров, анализа требований, проектировщиков, разработчиков, роли тестирования, отладки и вспомогательные роли.

Так же они определили области применения, большая часть из которых (вопреки яростно комментирующим) — это не просто написание кода, но формирование требований, дизайн, генерация кода, написание теста, статический анализ, поиск багов, фикс багов и девопс.

В статье много жира, например описание и сравнение всех 106 агентов по их функционалу и качеству или описание механизмов взаимодействия в мультиагентных системах (говорят, что 56% всех систем — мультиагентные), а так же детальный разбор каждого этапа и разных подходов к их решению.

Найти список всех 106 (бесплатных, с открытым кодом) агентов-программистов можно в референсах статьи.
👍12
Klarna отказывается от Salesforce и Workday в пользу ИИ

Шведский финтех-гигант Klarna прекращает сотрудничество с ключевыми SaaS-провайдерами.
Компания отказывается от услуг Salesforce, а вскоре планирует завершить работу и с Workday.
Эти шаги - часть масштабной инициативы по оптимизации технологического стека с помощью искусственного интеллекта.
Klarna стремится к стандартизации и упрощению своих систем для повышения эффективности и качества работы.
Компания также планирует сократить штат, используя ИИ для снижения затрат.
Несмотря на эти изменения, во втором квартале выручка Klarna выросла на 27% до 13,3 млрд шведских крон.

Похоже, ИИ начинает вытеснять даже гигантов SaaS. Интересно, кто следующий? 🤔

#Klarna #Salesforce #Workday
-------
@tsingular
This media is not supported in your browser
VIEW IN TELEGRAM
Adobe догоняет тренд генерации видео по тексту

Компания Adobe анонсировала интеграцию генеративных видеовозможностей в своей экосистеме.
Новые инструменты на основе модели Firefly позволят создавать короткие видеоролики из текста и статичных изображений.
Пользователи смогут настраивать результаты с помощью элементов управления камерой.
Функция "Generative Extend" в Premiere Pro увеличит длительность существующего видео.
Максимальная продолжительность генерируемых клипов - 5 секунд.

Планируется интеграция в Creative Cloud, Experience Cloud и Adobe Express.

Вот и профессионалы подтянулись. Хотя 5 секунд, конечно, маловато.

#Adobe #Firefly #GenerativeVideo
-------
@tsingular
👍51🆒1
Oracle и NVIDIA: лютейшая производительность зеттамасштаба для ИИ

Oracle анонсировала первый зеттамасштабный суперкластер OCI на базе NVIDIA Blackwell.
Пиковая производительность: 2,4 зеттафлопс на 131 072 GPU Blackwell.
Кластеры с GPU H100 достигают 65 экзафлопс, а с H200 - 260 экзафлопс.
Экземпляры NVIDIA GB200 NVL72 объединяют до 72 GPU Blackwell.
прессрелиз Oracle

В 2025-м кластеры улетят в космос. И по производительности и по энергопотреблению. 🌩💻

#Oracle #NVIDIA #Blackwell
-------
@tsingular
👍6
This media is not supported in your browser
VIEW IN TELEGRAM
новый Mac-апп:
https://symphoniclabs.com/

Сервис, - мечта разведчика! :)

———
@tsingular
👍9🤔7🤣51🔥1
Агенты на базе LLM: умные помощники в разработке ПО

Программные агенты на основе LLM становятся ключевыми инструментами в сфере разработки ПО.

Эти интеллектуальные ассистенты способны взаимодействовать с внешними ресурсами и инструментами, участвуя во всех этапах создания программного обеспечения.

Ключевые компоненты агентов включают саму LLM, планировщик, память и набор инструментов.

Планирование может быть одно- или многоэтапным, а план представляется в различных форматах.

Память агентов делится на кратковременную и долговременную, индивидуальную и общую, хранящую данные в разных форматах.

В многоагентных системах ИИ-помощники могут выполнять роли, аналогичные реальным командам разработчиков.

на русском
arxiv
GitHub

Отличное обобщение от Сергея @pimenov_ru про ИИ агентов на русском языке.
Как вводный мини-курс, рекомендую к ознакомлению.
Сегодня про агентов много как-то получается, пора уже своих делать. :) 🤖💻

#LLM #Agents
-------
@tsingular
👍4🔥1
Mistral.rs: Универсальная платформа для быстрого инференса LLM

Eric L Buehler представил Mistral.rs - сверхбыструю платформу для запуска LLM.
Ключевые особенности:
Широкая совместимость: поддержка GPU, CPU, Apple Metal.
Автоматическая оптимизация: квантизация, PagedAttention, непрерывная пакетная обработка.
Гибкость: HTTP-сервер (OpenAI API), Python-биндинги, Rust API.
Расширенные возможности: X-LoRA, LoRA адаптеры, мультимодальность.
Удобство: автозагрузка с Hugging Face Hub, интерактивный режим.
Платформа поддерживает множество моделей и форматов, включая GGUF и GGML.

-Швейцарский- Французский нож в мире локального инференса.
Для любителей, - обязательно к ознакомлению. 🚀🧠

#Mistral.rs #LLM #Inference
-------
@tsingular
🔥4👍1
Учёные разработали способ разворачивать старение вспять

Обнаружено шесть вариаций из малых молекул, которые за неделю восстанавливали молодой профиль экспрессии генов в стареющих человеческих фибробластах.
Самый эффективный коктейль (VC6TF) содержал вальпроевую кислоту, CHIR-99021, E-616452, транилципромин и форсколин.
Эффекты омоложения были сопоставимы с генетической индукцией факторов Яманаки (OCT4, SOX2, KLF4).
Химические обработки не вызывали изменение идентичности клеток.

Эффект 4-дневной обработки сравним с годовым курсом регенеративной терапии.
Коктейли активируют клеточное дыхание и подавляют воспаление.
Разработана система NCC для различения молодых и старых клеток в реальном времени.
Исследование подтверждает Информационную теорию старения, - что старые клетки сохраняют информацию для сброса биологического возраста.

Источник: https://www.aging-us.com/article/204896/text

Подписка на бессмертие за 80% ваших денег ежемесячно.
Берём? :)

#EPOCH #cellularAging #regenerativeMedicine
-------
@tsingular
7🔥71🤔1🍓1
Яндекс запустил AI-помощника для программистов

Yandex Code Assistant - новый ИИ-инструмент для разработчиков, созданный Яндексом, находится в стадии Preview.
Ассистент генерирует код за 400 мс, поддерживает 30+ языков программирования и популярные редакторы.
Сервис доступен бесплатно в тестовом режиме через Yandex Cloud.

Ассистент не нагружает локальные машины, работая из облака.
Есть плагин для VS Code

Норм подарок на День программиста :)

#Yandex #CodeAssistant #devtools
-------
@tsingular
🔥13
FiveThirtyNine: ИИ-бот - эксперт в аналитических прогнозах

Бот на базе GPT-4o анализирует новости, статьи и выдаёт вероятности для любых запросов.

Точность 87.7% при тестировании на 177 вопросах Metaculus.
Превосходит опытных аналитиков и сравним по эффективности с командой экспертов.

Ограничения: отсутствие тонкой настройки, работа с недавними событиями.
Потенциал интеграции в чат-боты, соцсети и новостные сайты.

https://forecast.safe.ai/

Работает быстро и даёт детальный разбор по прогнозу, собирает инфу с около десятка источников и проводит критический анализ.
Интересная игрушка.

#FiveThirtyNine #Forecasting #DecisionMaking
-------
@tsingular
👍4
Forwarded from GigaChat
This media is not supported in your browser
VIEW IN TELEGRAM
Обновления GigaChat: новая архитектура, высокая скорость и улучшенное качество ответов 🔥

Что поменялось в модели GigaChat PRO:

⭕️ увеличили скорость в 3 раза — быстрее, чем открыть поисковик

⭕️ сделали ответы красивее: параграфы, выделение текста, заголовки и многое другое. Теперь вам удобнее пользоваться решениями GigaChat

⭕️ увеличили контекст до 32 тысяч токенов. Это целых 60 страниц текста — в 5 раз больше прошлой версии

⭕️ улучшили качество ответов по:
— математике (GSM8k +15%, MATH +9,5%)
— коду (HumanEval +4%)
— наукам высокой сложности (GPQA +5%)
— финансовой и банковской тематике

Обновление также коснулось модели для бизнеса GigaChat Lite: её перевели на новую архитектуру Mixture of Experts и улучшили качество ответов на вопросы о музыке, кино, праве, книгах.


🖥 GigaChat, подбери мне осенний плейлист
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥13
O1 - новый набор моделей от OpenAI с поддержкой рассуждений

OpenAI представила новую серию моделей ИИ под названием OpenAI o1, специализирующихся на сложных рассуждениях и решении задач.

Модель o1-preview значительно превосходит предыдущие модели в таких областях, как математика, написание кода и решение научных задачи.
Например, она решила 83% задач на олимпиаде по математике, где GPT-4 решил только 13%.

o1 использует "цепочку мыслей" - внутренний процесс рассуждений перед выдачей ответа. Это помогает модели лучше решать сложные задачи.

Новый подход к обучению, интегрирующий правила безопасности в цепочку мыслей модели, значительно улучшил устойчивость o1 к попыткам обхода ограничений.

OpenAI планирует выпускать улучшенные версии o1 в будущем и ожидает, что эти модели откроют новые возможности применения ИИ в науке, программировании и математике.

Модель o1-mini представлена как более быстрая и дешевая версия для разработчиков, особенно эффективна в написании кода.

в неделю можно отправить 30 сообщений в старшую версию o1-preview
— и 50 сообщений в маленькую o1-mini

В API ограничений нет, кроме как на 20 запросов в минуту.

Сегодня раскатывают на всех владельцев подписки Plus и API у кого есть Tier5 (у мну есть хехе. :) ), но дорогая, поэтому пока посмотрим, почитаем, потестируем, но в ботов ставить не буду.

С Днём Программиста по версии OpenAI. :)

Anthropic, когда Opus 3.5 уже?

#OpenAI #O1 #LLM
———
@tsungular
👍3152🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
GPT o1-mini с 1 запроса написал игру PONG

код положу в комментарии, запускать на компьютере.
Управление стрелками и WS

сам запрос :
write pong game using JS, HTML with CSS. provide with single code at one file

вот этого теперь достаточно, чтобы получить результат.

#o1-mini
———
@tsingular
👍17🆒5
This media is not supported in your browser
VIEW IN TELEGRAM
ещё один пример - Matrix style screensaver

строка запроса:
write matrix style screensaver using JS, HTML and CSS with background with japaneese style characters with time floating diagonally and bouncing off the screen borders around slowly like at screensaver. should autodetect screen size and proportion and adjust automatically to work perfectly on any device, PC or smartphone. provide single file with code, no commentary

и тоже с первого раза без ошибок!

код в комментарии.

#o1-mini
———
@tsingular
👍173
Forwarded from Denis Sexy IT 🤖
Официальный советы по промпт-инженерингу o1:

Держите промпты простыми и прямолинейными: модель o1 превосходно понимает и отвечает на краткие, четкие инструкции без необходимости в обширных объяснениях

Избегайте промптов с цепочкой рассуждений (речь про Chain Of thoughts и «думай шаг за шагом»):
так как модель выполняет логические выводы внутри себя, не нужно побуждать ее «думать шаг за шагом» или «объяснять своё рассуждение вслух»

Используйте разделители для ясности: используйте разделители, такие как тройные кавычки ```, XML-теги или заголовки разделов, чтобы четко обозначить разные части ввода, помогая модели правильно интерпретировать различные секции

Ограничьте дополнительный контекст при генерации с RAG:
при предоставлении дополнительного контекста или документов включайте только самую релевантную информацию, чтобы предотвратить усложнение ответа моделью

***

Это интересно, то есть промпт-инженеринг в такой модели уже совсем не нужен, кроме систематизации данных – жду не дождусь доступа

Видимо, в gpt5 уже и промпты не нужны будут, да?
👍12
Ну не AGI, ещё. Нет.
Человечество спасено :)

------
@tsingular
😁13👾2
Когда получите возможность задать вопросы o1 - НИКОГДА не задавайте вот эти простые, которые он предлагает в меню.

Помните, что вопросов всего 30 в НЕДЕЛЮ. :)

Не разменивайтесь на глупости.

#o1
———
@tsingular
👍2
Достаточно интересный для изучения документ system card o1.

Расписаны техники работы внутренних цепочек мышления.
Разобрано как работает и как тестировалось построение причинно-следственных рассуждений.

Модельку даже тестировали в CTF мероприятиях по кибербезу, где она себя уже неплохо показала на начальном уровне.

В том числе разобрано противостояние манипуляциям на генерацию запрещённого контента с разбором техник типа, - подкуп, подмена цели разговора, убеждение, обман и т.д.

В общем, must read!

#o1 #system
———
@tsingular
👍1🔥1