Технозаметки Малышева
8.63K subscribers
3.84K photos
1.43K videos
40 files
4.01K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
Оптимизация обучения LLM на устаревшем железе

Ученые из Университета Сучжоу разработали MemLong - метод, расширяющий контекст LLM с 2000 до 80000 токенов на карте двухлетней давности - NVIDIA 3090.
Технология использует внешний ретривер для извлечения данных и сохраняет нижние слои модели неизменными, обучая только верхние.
MemLong превосходит современные аналоги в задачах с длинным контекстом на 10.2%.
Для примера, - для обучения 3-миллиардной модели хватило 8 GPU NVIDIA 3090 в течение 8 часов.

Ну т.е. потенциально любой "в гараже" может обучать модели средней мощности. У всех ведь есть гараж с 8х3090 ? :)

#MemLong #NVIDIA #GPU
-------
@tsingular
👍5👀1
Ключевой разработчик GPT-4o покидает OpenAI чтобы запустить свой стартап.

Алексис Конно, ведущий исследователь OpenAI, покинул компанию для запуска собственного AI-стартапа.

Его новый проект нацелен на создание "общего эмоционального интеллекта" (AGEI).
Конно был ключевой фигурой в разработке GPT-4o, способного работать с текстом, изображениями и аудио.

Ранее он трудился в Facebook AI Research, внеся вклад в проекты InferSent, MUSE, XNLI и XLM.

Вот Эмоционального интеллекта очень не хватает рынку.
Даже, возможно, как сервис или каскад моделей разного размера.

#OpenAI #GPT4o #EmotionalIntelligence
-------
@tsingular
👍13🤔10👻1
NVIDIA предлагает OP-RAG подход для улучшения работы LLM с длинными текстами

Исследователи NVIDIA представили метод Order-Preserving Retrieval-Augmented Generation (OP-RAG), который повышает качество ответов LLM.
Технология решает проблему обработки длинных контекстов в LLM, через сохранение порядка RAG фрагментов в соответствии с их порядком в документе.
OP-RAG повышает точность и эффективность по сравнению с традиционными LLM с RAG по векторной близости.

На датасете EN.QA метод достиг F1-счета 47.25 при использовании 48K токенов, а на EN.MC - точности 88.65 с 24K токенами.

Технология требует меньше вычислительных ресурсов для достижения лучших результатов по сравнению с GPT-4O и Gemini-1.5-Pro.

Потому, что порядок должен быть в библиотеке! :)
Идея по сути простая и в реализации ещё проще, но вот, повышает качество ответов по большим документам, поди ж ты.

#NVIDIA #OP-RAG #LLM
-------
@tsingular
👍61
ServiceNow внедряет ИИ-агентов в платформу Xanadu

Компания ServiceNow представила обновление Now Platform под кодовым названием Xanadu.
Ключевое нововведение - интеграция агентных ИИ в систему управления корпоративными услугами.

AI-агенты будут внедрены в работу с клиентами, ИТ, HR, закупки и разработку ПО.

Выпущен Now Assist Skill Kit для создания кастомных настроек для агентов с набором из 350+ функций.
Работает все на RaptorDB Pro.

Всё больше агентов. Вчера Salesforce, сегодня ServiceNow.
Надо уже биржу труда для агентов запускать что-ли. :)

#ServiceNow #Xanadu #AIagents
-------
@tsingular
👍3🔥1
Forwarded from e/acc
Oбзор ИИ-программистов

Для тех, кому интересна тема того как ИИ заменяет программистов, очень советую почитать мета-исследование, в котором сравнены 106 различных агентов по своим способностям, автономности, архитектуре и области применения.

Авторы сделали офигенную работу по определению агента (это система, которая может воспринимать информацию, использовать инструменты, планировать, запоминать и самостоятельно действовать). Мульти-агентная система, в которой есть роли агентов, включая роли менеджеров, анализа требований, проектировщиков, разработчиков, роли тестирования, отладки и вспомогательные роли.

Так же они определили области применения, большая часть из которых (вопреки яростно комментирующим) — это не просто написание кода, но формирование требований, дизайн, генерация кода, написание теста, статический анализ, поиск багов, фикс багов и девопс.

В статье много жира, например описание и сравнение всех 106 агентов по их функционалу и качеству или описание механизмов взаимодействия в мультиагентных системах (говорят, что 56% всех систем — мультиагентные), а так же детальный разбор каждого этапа и разных подходов к их решению.

Найти список всех 106 (бесплатных, с открытым кодом) агентов-программистов можно в референсах статьи.
👍12
Klarna отказывается от Salesforce и Workday в пользу ИИ

Шведский финтех-гигант Klarna прекращает сотрудничество с ключевыми SaaS-провайдерами.
Компания отказывается от услуг Salesforce, а вскоре планирует завершить работу и с Workday.
Эти шаги - часть масштабной инициативы по оптимизации технологического стека с помощью искусственного интеллекта.
Klarna стремится к стандартизации и упрощению своих систем для повышения эффективности и качества работы.
Компания также планирует сократить штат, используя ИИ для снижения затрат.
Несмотря на эти изменения, во втором квартале выручка Klarna выросла на 27% до 13,3 млрд шведских крон.

Похоже, ИИ начинает вытеснять даже гигантов SaaS. Интересно, кто следующий? 🤔

#Klarna #Salesforce #Workday
-------
@tsingular
This media is not supported in your browser
VIEW IN TELEGRAM
Adobe догоняет тренд генерации видео по тексту

Компания Adobe анонсировала интеграцию генеративных видеовозможностей в своей экосистеме.
Новые инструменты на основе модели Firefly позволят создавать короткие видеоролики из текста и статичных изображений.
Пользователи смогут настраивать результаты с помощью элементов управления камерой.
Функция "Generative Extend" в Premiere Pro увеличит длительность существующего видео.
Максимальная продолжительность генерируемых клипов - 5 секунд.

Планируется интеграция в Creative Cloud, Experience Cloud и Adobe Express.

Вот и профессионалы подтянулись. Хотя 5 секунд, конечно, маловато.

#Adobe #Firefly #GenerativeVideo
-------
@tsingular
👍51🆒1
Oracle и NVIDIA: лютейшая производительность зеттамасштаба для ИИ

Oracle анонсировала первый зеттамасштабный суперкластер OCI на базе NVIDIA Blackwell.
Пиковая производительность: 2,4 зеттафлопс на 131 072 GPU Blackwell.
Кластеры с GPU H100 достигают 65 экзафлопс, а с H200 - 260 экзафлопс.
Экземпляры NVIDIA GB200 NVL72 объединяют до 72 GPU Blackwell.
прессрелиз Oracle

В 2025-м кластеры улетят в космос. И по производительности и по энергопотреблению. 🌩💻

#Oracle #NVIDIA #Blackwell
-------
@tsingular
👍6
This media is not supported in your browser
VIEW IN TELEGRAM
новый Mac-апп:
https://symphoniclabs.com/

Сервис, - мечта разведчика! :)

———
@tsingular
👍9🤔7🤣51🔥1
Агенты на базе LLM: умные помощники в разработке ПО

Программные агенты на основе LLM становятся ключевыми инструментами в сфере разработки ПО.

Эти интеллектуальные ассистенты способны взаимодействовать с внешними ресурсами и инструментами, участвуя во всех этапах создания программного обеспечения.

Ключевые компоненты агентов включают саму LLM, планировщик, память и набор инструментов.

Планирование может быть одно- или многоэтапным, а план представляется в различных форматах.

Память агентов делится на кратковременную и долговременную, индивидуальную и общую, хранящую данные в разных форматах.

В многоагентных системах ИИ-помощники могут выполнять роли, аналогичные реальным командам разработчиков.

на русском
arxiv
GitHub

Отличное обобщение от Сергея @pimenov_ru про ИИ агентов на русском языке.
Как вводный мини-курс, рекомендую к ознакомлению.
Сегодня про агентов много как-то получается, пора уже своих делать. :) 🤖💻

#LLM #Agents
-------
@tsingular
👍4🔥1
Mistral.rs: Универсальная платформа для быстрого инференса LLM

Eric L Buehler представил Mistral.rs - сверхбыструю платформу для запуска LLM.
Ключевые особенности:
Широкая совместимость: поддержка GPU, CPU, Apple Metal.
Автоматическая оптимизация: квантизация, PagedAttention, непрерывная пакетная обработка.
Гибкость: HTTP-сервер (OpenAI API), Python-биндинги, Rust API.
Расширенные возможности: X-LoRA, LoRA адаптеры, мультимодальность.
Удобство: автозагрузка с Hugging Face Hub, интерактивный режим.
Платформа поддерживает множество моделей и форматов, включая GGUF и GGML.

-Швейцарский- Французский нож в мире локального инференса.
Для любителей, - обязательно к ознакомлению. 🚀🧠

#Mistral.rs #LLM #Inference
-------
@tsingular
🔥4👍1
Учёные разработали способ разворачивать старение вспять

Обнаружено шесть вариаций из малых молекул, которые за неделю восстанавливали молодой профиль экспрессии генов в стареющих человеческих фибробластах.
Самый эффективный коктейль (VC6TF) содержал вальпроевую кислоту, CHIR-99021, E-616452, транилципромин и форсколин.
Эффекты омоложения были сопоставимы с генетической индукцией факторов Яманаки (OCT4, SOX2, KLF4).
Химические обработки не вызывали изменение идентичности клеток.

Эффект 4-дневной обработки сравним с годовым курсом регенеративной терапии.
Коктейли активируют клеточное дыхание и подавляют воспаление.
Разработана система NCC для различения молодых и старых клеток в реальном времени.
Исследование подтверждает Информационную теорию старения, - что старые клетки сохраняют информацию для сброса биологического возраста.

Источник: https://www.aging-us.com/article/204896/text

Подписка на бессмертие за 80% ваших денег ежемесячно.
Берём? :)

#EPOCH #cellularAging #regenerativeMedicine
-------
@tsingular
7🔥71🤔1🍓1
Яндекс запустил AI-помощника для программистов

Yandex Code Assistant - новый ИИ-инструмент для разработчиков, созданный Яндексом, находится в стадии Preview.
Ассистент генерирует код за 400 мс, поддерживает 30+ языков программирования и популярные редакторы.
Сервис доступен бесплатно в тестовом режиме через Yandex Cloud.

Ассистент не нагружает локальные машины, работая из облака.
Есть плагин для VS Code

Норм подарок на День программиста :)

#Yandex #CodeAssistant #devtools
-------
@tsingular
🔥13
FiveThirtyNine: ИИ-бот - эксперт в аналитических прогнозах

Бот на базе GPT-4o анализирует новости, статьи и выдаёт вероятности для любых запросов.

Точность 87.7% при тестировании на 177 вопросах Metaculus.
Превосходит опытных аналитиков и сравним по эффективности с командой экспертов.

Ограничения: отсутствие тонкой настройки, работа с недавними событиями.
Потенциал интеграции в чат-боты, соцсети и новостные сайты.

https://forecast.safe.ai/

Работает быстро и даёт детальный разбор по прогнозу, собирает инфу с около десятка источников и проводит критический анализ.
Интересная игрушка.

#FiveThirtyNine #Forecasting #DecisionMaking
-------
@tsingular
👍4
Forwarded from GigaChat
This media is not supported in your browser
VIEW IN TELEGRAM
Обновления GigaChat: новая архитектура, высокая скорость и улучшенное качество ответов 🔥

Что поменялось в модели GigaChat PRO:

⭕️ увеличили скорость в 3 раза — быстрее, чем открыть поисковик

⭕️ сделали ответы красивее: параграфы, выделение текста, заголовки и многое другое. Теперь вам удобнее пользоваться решениями GigaChat

⭕️ увеличили контекст до 32 тысяч токенов. Это целых 60 страниц текста — в 5 раз больше прошлой версии

⭕️ улучшили качество ответов по:
— математике (GSM8k +15%, MATH +9,5%)
— коду (HumanEval +4%)
— наукам высокой сложности (GPQA +5%)
— финансовой и банковской тематике

Обновление также коснулось модели для бизнеса GigaChat Lite: её перевели на новую архитектуру Mixture of Experts и улучшили качество ответов на вопросы о музыке, кино, праве, книгах.


🖥 GigaChat, подбери мне осенний плейлист
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥13
O1 - новый набор моделей от OpenAI с поддержкой рассуждений

OpenAI представила новую серию моделей ИИ под названием OpenAI o1, специализирующихся на сложных рассуждениях и решении задач.

Модель o1-preview значительно превосходит предыдущие модели в таких областях, как математика, написание кода и решение научных задачи.
Например, она решила 83% задач на олимпиаде по математике, где GPT-4 решил только 13%.

o1 использует "цепочку мыслей" - внутренний процесс рассуждений перед выдачей ответа. Это помогает модели лучше решать сложные задачи.

Новый подход к обучению, интегрирующий правила безопасности в цепочку мыслей модели, значительно улучшил устойчивость o1 к попыткам обхода ограничений.

OpenAI планирует выпускать улучшенные версии o1 в будущем и ожидает, что эти модели откроют новые возможности применения ИИ в науке, программировании и математике.

Модель o1-mini представлена как более быстрая и дешевая версия для разработчиков, особенно эффективна в написании кода.

в неделю можно отправить 30 сообщений в старшую версию o1-preview
— и 50 сообщений в маленькую o1-mini

В API ограничений нет, кроме как на 20 запросов в минуту.

Сегодня раскатывают на всех владельцев подписки Plus и API у кого есть Tier5 (у мну есть хехе. :) ), но дорогая, поэтому пока посмотрим, почитаем, потестируем, но в ботов ставить не буду.

С Днём Программиста по версии OpenAI. :)

Anthropic, когда Opus 3.5 уже?

#OpenAI #O1 #LLM
———
@tsungular
👍3152🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
GPT o1-mini с 1 запроса написал игру PONG

код положу в комментарии, запускать на компьютере.
Управление стрелками и WS

сам запрос :
write pong game using JS, HTML with CSS. provide with single code at one file

вот этого теперь достаточно, чтобы получить результат.

#o1-mini
———
@tsingular
👍17🆒5