Технозаметки Малышева – Telegram

Технозаметки Малышева

8.63K subscribers

3.84K photos

1.43K videos

40 files

4.01K links

Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb

Download Telegram

About

Blog

Apps

Platform

Технозаметки Малышева

8.63K subscribers

Технозаметки Малышева

Оптимизация обучения LLM на устаревшем железе

Ученые из Университета Сучжоу разработали MemLong - метод, расширяющий контекст LLM с 2000 до 80000 токенов на карте двухлетней давности - NVIDIA 3090.
Технология использует внешний ретривер для извлечения данных и сохраняет нижние слои модели неизменными, обучая только верхние.
MemLong превосходит современные аналоги в задачах с длинным контекстом на 10.2%.
Для примера, - для обучения 3-миллиардной модели хватило 8 GPU NVIDIA 3090 в течение 8 часов.

Ну т.е. потенциально любой "в гараже" может обучать модели средней мощности. У всех ведь есть гараж с 8х3090 ? :)

#MemLong #NVIDIA #GPU
-------
@tsingular

👍5👀1

2.68K viewsedited 07:22

Технозаметки Малышева

Ключевой разработчик GPT-4o покидает OpenAI чтобы запустить свой стартап.

Алексис Конно, ведущий исследователь OpenAI, покинул компанию для запуска собственного AI-стартапа.

Его новый проект нацелен на создание "общего эмоционального интеллекта" (AGEI).
Конно был ключевой фигурой в разработке GPT-4o, способного работать с текстом, изображениями и аудио.

Ранее он трудился в Facebook AI Research, внеся вклад в проекты InferSent, MUSE, XNLI и XLM.

Вот Эмоционального интеллекта очень не хватает рынку.
Даже, возможно, как сервис или каскад моделей разного размера.

#OpenAI #GPT4o #EmotionalIntelligence
-------
@tsingular

👍13🤔10👻1

3.24K views07:28

Технозаметки Малышева

NVIDIA предлагает OP-RAG подход для улучшения работы LLM с длинными текстами

Исследователи NVIDIA представили метод Order-Preserving Retrieval-Augmented Generation (OP-RAG), который повышает качество ответов LLM.
Технология решает проблему обработки длинных контекстов в LLM, через сохранение порядка RAG фрагментов в соответствии с их порядком в документе.
OP-RAG повышает точность и эффективность по сравнению с традиционными LLM с RAG по векторной близости.

На датасете EN.QA метод достиг F1-счета 47.25 при использовании 48K токенов, а на EN.MC - точности 88.65 с 24K токенами.

Технология требует меньше вычислительных ресурсов для достижения лучших результатов по сравнению с GPT-4O и Gemini-1.5-Pro.

Потому, что порядок должен быть в библиотеке! :)
Идея по сути простая и в реализации ещё проще, но вот, повышает качество ответов по большим документам, поди ж ты.

#NVIDIA #OP-RAG #LLM
-------
@tsingular

👍6❤1

2.62K viewsedited 07:39

Технозаметки Малышева

ServiceNow внедряет ИИ-агентов в платформу Xanadu

Компания ServiceNow представила обновление Now Platform под кодовым названием Xanadu.
Ключевое нововведение - интеграция агентных ИИ в систему управления корпоративными услугами.

AI-агенты будут внедрены в работу с клиентами, ИТ, HR, закупки и разработку ПО.

Выпущен Now Assist Skill Kit для создания кастомных настроек для агентов с набором из 350+ функций.
Работает все на RaptorDB Pro.

Всё больше агентов. Вчера Salesforce, сегодня ServiceNow.
Надо уже биржу труда для агентов запускать что-ли. :)

#ServiceNow #Xanadu #AIagents
-------
@tsingular

👍3🔥1

1.49K views07:59

Технозаметки Малышева

Forwarded from e/acc

Oбзор ИИ-программистов

Для тех, кому интересна тема того как ИИ заменяет программистов, очень советую почитать мета-исследование, в котором сравнены 106 различных агентов по своим способностям, автономности, архитектуре и области применения.

Авторы сделали офигенную работу по определению агента (это система, которая может воспринимать информацию, использовать инструменты, планировать, запоминать и самостоятельно действовать). Мульти-агентная система, в которой есть роли агентов, включая роли менеджеров, анализа требований, проектировщиков, разработчиков, роли тестирования, отладки и вспомогательные роли.

Так же они определили области применения, большая часть из которых (вопреки яростно комментирующим) — это не просто написание кода, но формирование требований, дизайн, генерация кода, написание теста, статический анализ, поиск багов, фикс багов и девопс.

В статье много жира, например описание и сравнение всех 106 агентов по их функционалу и качеству или описание механизмов взаимодействия в мультиагентных системах (говорят, что 56% всех систем — мультиагентные), а так же детальный разбор каждого этапа и разных подходов к их решению.

Найти список всех 106 (бесплатных, с открытым кодом) агентов-программистов можно в референсах статьи.

👍12

3.57K views12:47

Технозаметки Малышева

Новости Москвы

⛪Развитие технологий ИИ без веры в Бога приближает апокалипсис, — патриарх Кирилл

Ну это в цитаты, однозначно
———
@tsingular

😁7❤‍🔥2❤1

2.07K viewsedited 13:14

Технозаметки Малышева

Klarna отказывается от Salesforce и Workday в пользу ИИ

Шведский финтех-гигант Klarna прекращает сотрудничество с ключевыми SaaS-провайдерами.
Компания отказывается от услуг Salesforce, а вскоре планирует завершить работу и с Workday.
Эти шаги - часть масштабной инициативы по оптимизации технологического стека с помощью искусственного интеллекта.
Klarna стремится к стандартизации и упрощению своих систем для повышения эффективности и качества работы.
Компания также планирует сократить штат, используя ИИ для снижения затрат.
Несмотря на эти изменения, во втором квартале выручка Klarna выросла на 27% до 13,3 млрд шведских крон.

Похоже, ИИ начинает вытеснять даже гигантов SaaS. Интересно, кто следующий? 🤔

#Klarna #Salesforce #Workday
-------
@tsingular

1.81K views14:06

Технозаметки Малышева

This media is not supported in your browser

VIEW IN TELEGRAM

Adobe догоняет тренд генерации видео по тексту

Компания Adobe анонсировала интеграцию генеративных видеовозможностей в своей экосистеме.
Новые инструменты на основе модели Firefly позволят создавать короткие видеоролики из текста и статичных изображений.
Пользователи смогут настраивать результаты с помощью элементов управления камерой.
Функция "Generative Extend" в Premiere Pro увеличит длительность существующего видео.
Максимальная продолжительность генерируемых клипов - 5 секунд.

Планируется интеграция в Creative Cloud, Experience Cloud и Adobe Express.

Вот и профессионалы подтянулись. Хотя 5 секунд, конечно, маловато.

#Adobe #Firefly #GenerativeVideo
-------
@tsingular

👍5❤1🆒1

2.73K viewsedited 14:17

Технозаметки Малышева

Oracle и NVIDIA: лютейшая производительность зеттамасштаба для ИИ

Oracle анонсировала первый зеттамасштабный суперкластер OCI на базе NVIDIA Blackwell.
Пиковая производительность: 2,4 зеттафлопс на 131 072 GPU Blackwell.
Кластеры с GPU H100 достигают 65 экзафлопс, а с H200 - 260 экзафлопс.
Экземпляры NVIDIA GB200 NVL72 объединяют до 72 GPU Blackwell.
прессрелиз Oracle

В 2025-м кластеры улетят в космос. И по производительности и по энергопотреблению. 🌩💻

#Oracle #NVIDIA #Blackwell
-------
@tsingular

👍6

3.26K viewsedited 14:28

Технозаметки Малышева

Denis Sexy IT 🤖

Он позволяет считывать речь почти беззвучно (!), то есть ты просто губами двигаешь и апп переводит это в текст – работает только с английским пока что (но главное, что работает, я протестировал – правда запустилось пока только в режиме debug)

———
@tsingular

❤3

3.96K viewsedited 14:47

Технозаметки Малышева

This media is not supported in your browser

VIEW IN TELEGRAM

новый Mac-апп:
https://symphoniclabs.com/

Сервис, - мечта разведчика! :)

———
@tsingular

👍9🤔7🤣5❤1🔥1

5.26K viewsedited 14:48

Технозаметки Малышева

Агенты на базе LLM: умные помощники в разработке ПО

Программные агенты на основе LLM становятся ключевыми инструментами в сфере разработки ПО.

Эти интеллектуальные ассистенты способны взаимодействовать с внешними ресурсами и инструментами, участвуя во всех этапах создания программного обеспечения.

Ключевые компоненты агентов включают саму LLM, планировщик, память и набор инструментов.

Планирование может быть одно- или многоэтапным, а план представляется в различных форматах.

Память агентов делится на кратковременную и долговременную, индивидуальную и общую, хранящую данные в разных форматах.

В многоагентных системах ИИ-помощники могут выполнять роли, аналогичные реальным командам разработчиков.

на русском
arxiv
GitHub

Отличное обобщение от Сергея @pimenov_ru про ИИ агентов на русском языке.
Как вводный мини-курс, рекомендую к ознакомлению.
Сегодня про агентов много как-то получается, пора уже своих делать. :) 🤖💻

#LLM #Agents
-------
@tsingular

👍4🔥1

2.4K viewsedited 16:35

Технозаметки Малышева

Mistral.rs: Универсальная платформа для быстрого инференса LLM

Eric L Buehler представил Mistral.rs - сверхбыструю платформу для запуска LLM.
Ключевые особенности:
• Широкая совместимость: поддержка GPU, CPU, Apple Metal.
• Автоматическая оптимизация: квантизация, PagedAttention, непрерывная пакетная обработка.
• Гибкость: HTTP-сервер (OpenAI API), Python-биндинги, Rust API.
• Расширенные возможности: X-LoRA, LoRA адаптеры, мультимодальность.
• Удобство: автозагрузка с Hugging Face Hub, интерактивный режим.
Платформа поддерживает множество моделей и форматов, включая GGUF и GGML.

~~-Швейцарский-~~ Французский нож в мире локального инференса.
Для любителей, - обязательно к ознакомлению. 🚀🧠

#Mistral.rs #LLM #Inference
-------
@tsingular

🔥4👍1

2.51K viewsedited 17:55

Технозаметки Малышева

Учёные разработали способ разворачивать старение вспять

Обнаружено шесть вариаций из малых молекул, которые за неделю восстанавливали молодой профиль экспрессии генов в стареющих человеческих фибробластах.
Самый эффективный коктейль (VC6TF) содержал вальпроевую кислоту, CHIR-99021, E-616452, транилципромин и форсколин.
Эффекты омоложения были сопоставимы с генетической индукцией факторов Яманаки (OCT4, SOX2, KLF4).
Химические обработки не вызывали изменение идентичности клеток.

Эффект 4-дневной обработки сравним с годовым курсом регенеративной терапии.
Коктейли активируют клеточное дыхание и подавляют воспаление.
Разработана система NCC для различения молодых и старых клеток в реальном времени.
Исследование подтверждает Информационную теорию старения, - что старые клетки сохраняют информацию для сброса биологического возраста.

Источник: https://www.aging-us.com/article/204896/text

Подписка на бессмертие за 80% ваших денег ежемесячно.
Берём? :)

#EPOCH #cellularAging #regenerativeMedicine
-------
@tsingular

❤7🔥7✍1🤔1🍓1

3.35K viewsedited 03:40

Технозаметки Малышева

Яндекс запустил AI-помощника для программистов

Yandex Code Assistant - новый ИИ-инструмент для разработчиков, созданный Яндексом, находится в стадии Preview.
Ассистент генерирует код за 400 мс, поддерживает 30+ языков программирования и популярные редакторы.
Сервис доступен бесплатно в тестовом режиме через Yandex Cloud.

Ассистент не нагружает локальные машины, работая из облака.
Есть плагин для VS Code

Норм подарок на День программиста :)

#Yandex #CodeAssistant #devtools
-------
@tsingular

🔥13

3.73K viewsedited 07:09

Технозаметки Малышева

FiveThirtyNine: ИИ-бот - эксперт в аналитических прогнозах

Бот на базе GPT-4o анализирует новости, статьи и выдаёт вероятности для любых запросов.

Точность 87.7% при тестировании на 177 вопросах Metaculus.
Превосходит опытных аналитиков и сравним по эффективности с командой экспертов.

Ограничения: отсутствие тонкой настройки, работа с недавними событиями.
Потенциал интеграции в чат-боты, соцсети и новостные сайты.

https://forecast.safe.ai/

Работает быстро и даёт детальный разбор по прогнозу, собирает инфу с около десятка источников и проводит критический анализ.
Интересная игрушка.

#FiveThirtyNine #Forecasting #DecisionMaking
-------
@tsingular

👍4

4.01K views09:11

Технозаметки Малышева

Forwarded from GigaChat

This media is not supported in your browser

VIEW IN TELEGRAM

Обновления GigaChat: новая архитектура, высокая скорость и улучшенное качество ответов

🔥

Что поменялось в модели GigaChat PRO:

⭕️ увеличили скорость в 3 раза — быстрее, чем открыть поисковик

⭕️ сделали ответы красивее: параграфы, выделение текста, заголовки и многое другое. Теперь вам удобнее пользоваться решениями GigaChat

⭕️ увеличили контекст до 32 тысяч токенов. Это целых 60 страниц текста — в 5 раз больше прошлой версии

⭕️ улучшили качество ответов по:
— математике (GSM8k +15%, MATH +9,5%)
— коду (HumanEval +4%)
— наукам высокой сложности (GPQA +5%)
— финансовой и банковской тематике

Обновление также коснулось модели для бизнеса GigaChat Lite: её перевели на новую архитектуру Mixture of Experts и улучшили качество ответов на вопросы о музыке, кино, праве, книгах.

🖥

GigaChat, подбери мне осенний плейлист

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥13

4.41K views14:23

Технозаметки Малышева

O1 - новый набор моделей от OpenAI с поддержкой рассуждений

OpenAI представила новую серию моделей ИИ под названием OpenAI o1, специализирующихся на сложных рассуждениях и решении задач.

Модель o1-preview значительно превосходит предыдущие модели в таких областях, как математика, написание кода и решение научных задачи.
Например, она решила 83% задач на олимпиаде по математике, где GPT-4 решил только 13%.

o1 использует "цепочку мыслей" - внутренний процесс рассуждений перед выдачей ответа. Это помогает модели лучше решать сложные задачи.

Новый подход к обучению, интегрирующий правила безопасности в цепочку мыслей модели, значительно улучшил устойчивость o1 к попыткам обхода ограничений.

OpenAI планирует выпускать улучшенные версии o1 в будущем и ожидает, что эти модели откроют новые возможности применения ИИ в науке, программировании и математике.

Модель o1-mini представлена как более быстрая и дешевая версия для разработчиков, особенно эффективна в написании кода.

— в неделю можно отправить 30 сообщений в старшую версию o1-preview
— и 50 сообщений в маленькую o1-mini

В API ограничений нет, кроме как на 20 запросов в минуту.

Сегодня раскатывают на всех владельцев подписки Plus и API у кого есть Tier5 (у мну есть хехе. :) ), но дорогая, поэтому пока посмотрим, почитаем, потестируем, но в ботов ставить не буду.

С Днём Программиста по версии OpenAI. :)

Anthropic, когда Opus 3.5 уже?

#OpenAI #O1 #LLM
———
@tsungular

👍315❤2🔥1

6.05K viewsedited 17:43

Технозаметки Малышева

This media is not supported in your browser

VIEW IN TELEGRAM

GPT o1-mini с 1 запроса написал игру PONG

код положу в комментарии, запускать на компьютере.
Управление стрелками и WS

сам запрос :
write pong game using JS, HTML with CSS. provide with single code at one file

вот этого теперь достаточно, чтобы получить результат.

#o1-mini
———
@tsingular

👍17🆒5

3.48K viewsedited 18:11