Технозаметки Малышева
8.25K subscribers
3.66K photos
1.37K videos
40 files
3.85K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
Появилась утечка, что Антропик готовит следующую модель с размышлениями и поиском.

Обнаружили по иконкам в приложении под iOS.

Опус 3.5 уже так долго маринуют, что можно его под 4м номером выпускать, раз уж такой способный.

#anthropic
———
@tsingular
🔥5
🚀 InfiniteHiP: 3 миллиона токенов на одном GPU!

Интересный подход для обработки сверхдлинных текстов, который решает классическую проблему LLM - ограничение контекстного окна.

- Систему научили обрабатывать контекст в 3 млн токенов на одном GPU (это примерно 2000 страниц текста!)
- Скорость работы в 18.95 раз выше традиционных методов
- Не требует дополнительного обучения модели!!!

🔍 Как это работает:
Система использует "модульное иерархическое сокращение" - представьте, что вы читаете книгу: сначала смотрите на заголовки глав, потом на важные абзацы, затем на ключевые предложения. Похожим образом работает и InfiniteHiP.

💡Менее важная информация хранится в обычной RAM, а не в памяти GPU. При необходимости данные подгружаются обратно. По сути RAG.

Практическое применение:
- Анализ больших документов (контракты, техническая документация)
- Обработка научных статей с сохранением полного контекста
- Работа с большими кодовыми базами

💼 Для бизнеса:
Техники эффективного управления памятью и внимания, разработанные в этом проекте, могут быть полезны для оптимизации других AI-приложений, где критична производительность.

📝 Paper: https://huggingface.co/papers/2502.08910
💻 Исходники: https://github.com/DeepAuto-AI/hip-attention/
▶️ Demo на DeepSeek 14B: https://chat.deepauto.ai/

Вот что мне это напомнило.
В детских книгах раньше как писали:
ГЛАВА ВОСЬМАЯ, в которой Кристофер Робин организует "искпедицию" к Северному Полюсу

В заголовке была краткая аннотация. Очень близко по сути.

#pruning #InfiniteHiP #huggingface
———
@tsingular
🔥531
Короче тут один товарищ в LinkedIn что пишет.

Агенты не нужны, РАГи не нужны, поиск этот ваш не нужен. Вообще ничего не нужно кроме Deepseek R1 в полной комплектации (это 800гигов VRAM) и цикл loop while количеством более 10 минут!.

Т.е. берёшь любую задачу, решаешь её DS и отдаешь ему же на оценку и исправление и переделку не глядя. (вьетнамские флэшбэки из школы)
И после 10-15 ти МИНУТ проверяешь.
Если брать в среднем 30 секунд на цикл, это не менее 20ти прогонов, а то и все 50...

Результаты 100% идеальны. И уж точно лучше любой команды людей.

Ну и классическая рекомендация - ИИ должен быть у вас локально, чтобы вы могли без ограничений грузить его такими циклами.
Сегодня это удовольствие стоит примерно $400К (7хH200 + память + железо вокруг неё) и помещается в 1 стойке.
Не такая уж и большая цена для юрлиц за "бога в коробке".

#deepseek #hardware
———
@tsingular
🤔17👍3🔥3🤯2❤‍🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Microsoft представила революционный квантовый чип Majorana 1

Majorana 1 - первый квантовый процессор с архитектурой Topological Core.

Чип использует топопроводник и содержит 8 топологических кубитов с потенциалом масштабирования до миллиона.

Устройство изготовлено из гибрида арсенида индия и алюминия, работает при сверхнизких температурах.

Ключевые преимущества: цифровое управление, встроенная устойчивость к ошибкам, компактность.

Квантовые компьютеры становятся реальностью - интересно как долго продержатся криптовалюты.
Про пароли обычные вообще можно забыть.

#Microsoft #Majorana #QuantumComputing
------
@tsingular
🔥14💯2
This media is not supported in your browser
VIEW IN TELEGRAM
🔬 Google представила ассистента ученого: мультиагентная система на базе Gemini 2.0

В основе - 6 специализированных агентов:

Generation - генерирует гипотезы
Reflection - анализирует
Ranking - ранжирует
Evolution - улучшает
Proximity - проверяет близость к существующим исследованиям
Meta-review - итоговая общая проверка научным методом

Главная фишка - масштабирование вычислений во время работы (test-time compute scaling). То есть, чем больше система думает над проблемой, тем лучше становятся результаты.
(Вспоминаем вчерашний пост - тупо 15 минут вычислений в цикле на DeepSeek :) )

Используют для этого:
Научные дебаты между агентами
Турниры для сравнения гипотез
Эволюционный процесс для улучшения качества

Практические примеры, рассмотренные во время запуска:
- Нашли новые применения существующих лекарств для лечения лейкемии
- Предложили новые мишени для лечения фиброза печени
- Объяснили механизмы устойчивости к антибиотикам

Для бизнеса и исследователей: Google открывает доступ через Trusted Tester Program. Если работаете в исследованиях - можно подаваться.

В целом, похоже на серьезный шаг вперед в автоматизации научных исследований. Особенно круто, что система не просто перебирает литературу, а реально генерирует новые гипотезы, которые подтверждаются в лабораторных условиях 🧪

Интересно будет посмотреть, как это повлияет на скорость научных открытий в мирных целях 😎

#Science #Research #Google
———
@tsingular
🔥9👍51
🧬 Evo 2: Крупнейшая AI-модель для работы с геномами

И следом интереснейший анонс от NVidia: Arc Institute и Stanford выпустили Evo 2 - самую большую публично доступную модель для работы с геномными данными.

1. Технический масштаб:
- Обучающий датасет: 8.85 триллионов нуклеотидов
- 15,032 эукариотических и 113,379 прокариотических геномов
- До 40B параметров
- Контекстное окно до 1 миллиона токенов (в 8 раз больше предшественника!)

2. Архитектура:
- Новый StripedHyena 2 (гибридная архитектура)
- Вместо привычных трансформеров использует комбинацию свёрточных фильтров и гейтов
- Обучается значительно быстрее традиционных моделей
- Тренировали на 2,048 NVIDIA H100 через DGX Cloud на AWS

3. Мультимодальность:
- Работает одновременно с ДНК, РНК и белками
- Охватывает все домены жизни (прокариоты, эукариоты, археи)
- Zero-shot перенос между видами

Практическое применение 💼:
1. Для исследователей:
- Доступна через NVIDIA BioNeMo как микросервис
- Можно файнтюнить под свои задачи
- Есть API для генерации биологических последовательностей

2. Для бизнеса:
- Дизайн и репозиционирование лекарств
- Предсказание влияния мутаций (точность 90% на BRCA1!)
- Разработка устойчивых к климату сельхозкультур

Самое весёлое будет подключить Evo2 как инструмент к исследователю от Google!

Это ж они так и единорогов переизобретут. :)

Кстати, безопасность не забыли - намеренно исключили из датасета вирусы эукариот.

#BioTech #Genomics #Research
———
@tsingular
🔥7
This media is not supported in your browser
VIEW IN TELEGRAM
🎮 Microsoft выпустила Muse - модель для генерации игрового процесса

Интересные новости от Microsoft Research - в открытый доступ выпустили модель Muse, обученную на геймплее игры Bleeding Edge.

🔧 Архитектура:
- Это World and Human Action Model (WHAM) - первая модель, способная генерировать как визуальный ряд, так и управляющие действия игрока
- Обучена на 1 млрд пар изображение-действие (это ~7 лет непрерывного геймплея!)
- Текущее разрешение 300×180 пикселей (начинали со 128×128)
- Есть экспериментальная real-time версия на 10 fps

🧠 Ключевые возможности:
- Consistency: генерирует последовательный геймплей с учетом физики игры
- Diversity: может создавать разные варианты развития событий из одной начальной точки
- Persistency: "запоминает" изменения и встраивает их в дальнейшую генерацию

💡 Где это может быть применимо помимо игр:
1. Симуляторы и обучение:
- Генерация сценариев для тренажеров
- Создание вариативных ситуаций для обучения
- Моделирование нестандартных случаев
- Тактическое предсказание

2. Робототехника:
- Обучение роботов через демонстрацию действий
- Генерация последовательностей движений
- Предсказание физических взаимодействий

3. Промышленный дизайн:
- Быстрое прототипирование интерфейсов
- Тестирование взаимодействия пользователя с продуктом
- Генерация вариантов дизайна с учетом физических ограничений

⚡️ Особенно интересно:
Microsoft открыла веса модели и демо WHAM для экспериментов. Можно попробовать на Azure AI Foundry.

А будущие анонсы по ИИ в играх от MS можно отслеживать у них в Gaming-AI-Hub

🤔 Самое интересное, конечно, - это потенциал технологии вне игровой индустрии.
Теперь пригодятся все миллиарды часов записи стримов из игр на youtube и twitche. Twitter же тоже запись стримов игр запустил, - не просто так.

#Microsoft #GameDev
———
@tsingular
🔥5👍2
Grok3 открыли для всех счастливых обладателей VPN :)

https://grok.com/

Пробуем, пока не закончился аттракцион невиданной щедрости от Маска.

#grok3
———
@tsingular
👍8🔥5😁1
И тут же предлагают SuperGrok

Увеличение лимитов по Grok3
Доступ к размышлениям
DeepSearch
Безлимит на генерацию картинок

от $30 в месяц.

Реально o3 pro за $200 не нужен вообще ни с какой стороны.

#grok3
———
@tsingular
🔥7🆒4🎉1
Forwarded from эйай ньюз
Ultra-Scale Playbook - книга по распределённой тренировке от Huggingface

Хороший общий обзор того, как эффективно использовать сотни GPU для обучения самых мощных AI моделей. Она предлагает пошаговый процесс выбора и настройки конфигурации обучения и их оптимизации. Проходятся по всем основным видам параллелизм, их сильным и слабым сторонам и как сделать их быстрыми и эффективными по памяти.

Книга не просто теоретизирует, она основана на более 4000 реальных экспериментов, использующие вплоть до 512 GPU (кому-то это может показаться не много, но это уже приличный скейл). Результаты поданы в виде куче графиков и интерактивных визуализаций.

Всего 100 страниц, рекомендую почитать. К тому же они сделали cheatsheet, чтобы проще было запомнить содержание книги.

https://huggingface.co/spaces/nanotron/ultrascale-playbook

@ai_newz
🔥4
PaLiGemma 2 mix: Новый мультизадачный визуальный AI от Google

Гугл выкатил интересное обновление своей визуальной модели - PaLiGemma 2 mix.

- Три версии по размеру параметров: 3B, 10B и 28B
- Поддержка разрешений 224px и 448px
- Мультифреймворк поддержка: работает с Hugging Face, Keras, PyTorch, JAX и даже с легковесным Gemma.cpp

Умеет:
- Распознавание объектов с обозначением границ каждого объекта
- Сегментация изображений
- OCR (мультиязычный)
- Генерация подписей к изображениям
- Визуальный QA

💡 Практическое применение:
Модель особенно интересна для бизнеса и разработчиков, которым нужно быстро прототипировать CV-решения.
При этом, как пишут разработчики, - максимально она раскрывается после файнтюна.
- Инструкция по файнтюну прилагается
- Полная документация

PaLiGemma 2 mix - это практически швейцарский нож для работы с изображениями, который можно быстро интегрировать через популярные ML-фреймворки.

Особенно порадовало наличие легковесной версии (3B) - такую можно даже на edge-устройствах гонять в роботах и дронах.

Demo
HuggingFace коллекция

#Vision #Google
———
@tsingular
🔥9
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 Career Dreamer: Google запускает AI-помощник для поиска работы

Google выпустил экспериментальный AI-инструмент Career Dreamer, который помогает людям исследовать карьерные возможности и переосмыслить свой профессиональный путь.

- AI анализирует паттерны между опытом, образованием и интересами
- Использует данные рынка труда от Lightcast и Bureau of Labor Statistics
- Интегрирован с Gemini для создания резюме и сопроводительных писем
- Работает через веб-интерфейс (VPN) grow.google/careerdreamer

Что умеет делать:
1. Формирует Career Identity Statement - структурированное описание ваших навыков и ценности для работодателей
2. Подбирает релевантные вакансии поблизости на основе вашего профиля
3. Помогает составить резюме и cover letter через Gemini

По данным World Economic Forum, Поколение Z сменит примерно 18 работ в 6 разных карьерных направлениях. Именно поэтому инструменты вроде Career Dreamer становятся особенно актуальными.

Практическое применение:
- Для HR: упрощает поиск "неочевидных" кандидатов с релевантными soft skills
- Для бизнеса: помогает находить таланты из смежных областей
- Для работников: облегчает переход между индустриями

Не все стартапы Google выживают, но идея может быть интересной.
В том числе, как концепт для РФ, - у нас пока, вроде нет похожих историй с интеграцией в job.ru & hh.ru и где там еще сейчас модно искать работу.

Интересно еще будет посмотреть, как Career Dreamer будет конкурировать с LinkedIn и его AI-инструментами. 🤔

#HR #Google
———
@tsingular
51👍1
X5 Tech: Как ИИ меняет крупнейшего ритейлера России

Интересное интервью от Александра Костина, управляющего директора X5 Tech, про то, как один из крупнейших ритейлеров внедряет ИИ.

Ключевые моменты:
💡 Создали собственный AI-департамент
- Планируют нарастить его до 200-300 специалистов в 2025 году
- Ограничение не в бюджете, а в скорости найма сильных спецов
- Приоритет инвестиций в AI/ML направление

🛠 Технические детали:
- Активно используют различные большие языковые модели на собственной инфраструктуре
- Строят специальную инфраструктуру под ИИ, включая парк GPU
- Требуется особый подход к организации сети и облачных сервисов

📊 Практическое применение:
- CoPilot X5: уже 2200+ активных пользователей, 82400+ обращений в месяц
- Помогает офисным сотрудникам с редактированием писем, созданием макросов в Excel
- ML активно используется в ценообразовании, управлении ассортиментом и логистике
- Разрабатывают CVM-платформу для персонализации маркетинга (650 кампаний ежемесячно для "Пятёрочки")

Интересно, что даже если в компании кто-то не знает об использовании ИИ разработчиками для генерации кода - они всё равно его используют.
Как говорит Костин: "естественный процесс не остановить" 😅

При этом X5 не планирует отказываться от джунов в пользу ИИ - считают важным "делать свой вклад в отрасль".

Технический момент: для всей этой AI-инфраструктуры компания строит собственные ЦОДы. Первый на 400 стоек запустят в следующем году.

#retail #X5 #tadviser
———
@tsingular
👍7🔥41
Forwarded from эйай ньюз
Media is too big
VIEW IN TELEGRAM
Helix - локальный AI на роботе

Из-за этой модели Figure разорвала сделку с OpenAI, заявив что им удалось совершить прорыв. Все действия роботов на видео - результат работы модельки, работающей полностью на роботе. Модель управляет верхней половиной тела, позволяет двум роботам работать вместе и поднимать любые мелкие предметы.

Состоит Helix из двух компонентов - отвечающей за планирование System 2, основанная на неназванной опенсорсной 7B VLM и работающая на скорости 7-9 герц. Исполняет планы System 1 - encoder-decoder на 80 миллионов параметров, работающая на скорости в 200 герц, что позволяет точнее двигаться и быстрее реагировать. System 1 и System 2 работают на отдельных GPU, чтобы не мешать друг другу.

Натренировали это всего на 500 часах данных, что доступно множеству стартапов. Это крайне ранняя стадия и нас ждёт очень быстрое масштабирование.

Блогпост

@ai_newz
🔥13🆒3👏2👍1
Случился праздник на нашей улице

Gigachat вышел в виде nodejs библиотеки

GigaChat-js – это TypeScript/JavaScript SDK для интеграции с API GigaChat, посмотреть можно здесь.

Библиотека поддерживает:
- Чат и потоковую обработку токенов
- Работа с функциями и эмбеддингами
- Работу с GigaChat Vision
- Генерацию изображений
- А также остальные функции, которые есть в GigaChat API


Установка очень проста:

npm install gigachat


Подробности и примеры использования в cookbook.

Подключаем в n8n и вперёд - русские агенты и эмбеддинги :)

#Сбербанк #Gigachat #javascript #dev
———
@tsingular
👍13🔥6
Forwarded from Denis Sexy IT 🤖
Google вчера рассказал про свой новый тул «co-scientists», который пока доступен только ученым и это лучшая реклама инструмента:

Команда из Лондона исследовала почему определённые антибиотико-устойчивые «супербактерии» со временем приобретают устойчивость. Когда профессор загрузил свою неопубликованную гипотезу в новый инструмент от Google — тул не только за 48 часов воспроизвел основную гипотезу, над которой работала команда в течение десятилетия, но и предложил ещё четыре дополнительные обоснованные версии, одна из которых сейчас изучается


e/acc 🚀
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8❤‍🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
📊 Arena Trend август 2024 г. - февраль 2025 г

После нескольких падений и взлетов
Deepseek ai в прошлом месяце,
XAI вырывается вперед на вершину таблицы лидеров.

Гонка ИИ продолжается! 📈
🔥15