Forwarded from Анализ данных (Data analysis)
⚡️ Китай наносит новый удар. 🔥
ByteDance выпустила OmniHuman-1, модель для создания реалистичных видео на основе одного изображения.
OmniHuman-1 - работает на основе диффузионного преобразования, которая генерирует высокореалистичные видео на основе изображения и аудио/видео.
В модели реализовано обучение с учетом всех условий окружения, что позволяет масштабировать генерацию, создавать связанные с движением и значительно повысить реалистичность жестов и движений тела.
В отличие от предыдущих моделей, ограниченных лицевой или статичной анимацией тела, OmniHuman-1 поддерживает различные соотношения сторон, сложные взаимодействия человека и объектов вокруг.
Она превосходит существующие методы по реалистичности, достигая высокой точности синхронизации губ, точности жестов и выразительности лица.
→ Модель построена на архитектуре DiT (Diffusion Transformer), поддерживает мультимодальность.
→ Превосходит конкурентов (например, Loopy, CyberHost, DiffTED) по точности синхронизации губ (5,255 против 4,814), FVD (15,906 против 16,134) и выразительности жестов, при этом поддерживая различные пропорции тела в одной модели.
https://huggingface.co/papers/2502.01061
@data_analysis_ml
ByteDance выпустила OmniHuman-1, модель для создания реалистичных видео на основе одного изображения.
OmniHuman-1 - работает на основе диффузионного преобразования, которая генерирует высокореалистичные видео на основе изображения и аудио/видео.
В модели реализовано обучение с учетом всех условий окружения, что позволяет масштабировать генерацию, создавать связанные с движением и значительно повысить реалистичность жестов и движений тела.
В отличие от предыдущих моделей, ограниченных лицевой или статичной анимацией тела, OmniHuman-1 поддерживает различные соотношения сторон, сложные взаимодействия человека и объектов вокруг.
Она превосходит существующие методы по реалистичности, достигая высокой точности синхронизации губ, точности жестов и выразительности лица.
→ Модель построена на архитектуре DiT (Diffusion Transformer), поддерживает мультимодальность.
→ Превосходит конкурентов (например, Loopy, CyberHost, DiffTED) по точности синхронизации губ (5,255 против 4,814), FVD (15,906 против 16,134) и выразительности жестов, при этом поддерживая различные пропорции тела в одной модели.
https://huggingface.co/papers/2502.01061
@data_analysis_ml
🔥19🆒3
This media is not supported in your browser
VIEW IN TELEGRAM
Postman запускает визуальный конструктор AI-агентов
Postman представил инструментарий для создания ИИ-ассистентов без написания кода.
Платформа интегрирует 100,000+ публичных API и ведущие LLM-модели через визуальный интерфейс.
Разработчики получили доступ к верифицированным API от более чем 18,000 компаний.
Функционал включает тестирование промптов, сравнение производительности моделей и мониторинг в реальном времени.
Инструмент позволяет создавать event-driven агентов для автоматизации клиентской поддержки, управления инцидентами и документирования.
Теперь даже джуниор сможет собрать своего киборга-помощника из кубиков 🤖
Вот это поворот.🔝
Postman становится в один ряд с Langchain, Langflow и n8n
#Postman #NoCode #агенты
-------
@tsingular
Postman представил инструментарий для создания ИИ-ассистентов без написания кода.
Платформа интегрирует 100,000+ публичных API и ведущие LLM-модели через визуальный интерфейс.
Разработчики получили доступ к верифицированным API от более чем 18,000 компаний.
Функционал включает тестирование промптов, сравнение производительности моделей и мониторинг в реальном времени.
Инструмент позволяет создавать event-driven агентов для автоматизации клиентской поддержки, управления инцидентами и документирования.
Теперь даже джуниор сможет собрать своего киборга-помощника из кубиков 🤖
Вот это поворот.
Postman становится в один ряд с Langchain, Langflow и n8n
#Postman #NoCode #агенты
-------
@tsingular
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11⚡3🤔3🆒3
HuggingFace представил агента-исследователя Open Deep Research
HuggingFace выпустил open-source версию DeepResearch на основе библиотеки SmolAgents.
Ключевая особенность - использование кода вместо JSON для управления действиями агента.
Система включает веб-браузер и текстовый инспектор для работы с различными форматами файлов.
На валидационном наборе GAIA достигнут результат 54%, что на 8% выше предыдущего рекорда Magentic-One.
Теперь любой может создать своего научного ассистента. OpeanAI в панике! :)
Т.е. за $250 вы получаете недоделанный забагованный Researcher от OAI или можно взять бесплатный открытый от HF с метриками немногим ниже...
Сложный выбор.
Ну что, делаем бота рассуждатора? :)
Пишите в комментариях.
Кстати, на запчасти боту собираю тут
#HuggingFace #DeepResearch #SmolAgents
-------
@tsingular
HuggingFace выпустил open-source версию DeepResearch на основе библиотеки SmolAgents.
Ключевая особенность - использование кода вместо JSON для управления действиями агента.
Система включает веб-браузер и текстовый инспектор для работы с различными форматами файлов.
На валидационном наборе GAIA достигнут результат 54%, что на 8% выше предыдущего рекорда Magentic-One.
Теперь любой может создать своего научного ассистента. OpeanAI в панике! :)
Т.е. за $250 вы получаете недоделанный забагованный Researcher от OAI или можно взять бесплатный открытый от HF с метриками немногим ниже...
Сложный выбор.
Ну что, делаем бота рассуждатора? :)
Пишите в комментариях.
Кстати, на запчасти боту собираю тут
#HuggingFace #DeepResearch #SmolAgents
-------
@tsingular
100🤯4🆒2❤🔥1⚡1
Forwarded from AI для Всех (Artemii)
Калифорнийский Университет запускает AI-систему: что важно знать 🎓
Калифорнийский государственный университет объявил о внедрении AI во все 23 кампуса. Что это значит на практике:
Основные изменения 📚
• ChatGPT Edu станет доступен для всех студентов и преподавателей – это специальная версия с расширенными возможностями для образования
• Появится единый AI Commons Hub с инструментами для обучения и исследований
• Запускаются программы стажировок с ведущими tech-компаниями
Почему это действительно важно 🔍
1. Масштаб: это крупнейшее внедрение AI в образовании (460 000+ студентов)
2. Практический подход: студенты получают реальные навыки работы с AI, востребованные на рынке
3. Доступность: все инструменты бесплатны для студентов и преподавателей
Интересный факт: сейчас более 50% AI-специалистов в США – иностранцы. CSU планирует изменить эту статистику, готовя местные кадры.
Анонс от CSU
Анонс от OpenAI
Калифорнийский государственный университет объявил о внедрении AI во все 23 кампуса. Что это значит на практике:
Основные изменения 📚
• ChatGPT Edu станет доступен для всех студентов и преподавателей – это специальная версия с расширенными возможностями для образования
• Появится единый AI Commons Hub с инструментами для обучения и исследований
• Запускаются программы стажировок с ведущими tech-компаниями
Почему это действительно важно 🔍
1. Масштаб: это крупнейшее внедрение AI в образовании (460 000+ студентов)
2. Практический подход: студенты получают реальные навыки работы с AI, востребованные на рынке
3. Доступность: все инструменты бесплатны для студентов и преподавателей
Интересный факт: сейчас более 50% AI-специалистов в США – иностранцы. CSU планирует изменить эту статистику, готовя местные кадры.
Анонс от CSU
Анонс от OpenAI
👍4
Минутка n8n
Если добавить к почтовому агенту диалоговую память, - он сможет решать такие задачи, как:
Посмотри что у нас в почте есть на тему "Искуственный интеллект".
Т.е. сам на предмет этой темы прочитает последние входящие, выделит оттуда адресатов, запишет их и потом ещё раз из почты возьмёт письма только от этого адресата, проанализирует их и вернёт результат.
Это избавляет от необходимости указывать точный адрес отправителя в сценариях, где это допустимо.
#n8n #dev
———
@tsingular
Если добавить к почтовому агенту диалоговую память, - он сможет решать такие задачи, как:
Посмотри что у нас в почте есть на тему "Искуственный интеллект".
Т.е. сам на предмет этой темы прочитает последние входящие, выделит оттуда адресатов, запишет их и потом ещё раз из почты возьмёт письма только от этого адресата, проанализирует их и вернёт результат.
Это избавляет от необходимости указывать точный адрес отправителя в сценариях, где это допустимо.
#n8n #dev
———
@tsingular
🔥5⚡3🆒3
Blackwell: NVIDIA выпускает монстра с 72-мя GPU в одной стойке
CoreWeave запустил первые облачные инстансы на базе NVIDIA GB200 NVL72.
Система объединяет 72 GPU Blackwell и 36 CPU Grace с жидкостным охлаждением.
Ключевые преимущества: в 30 раз быстрее инференс LLM, в 4 раза ускоряет обучение, 25-кратный прирост производительности при той же мощности.
Технические особенности: NVLink 5.0, поддержка FP4, сеть Quantum-2 InfiniBand (400 Гб/с на GPU).
Масштабируемость до 110,000 GPU с пропускной способностью 130 ТБ/с в одном домене.
Вот бы на нём Doom запустить. :)
#NVIDIA #Blackwell #CoreWeave
-------
@tsingular
CoreWeave запустил первые облачные инстансы на базе NVIDIA GB200 NVL72.
Система объединяет 72 GPU Blackwell и 36 CPU Grace с жидкостным охлаждением.
Ключевые преимущества: в 30 раз быстрее инференс LLM, в 4 раза ускоряет обучение, 25-кратный прирост производительности при той же мощности.
Технические особенности: NVLink 5.0, поддержка FP4, сеть Quantum-2 InfiniBand (400 Гб/с на GPU).
Масштабируемость до 110,000 GPU с пропускной способностью 130 ТБ/с в одном домене.
Вот бы на нём Doom запустить. :)
#NVIDIA #Blackwell #CoreWeave
-------
@tsingular
👍8👾3
Adobe встроила контрактного юриста в Acrobat
Популярный PDF-редактор получил функцию анализа юридических документов.
Инструмент сокращает время проверки контрактов с 45 до 10 минут, обеспечивая 70-80% экономии времени.
Система автоматически находит ключевые условия, составляет краткое содержание и сравнивает версии документов.
Обработка происходит в облаке без долговременного хранения данных за $4.99/месяц.
Функционал актуален, учитывая что 70% пользователей подписывают договоры не понимая условий, а 64% предпринимателей избегают контрактов из-за юридической неуверенности.
Юристы на выход :) 🤵♂️😅
#Adobe #Acrobat #LegalTech
-------
@tsingular
Популярный PDF-редактор получил функцию анализа юридических документов.
Инструмент сокращает время проверки контрактов с 45 до 10 минут, обеспечивая 70-80% экономии времени.
Система автоматически находит ключевые условия, составляет краткое содержание и сравнивает версии документов.
Обработка происходит в облаке без долговременного хранения данных за $4.99/месяц.
Функционал актуален, учитывая что 70% пользователей подписывают договоры не понимая условий, а 64% предпринимателей избегают контрактов из-за юридической неуверенности.
Юристы на выход :) 🤵♂️😅
#Adobe #Acrobat #LegalTech
-------
@tsingular
🤔5🔥3👍2⚡1👨💻1
Forwarded from Илья AGI TV 🤖
This media is not supported in your browser
VIEW IN TELEGRAM
#Kling выпустили класную фичу, теперь можно миксовать на видео: Человека + Среду + Объект 🔥
Вообще из всех видео генераторов, Kling пока что самый лучший имхо
🔗 klingai.com
Вообще из всех видео генераторов, Kling пока что самый лучший имхо
🔗 klingai.com
👍12🔥7❤1
Telegram
Илья AGI TV 🤖
В это же время где то тренируют роботов к замене спортсменов. 😈 Тренируют на дата сете от Cristiano Ronaldo, LeBron James и Kobe Byrant.
Зловещая долина, - просто привет.
https://t.me/ilia_plasma/618
Unitree учат на движениях спортсменов
И тут уже мне немного жутковато, потому что создаётся стойкое ощущение, что они живые, при том, что умом понимаешь, что - нет.
Т.е. их накормят всеми записями олимпиад и спортивных матчей. И через год можно будет выпускать на стадион.
#Unitree #robots
------
@tsingular
https://t.me/ilia_plasma/618
Unitree учат на движениях спортсменов
И тут уже мне немного жутковато, потому что создаётся стойкое ощущение, что они живые, при том, что умом понимаешь, что - нет.
Т.е. их накормят всеми записями олимпиад и спортивных матчей. И через год можно будет выпускать на стадион.
#Unitree #robots
------
@tsingular
👀12⚡3🔥3
В Langflow 1.1.4 появился ШАБЛОН Deep Researcher!
Просто, то, что вчера вышло за $250, как прогрессивная разработка,- сегодня бесплатный шаблон в nocode.
Т.е. он сам, декомпозирует задачу, пишет план, вызывает агента с поиском на выполнение этого плана и подводит итог.
Упрощённо, конечно, но это все-таки шаблон.
Все компоненты заменяемы.
любой поиск или локальные модели подключаются за пару минут.
Это просто праздник какой-то. :)
#langflow #nocode #research
———
@tsingular
Просто, то, что вчера вышло за $250, как прогрессивная разработка,- сегодня бесплатный шаблон в nocode.
Т.е. он сам, декомпозирует задачу, пишет план, вызывает агента с поиском на выполнение этого плана и подводит итог.
Упрощённо, конечно, но это все-таки шаблон.
Все компоненты заменяемы.
любой поиск или локальные модели подключаются за пару минут.
Это просто праздник какой-то. :)
#langflow #nocode #research
———
@tsingular
✍4🔥3👌3
В подписке Gemini Advanced добавили 2.0 Pro Experimental
Новостей нет, бенчей тоже пока нет.
Рассуждений не видно. Поиска нет. :)
Втихую выкатили и все.
Gemini 2.0 Pro Experimental, доступная пользователям Gemini Advanced с четверга, теперь является ведущей моделью в семействе Gemini AI от Google, заявила компания. Она должна обеспечить «лучшую фактологию» и «более высокую производительность» для задач, связанных с кодированием и математикой.
«Независимо от того, решаете ли вы сложные задачи кодирования, такие как создание определенной программы с нуля, или решаете математические задачи, такие как разработка сложных статистических моделей или квантовых алгоритмов, 2.0 Pro Experimental поможет вам справляться даже с самыми сложными задачами с большей легкостью и точностью», — пишет Google в журнале изменений.
#Gemini #pro #experimental
———
@tsingular
Новостей нет, бенчей тоже пока нет.
Рассуждений не видно. Поиска нет. :)
Втихую выкатили и все.
Gemini 2.0 Pro Experimental, доступная пользователям Gemini Advanced с четверга, теперь является ведущей моделью в семействе Gemini AI от Google, заявила компания. Она должна обеспечить «лучшую фактологию» и «более высокую производительность» для задач, связанных с кодированием и математикой.
«Независимо от того, решаете ли вы сложные задачи кодирования, такие как создание определенной программы с нуля, или решаете математические задачи, такие как разработка сложных статистических моделей или квантовых алгоритмов, 2.0 Pro Experimental поможет вам справляться даже с самыми сложными задачами с большей легкостью и точностью», — пишет Google в журнале изменений.
#Gemini #pro #experimental
———
@tsingular
👍3🤔2
Media is too big
VIEW IN TELEGRAM
🤖 DeepSeek выкатили Small-версию своей мультимодальной модели!
При всего 2.8B активных параметров, DeepSeek-VL2-Small демонстрирует впечатляющие результаты:
- 92.3% на DocVQA (тест на понимание документов)
- 84.5% на ChartQA (работа с графиками)
- 83.4% на TextVQA (распознавание текста на изображениях)
Технически модель наследует все крутые фишки базовой версии:
- Dynamic tiling — умное разбиение картинок на тайлы для обработки изображений высокого разрешения. Больше никаких ограничений на размер входной картинки!
- Multi-head Latent Attention для оптимизации памяти — ключи и значения сжимаются в латентные вектора. За счет этого модель быстрее работает и меньше ест памяти.
- MoE (Mixture of Experts) архитектура — вместо того чтобы гонять все параметры, модель активирует только нужных "экспертов". Отсюда и экономия: из 16B общих параметров активируются только 2.8B.
Самое интересное: Small-версия не сильно отстает от старшей модели в точности. На некоторых бенчмарках разница всего 1-2%.
Для сравнения: другие модели похожего размера (например, InternVL2-2B или Qwen2-VL-2B) показывают заметно более слабые результаты, особенно в задачах с документами и текстом.
В общем, если нужна компактная мультимодальная модель с хорошим балансом размер/качество — DeepSeek-VL2-Small выглядит очень заманчиво. 🤔
Погнали наши городских :)
Пробуем тут:
https://huggingface.co/spaces/deepseek-ai/deepseek-vl2-small
#DeepSeek #VLM #Китай
———
@tsingular
При всего 2.8B активных параметров, DeepSeek-VL2-Small демонстрирует впечатляющие результаты:
- 92.3% на DocVQA (тест на понимание документов)
- 84.5% на ChartQA (работа с графиками)
- 83.4% на TextVQA (распознавание текста на изображениях)
Технически модель наследует все крутые фишки базовой версии:
- Dynamic tiling — умное разбиение картинок на тайлы для обработки изображений высокого разрешения. Больше никаких ограничений на размер входной картинки!
- Multi-head Latent Attention для оптимизации памяти — ключи и значения сжимаются в латентные вектора. За счет этого модель быстрее работает и меньше ест памяти.
- MoE (Mixture of Experts) архитектура — вместо того чтобы гонять все параметры, модель активирует только нужных "экспертов". Отсюда и экономия: из 16B общих параметров активируются только 2.8B.
Самое интересное: Small-версия не сильно отстает от старшей модели в точности. На некоторых бенчмарках разница всего 1-2%.
Для сравнения: другие модели похожего размера (например, InternVL2-2B или Qwen2-VL-2B) показывают заметно более слабые результаты, особенно в задачах с документами и текстом.
В общем, если нужна компактная мультимодальная модель с хорошим балансом размер/качество — DeepSeek-VL2-Small выглядит очень заманчиво. 🤔
Погнали наши городских :)
Пробуем тут:
https://huggingface.co/spaces/deepseek-ai/deepseek-vl2-small
#DeepSeek #VLM #Китай
———
@tsingular
🔥8👍4
Яндекс и Сбер скоро выкатят хабы-гейты для LLMок.
Инфа со стрима TalentHub
#Сбербанк #Яндекс #gate
———
@tsingular
Инфа со стрима TalentHub
#Сбербанк #Яндекс #gate
———
@tsingular
🤔5🫡2 1
Media is too big
VIEW IN TELEGRAM
HuggingFace собрали все ИИ модели и инструменты в общем пространстве и добавили ИИ поиск.
У нас было 2 миллиона моделей машинного обучения, 75 тысяч пространств развертывания, и целая гора мультимодальных датасетов всех возможных форматов.
Не то чтобы всё это действительно было нужно для одного проекта... но если уж начал собирать ИИ-стек, остановиться трудно.
Единственное, что действительно беспокоило – это поисковый движок.
На всей планете не было никого, кто бы мог искать модели умнее и быстрее, чем новый ИИ от HuggingFace.
И я знал, что рано или поздно мы перейдем на эту дрянь.
К полудню мы были где-то на краю пустыни талантов, когда API начало действовать.
Я помню, как сказал что-то вроде: "Я чувствую головокружение, может, ты поведешь..."
А потом внезапно вокруг стало очень тихо, и я увидел... боже мой, ты только посмотри на эти решения!
Разумеется, это была не вся коллекция. Я взял довольно стандартный набор: трансформеры, диффузионные модели, embeddings, языковые модели – всё, что может понадобиться для среднестатистического проекта машинного обучения.
С такими инструментами всё, что тебе нужно – это ввести запрос на английском, и искусственный интеллект мгновенно выдаст тебе готовое решение.
"Не останавливайся. Это ИИ-территория..."
#HuggingFace #каталог
———
@tsingular
У нас было 2 миллиона моделей машинного обучения, 75 тысяч пространств развертывания, и целая гора мультимодальных датасетов всех возможных форматов.
Не то чтобы всё это действительно было нужно для одного проекта... но если уж начал собирать ИИ-стек, остановиться трудно.
Единственное, что действительно беспокоило – это поисковый движок.
На всей планете не было никого, кто бы мог искать модели умнее и быстрее, чем новый ИИ от HuggingFace.
И я знал, что рано или поздно мы перейдем на эту дрянь.
К полудню мы были где-то на краю пустыни талантов, когда API начало действовать.
Я помню, как сказал что-то вроде: "Я чувствую головокружение, может, ты поведешь..."
А потом внезапно вокруг стало очень тихо, и я увидел... боже мой, ты только посмотри на эти решения!
Разумеется, это была не вся коллекция. Я взял довольно стандартный набор: трансформеры, диффузионные модели, embeddings, языковые модели – всё, что может понадобиться для среднестатистического проекта машинного обучения.
С такими инструментами всё, что тебе нужно – это ввести запрос на английском, и искусственный интеллект мгновенно выдаст тебе готовое решение.
"Не останавливайся. Это ИИ-территория..."
#HuggingFace #каталог
———
@tsingular
⚡8😁6🤩4👍3❤1🔥1
Forwarded from Data Secrets
Это то, что мы все так сильно любим: Андрей Карпаты выложил новое обучающее видео
Это погружение в LLM на 3.5 часа. В лекции рассмотрены все основные шаги обучения моделек:
– Прентрейн: данные, токенизация, устройство архитектуры трансформера, примеры на GPT-2 и Llama 3.1
– Файнтюнинг: LLM Psychology, галлюцинации, орфография и еще много интересных деталей
– RLHF: все про то, как обучение с подкреплением работает в LLM на примере DeepSeek R1
Ну что может быть лучше?
youtu.be/7xTGNNLPyMI?si=dlaK07h1Uw_1Dr8Z
Это погружение в LLM на 3.5 часа. В лекции рассмотрены все основные шаги обучения моделек:
– Прентрейн: данные, токенизация, устройство архитектуры трансформера, примеры на GPT-2 и Llama 3.1
– Файнтюнинг: LLM Psychology, галлюцинации, орфография и еще много интересных деталей
– RLHF: все про то, как обучение с подкреплением работает в LLM на примере DeepSeek R1
Ну что может быть лучше?
youtu.be/7xTGNNLPyMI?si=dlaK07h1Uw_1Dr8Z
🔥17✍4👍4⚡1🤝1
🚀 МТС врывается в мир корпоративного ИИ: анонсирована платформа MWS GPT
Главные фишки MWS GPT:
- Гибкость в выборе моделей: можно использовать как собственные решения МТС (Cotype и МТС Alpha), так и внедрять open source или сторонние LLM
- Демократичная цена: 1,1 рубля за 1000 токенов. На практике это означает, что SEO-статья обойдется примерно в 5 рублей, а презентация для клиентов — в 10 рублей
- Enterprise-уровень: выделенный пул GPU-ресурсов для быстрой обработки больших объемов данных
- Гибкое размещение: можно развернуть как в облаке МТС, так и на собственных серверах
- Фокус на корпоративные знания — платформа умеет создавать умные поисковики по внутренним базам данных компании. Это решает классическую проблему, когда важная информация разбросана по десяткам систем и документов.
Похоже, МТС всерьез нацелилась на то, чтобы сделать работу с ИИ доступной для российского бизнеса любого масштаба. Модель оплаты по факту использования (pay-as-you-go) может быть привлекательна для малого бизнеса, который может экспериментировать с ИИ без серьезных начальных вложений.
Будет интересно посмотреть, как платформа покажет себя в реальных проектах и сможет ли она составить конкуренцию другим российским и зарубежным решениям в этой области. 🤔
#МТС #hub #gate
———
@tsingular
Главные фишки MWS GPT:
- Гибкость в выборе моделей: можно использовать как собственные решения МТС (Cotype и МТС Alpha), так и внедрять open source или сторонние LLM
- Демократичная цена: 1,1 рубля за 1000 токенов. На практике это означает, что SEO-статья обойдется примерно в 5 рублей, а презентация для клиентов — в 10 рублей
- Enterprise-уровень: выделенный пул GPU-ресурсов для быстрой обработки больших объемов данных
- Гибкое размещение: можно развернуть как в облаке МТС, так и на собственных серверах
- Фокус на корпоративные знания — платформа умеет создавать умные поисковики по внутренним базам данных компании. Это решает классическую проблему, когда важная информация разбросана по десяткам систем и документов.
Похоже, МТС всерьез нацелилась на то, чтобы сделать работу с ИИ доступной для российского бизнеса любого масштаба. Модель оплаты по факту использования (pay-as-you-go) может быть привлекательна для малого бизнеса, который может экспериментировать с ИИ без серьезных начальных вложений.
Будет интересно посмотреть, как платформа покажет себя в реальных проектах и сможет ли она составить конкуренцию другим российским и зарубежным решениям в этой области. 🤔
#МТС #hub #gate
———
@tsingular
🤔8👍2❤1🔥1
Gemini 2.0: обновления от Google
Главное событие - выход сразу трёх версий Gemini 2.0:
1. Flash (GA) - для большинства задач
- Контекст 1млн токенов
- Мультимодальность из коробки
- Очень приятная цена: $0.10 за миллион токенов входа
2. Flash-Lite (Preview) - экономичный вариант
- Те же возможности, но оптимизирован под текст
- Супер-выгодная цена: $0.075 за миллион токенов
- Идеален для масштабных текстовых задач
3. Pro Experimental - монстр производительности
- Контекст 2 млн токенов!
- Лучшие показатели по всем бенчмаркам
- Особенно силён в коде (36% на LiveCodeBench) и математике (91.8% на MATH)
Существенный рост по сравнению с 1.5:
- MMLU-Pro: с 75.8% до 79.1% (Pro)
- SimpleQA: с 24.9% до 44.3% (Pro) - огромный скачок!
- HiddenMath: с 52% до 65.2% (Pro)
Интересно, что все модели получили поддержку мультимодальности, но генерация изображений и аудио пока "coming soon". 🤔
Похоже, Google серьёзно настроен конкурировать с OpenAI и Anthropic не только по качеству, но и по цене. А учитывая бесплатный тир и высокие лимиты - выглядит очень заманчиво для разработчиков 💪
Ну и по-настоящему демократичные цены, конечно, в сравнении с нашими отечественными решениями.
#Gemini #Google
———
@tsingular
Главное событие - выход сразу трёх версий Gemini 2.0:
1. Flash (GA) - для большинства задач
- Контекст 1млн токенов
- Мультимодальность из коробки
- Очень приятная цена: $0.10 за миллион токенов входа
2. Flash-Lite (Preview) - экономичный вариант
- Те же возможности, но оптимизирован под текст
- Супер-выгодная цена: $0.075 за миллион токенов
- Идеален для масштабных текстовых задач
3. Pro Experimental - монстр производительности
- Контекст 2 млн токенов!
- Лучшие показатели по всем бенчмаркам
- Особенно силён в коде (36% на LiveCodeBench) и математике (91.8% на MATH)
Существенный рост по сравнению с 1.5:
- MMLU-Pro: с 75.8% до 79.1% (Pro)
- SimpleQA: с 24.9% до 44.3% (Pro) - огромный скачок!
- HiddenMath: с 52% до 65.2% (Pro)
Интересно, что все модели получили поддержку мультимодальности, но генерация изображений и аудио пока "coming soon". 🤔
Похоже, Google серьёзно настроен конкурировать с OpenAI и Anthropic не только по качеству, но и по цене. А учитывая бесплатный тир и высокие лимиты - выглядит очень заманчиво для разработчиков 💪
Ну и по-настоящему демократичные цены, конечно, в сравнении с нашими отечественными решениями.
#Gemini #Google
———
@tsingular
🔥6👍3