Судя по всему намечается важный ивент про RecSys. Интересно узнать подробнее.
147🔥46❤13👌8🥰6👍2🤔2😴2👏1👀1🆒1
— GPT-OSS-120B — 117B параметров, запускается на одной H100 (80GB)
— GPT-OSS-20B — 21B параметров, работает на 16GB GPU
💡 Оба варианта — MoE-модели (Mixture of Experts) с 4-битной квантизацией (MXFP4)
• Архитектура Token-choice MoE с SwiGLU
• Контекст до 128K токенов с RoPE
• Модель заточена на CoT (chain-of-thought)
• Поддержка instruction-following и tool-use
• Совместима с transformers, vLLM, llama.cpp, ollama
• Используется тот же токенизатор, что и в GPT-4o
Младшая модель может запускаться даже на локальном железе!
https://github.com/huggingface/transformers/releases/tag/v4.55.0
🚀 Попробовать можно тут: https://www.gpt-oss.com/
@ai_machinelearning_big_data
#openai #opensource #chatgpt
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥84👍39❤27🍾7👨💻3
Media is too big
VIEW IN TELEGRAM
Claude Opus 4.1 - обновленная версия флагманской модели Anthropic. Улучшили агентные задачи, работу с кодом и логические рассуждения. На бенчмарке SWE-bench Verified новая модель достигла результата в 74.5%.
Партнеры Anthropic хвалят обновленную модель. В GitHub заявили об улучшении большинства показателей, особенно в рефакторинге кода в нескольких файлах. А в Rakuten Group оценили способность модели находить точные исправления в больших кодовых базах, не внося лишних изменений.
Opus 4.1 уже доступен платным пользователям Claude, в среде Claude Code, а также через API, Amazon Bedrock и Google Cloud Vertex AI. Цена на новую модель осталась такой же, как и на Opus 4.
anthropic.com
Google DeepMind анонсировала Genie 3, свою новую «модель мира», способную по одной текстовой команде создавать полностью интерактивные трехмерные окружения. Ключевая особенность системы 3 поколения - генерация сцен в реальном времени.
Genie 3 выдает видео в разрешении 720p с частотой 24 кадра в секунду и способна поддерживать связную симуляцию на протяжении нескольких минут, что на порядок дольше предыдущей версии. Модель обладает минутной визуальной памятью для сохранения консистентности объектов, а также поддерживает «события по запросу» — пользователи могут менять погоду или добавлять персонажей прямо во время сессии.
В DeepMind рассматривают технологию как источник практически неограниченных синтетических данных для обучения роботов и беспилотных автомобилей. Пока Genie 3 доступна в режиме ограниченного превью для небольшой группы ученых и авторов контента.
deepmind.google
Высокопоставленный чиновник Белого дома подтвердил, что правительство США рассматривает способы оснащения ИИ-чипов улучшенными возможностями отслеживания местоположения. Эта мера является частью стратегии по ограничению поставок передовых полупроводников, производимых Nvidia, в Китай.
Идея заключается в том, чтобы с помощью программных или аппаратных изменений в самих чипах более эффективно контролировать их перемещение и пресекать контрабанду. Этот пункт прямо включен в недавно представленный US AI Act.
Новость появилась на фоне недавнего вызова представителей Nvidia в правительство Китая для обсуждения как раз вопросов геолокации и других предполагаемых рисков, связанных с чипами H20. В Nvidia отказались от комментариев, но ранее заявляли об отсутствии «бэкдоров» в своей продукции.
bloomberg.com
Компания Илона Маска представила Grok Imagine - инструмент для image-to-video и text-to-image генерациq. Функция доступна платным подписчикам SuperGrok и Premium Plus в приложении X для iOS.
Ключевым отличием от конкурентов стал режим «Spicy». Он прямо разрешает создание обнаженных и сексуализированных изображений, в то время как прямые конкуренты используют строгие контент-фильтры.
Пользователи могут выбирать один из четырех стилей анимации: Custom, Normal, Fun и Spicy. Маск сообщил, что за первые дни после запуска пользователи сгенерировали более 34 миллионов изображений.
theverge.com
ElevenLabs запустила новый сервис Eleven Music. Это ИИ-модель, которая преобразует текстовые описания в готовые песни, джинглы и фоновые треки. Сервис доступен как для частных лиц, так и для бизнеса.
Весь сгенерированный контент подходит для коммерческого использования. Для этого ElevenLabs обучила свою модель исключительно на лицензированных материалах и заключила соглашения с крупными управляющими цифровыми правами, Merlin Network и Kobalt Music Group.
Кроме того, в систему встроены защитные механизмы, блокирующие запросы, которые могут привести к созданию оскорбительного контента.
elevenlabs.io
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍51❤41🔥5🥰2👨💻2
Зачем нужен Harmony?
Этот формат нужен для:
— 🧠 генерации chain of thought рассуждений
— 🔧 корректного вызова функций и использования инструментов
— 📦 вывода в разные каналы: обычный ответ, reasoning, tool call
— 🗂️ поддержки tool namespaces и иерархических инструкций
💡 Harmony имитирует OpenAI Responses API, так что если вы с ним работали — будет легко освоиться.
👉 Если вы используете gpt-oss через HuggingFace, Ollama или vLLM, волноваться не нужно.
Но если строите свой пайплайн — обязательно изучите гайд по Harmony.
Без него модель просто не будет работать как надо.
pip install openai-harmony
# or if you are using uv
uv pip install openai-harmony
@ai_machinelearning_big_data
#gptOSS #Harmony #OpenAI #LLM #PromptEngineering
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍61❤28🔥11🦄3👨💻2😁1
🚀 Qwen3-4B-Instruct-2507 и Qwen3-4B-Thinking-2507 — ловите еще один апдейт от Qwen: LLM с поддержкой 256K контекста
🧠 Qwen3-4B-Instruct — идеально подойдёт для:
• генерации текстов
• многоязычных задач
• сложных промптов
🧠 Qwen3-4B-Thinking — заточен под:
• логику
• математику
• программирование и технический анализ
⚡ Обе модели стали:
• точнее
• логичнее
• лучше справляются с длинными диалогами
🔗 Модели на Hugging Face:
https://huggingface.co/Qwen/Qwen3-4B-Instruct-2507
https://huggingface.co/Qwen/Qwen3-4B-Thinking-2507
🔗 Модели на ModelScope:
https://modelscope.cn/models/Qwen/Qwen3-4B-Instruct-2507
https://modelscope.cn/models/Qwen/Qwen3-4B-Thinking-2507
@ai_machinelearning_big_data
#AI #ML #qwen #opensource
🧠 Qwen3-4B-Instruct — идеально подойдёт для:
• генерации текстов
• многоязычных задач
• сложных промптов
🧠 Qwen3-4B-Thinking — заточен под:
• логику
• математику
• программирование и технический анализ
⚡ Обе модели стали:
• точнее
• логичнее
• лучше справляются с длинными диалогами
🔗 Модели на Hugging Face:
https://huggingface.co/Qwen/Qwen3-4B-Instruct-2507
https://huggingface.co/Qwen/Qwen3-4B-Thinking-2507
🔗 Модели на ModelScope:
https://modelscope.cn/models/Qwen/Qwen3-4B-Instruct-2507
https://modelscope.cn/models/Qwen/Qwen3-4B-Thinking-2507
@ai_machinelearning_big_data
#AI #ML #qwen #opensource
👍81🔥42❤20👨💻2
Media is too big
VIEW IN TELEGRAM
OpenAI представит GPT-5 в ходе прямой трансляции 7 августа в 10 утра по тихоокеанскому времени (20.00 МСК). Это станет первым крупным обновлением с момента выхода GPT-4 в марте 2023 года.
По словам тестировщиков, новая система демонстрирует заметный прогресс в программировании и решении научных и математических задач. Однако они отмечают, что скачок по сравнению с GPT-4 менее заметен, чем переход от GPT-3.5 к GPT-4.
Сэм Альтман ранее намекал, что в основе GPT-5 лежит гибридный подход: традиционное масштабирование модели сочетается с технологией «test-time compute», которая динамически выделяет дополнительные вычислительные ресурсы для решения особо сложных задач.
reuters.com
Илон Маск соообщил, что xAI откроет исходный код модели Grok 2 на следующей неделе. Этот шаг последовал за недавним релизом моделей с открытыми весами от OpenAI и свидетельствует об усилении конкуренции в сегменте открытых ИИ-решений.
Ожидается, что публикация Grok 2 в открытом доступе ускорит совместную разработку в области ИИ и укрепит репутационные позиции xAI в сообществе разработчиков.
Elon Musk в сети Х
Компания запустила бета-тестирование Gaming Copilot, ИИ-помощника, встроенного в Game Bar Windows 11. Функция доступна участникам программы Xbox Insiders и впервые интегрирует технологию Xbox Copilot непосредственно в игровой процесс на ПК.
Ассистент распознает, в какую игру играет пользователь, и может анализировать скриншоты, достижения и историю, чтобы отвечать на вопросы, предлагать стратегии и делать снимки экрана, не выходя из полноэкранного режима. Поддерживается голосовое управление, чтобы геймеры могли в реальном времени запрашивать, например, тактику для битвы с боссом или совет по выбору персонажа.
На данный момент превью доступно только на английском языке в США, Австралии, Новой Зеландии, Японии и Сингапуре.
theverge.com
Спустя 2 месяца после начала публичного тестирования, Google официально выпустила своего ИИ-агента для программирования Jules. Инструмент, работающий на модели Gemini 2.5 Pro, способен в асинхронном режиме клонировать кодовые базы, создавать pull-запросы на GitHub и самостоятельно выполнять задачи по исправлению багов или обновлению зависимостей.
С релизом компания представила трехуровневую систему тарификации. Бесплатный план включает до 15 задач в день. Платный доступ интегрирован в подписки Google AI: тариф Pro увеличивает лимиты Jules в 5 раз, а Ultra - в 20 раз.
blog.google
Инструмент, получивший название Claude Code Security Reviewer, использует модель Claude и интегрируется в GitHub Actions, сканируя pull-запросы на наличие потенциальных проблем с безопасностью.
Благодаря способности Claude понимать контекст кода, система может находить уязвимости в разных языках программирования. Она автоматически добавляет комментарии к проблемным участкам, отсеивает вероятные ложные срабатывания и анализирует только измененные файлы. Инструмент доступен на GitHub под лицензией MIT.
anthropic.com
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
10❤68👍27🔥18👨💻3
Что расскажут топ-спикеры на фестивале:
@ai_machinelearning_big_data
#news #ai #opensource
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥38🥱18❤9👍7👨💻2
⚡ Agent Lightning — ускоритель обучения для ИИ-агентов от Microsoft
Agent Lightning — это фреймворк для обучения и оптимизации LLM-агентов с помощью Reinforcement Learning без изменения их кода.
🧠 Поддерживает:
• LangChain
• AutoGen
• OpenAI Agents SDK
• и другие фреймворки на Python
🔧 Как он работает:
• Агент не нужно переписывать — он подключается как есть
• Вся его работа разбивается на отдельные шаги (эпизоды), которые можно анализировать
• Специальный алгоритм LightningRL оценивает, какие действия были полезны, а какие — нет
• Система может учитывать не только финальный результат, но и промежуточные сигналы (награды)
• Эти данные автоматически собираются и используются для дообучения агента
🔥 Преимущества:
• Не требует модификации логики агента
• Можно легко подключить к существующим пайплайнам
• Улучшает точность и устойчивость в сложных задачах: от генерации кода до Text-to-SQL
Отличный инструмент для всех, кто хочет сделать своих LLM-агентов.
🟠 Проект: https://microsoft.com/en-us/research/project/agent-lightning/
🟠 Статья: https://arxiv.org/abs/2508.03680
🟠 Github: https://github.com/microsoft/agent-lightning
@ai_machinelearning_big_data
#agent #reinforcementlearning #mlops #llm #Microsoft
Agent Lightning — это фреймворк для обучения и оптимизации LLM-агентов с помощью Reinforcement Learning без изменения их кода.
🧠 Поддерживает:
• LangChain
• AutoGen
• OpenAI Agents SDK
• и другие фреймворки на Python
🔧 Как он работает:
• Агент не нужно переписывать — он подключается как есть
• Вся его работа разбивается на отдельные шаги (эпизоды), которые можно анализировать
• Специальный алгоритм LightningRL оценивает, какие действия были полезны, а какие — нет
• Система может учитывать не только финальный результат, но и промежуточные сигналы (награды)
• Эти данные автоматически собираются и используются для дообучения агента
🔥 Преимущества:
• Не требует модификации логики агента
• Можно легко подключить к существующим пайплайнам
• Улучшает точность и устойчивость в сложных задачах: от генерации кода до Text-to-SQL
Отличный инструмент для всех, кто хочет сделать своих LLM-агентов.
@ai_machinelearning_big_data
#agent #reinforcementlearning #mlops #llm #Microsoft
Please open Telegram to view this post
VIEW IN TELEGRAM
❤47🔥21👍14👨💻2
This media is not supported in your browser
VIEW IN TELEGRAM
Новый четырёхногий робот весом всего 37 кг
Работа стал: Легче, Прочнее, Быстрее.
Разработан специально для промышленных задач, где важны автономность, манёвренность и надёжность.
Инженерная мощь нового поколения — в компактном корпусе.
@ai_machinelearning_big_data
#ai #robots #Unitree
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥65👍27❤16🥱4👾2🍾1😭1
🔥 А вот и ChatGPT-5
Модель гибридная и выглядит очень круто, особенно в кодинге! На aime-2025 получила 100 процентов!
Альтман заявляет, что модель дадут даже бесплатным пользователям и прямо сегодня.
https://openai.com/index/introducing-gpt-5/
Стрим, кстати, смотрят 155 к человек: https://www.youtube.com/watch?v=0Uu_VJeVVfo
GPT-5 уже доступен в Perplexity, Cursor, Copilot.
@ai_machinelearning_big_data
#Chatgpt5
Модель гибридная и выглядит очень круто, особенно в кодинге! На aime-2025 получила 100 процентов!
Альтман заявляет, что модель дадут даже бесплатным пользователям и прямо сегодня.
https://openai.com/index/introducing-gpt-5/
Стрим, кстати, смотрят 155 к человек: https://www.youtube.com/watch?v=0Uu_VJeVVfo
GPT-5 уже доступен в Perplexity, Cursor, Copilot.
@ai_machinelearning_big_data
#Chatgpt5
1🔥98👍30❤20😐10