Media is too big
VIEW IN TELEGRAM
Claude Opus 4.1 - обновленная версия флагманской модели Anthropic. Улучшили агентные задачи, работу с кодом и логические рассуждения. На бенчмарке SWE-bench Verified новая модель достигла результата в 74.5%.
Партнеры Anthropic хвалят обновленную модель. В GitHub заявили об улучшении большинства показателей, особенно в рефакторинге кода в нескольких файлах. А в Rakuten Group оценили способность модели находить точные исправления в больших кодовых базах, не внося лишних изменений.
Opus 4.1 уже доступен платным пользователям Claude, в среде Claude Code, а также через API, Amazon Bedrock и Google Cloud Vertex AI. Цена на новую модель осталась такой же, как и на Opus 4.
anthropic.com
Google DeepMind анонсировала Genie 3, свою новую «модель мира», способную по одной текстовой команде создавать полностью интерактивные трехмерные окружения. Ключевая особенность системы 3 поколения - генерация сцен в реальном времени.
Genie 3 выдает видео в разрешении 720p с частотой 24 кадра в секунду и способна поддерживать связную симуляцию на протяжении нескольких минут, что на порядок дольше предыдущей версии. Модель обладает минутной визуальной памятью для сохранения консистентности объектов, а также поддерживает «события по запросу» — пользователи могут менять погоду или добавлять персонажей прямо во время сессии.
В DeepMind рассматривают технологию как источник практически неограниченных синтетических данных для обучения роботов и беспилотных автомобилей. Пока Genie 3 доступна в режиме ограниченного превью для небольшой группы ученых и авторов контента.
deepmind.google
Высокопоставленный чиновник Белого дома подтвердил, что правительство США рассматривает способы оснащения ИИ-чипов улучшенными возможностями отслеживания местоположения. Эта мера является частью стратегии по ограничению поставок передовых полупроводников, производимых Nvidia, в Китай.
Идея заключается в том, чтобы с помощью программных или аппаратных изменений в самих чипах более эффективно контролировать их перемещение и пресекать контрабанду. Этот пункт прямо включен в недавно представленный US AI Act.
Новость появилась на фоне недавнего вызова представителей Nvidia в правительство Китая для обсуждения как раз вопросов геолокации и других предполагаемых рисков, связанных с чипами H20. В Nvidia отказались от комментариев, но ранее заявляли об отсутствии «бэкдоров» в своей продукции.
bloomberg.com
Компания Илона Маска представила Grok Imagine - инструмент для image-to-video и text-to-image генерациq. Функция доступна платным подписчикам SuperGrok и Premium Plus в приложении X для iOS.
Ключевым отличием от конкурентов стал режим «Spicy». Он прямо разрешает создание обнаженных и сексуализированных изображений, в то время как прямые конкуренты используют строгие контент-фильтры.
Пользователи могут выбирать один из четырех стилей анимации: Custom, Normal, Fun и Spicy. Маск сообщил, что за первые дни после запуска пользователи сгенерировали более 34 миллионов изображений.
theverge.com
ElevenLabs запустила новый сервис Eleven Music. Это ИИ-модель, которая преобразует текстовые описания в готовые песни, джинглы и фоновые треки. Сервис доступен как для частных лиц, так и для бизнеса.
Весь сгенерированный контент подходит для коммерческого использования. Для этого ElevenLabs обучила свою модель исключительно на лицензированных материалах и заключила соглашения с крупными управляющими цифровыми правами, Merlin Network и Kobalt Music Group.
Кроме того, в систему встроены защитные механизмы, блокирующие запросы, которые могут привести к созданию оскорбительного контента.
elevenlabs.io
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍51❤41🔥5🥰2👨💻2
Зачем нужен Harmony?
Этот формат нужен для:
— 🧠 генерации chain of thought рассуждений
— 🔧 корректного вызова функций и использования инструментов
— 📦 вывода в разные каналы: обычный ответ, reasoning, tool call
— 🗂️ поддержки tool namespaces и иерархических инструкций
💡 Harmony имитирует OpenAI Responses API, так что если вы с ним работали — будет легко освоиться.
👉 Если вы используете gpt-oss через HuggingFace, Ollama или vLLM, волноваться не нужно.
Но если строите свой пайплайн — обязательно изучите гайд по Harmony.
Без него модель просто не будет работать как надо.
pip install openai-harmony
# or if you are using uv
uv pip install openai-harmony
@ai_machinelearning_big_data
#gptOSS #Harmony #OpenAI #LLM #PromptEngineering
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍61❤28🔥11🦄3👨💻2😁1
🚀 Qwen3-4B-Instruct-2507 и Qwen3-4B-Thinking-2507 — ловите еще один апдейт от Qwen: LLM с поддержкой 256K контекста
🧠 Qwen3-4B-Instruct — идеально подойдёт для:
• генерации текстов
• многоязычных задач
• сложных промптов
🧠 Qwen3-4B-Thinking — заточен под:
• логику
• математику
• программирование и технический анализ
⚡ Обе модели стали:
• точнее
• логичнее
• лучше справляются с длинными диалогами
🔗 Модели на Hugging Face:
https://huggingface.co/Qwen/Qwen3-4B-Instruct-2507
https://huggingface.co/Qwen/Qwen3-4B-Thinking-2507
🔗 Модели на ModelScope:
https://modelscope.cn/models/Qwen/Qwen3-4B-Instruct-2507
https://modelscope.cn/models/Qwen/Qwen3-4B-Thinking-2507
@ai_machinelearning_big_data
#AI #ML #qwen #opensource
🧠 Qwen3-4B-Instruct — идеально подойдёт для:
• генерации текстов
• многоязычных задач
• сложных промптов
🧠 Qwen3-4B-Thinking — заточен под:
• логику
• математику
• программирование и технический анализ
⚡ Обе модели стали:
• точнее
• логичнее
• лучше справляются с длинными диалогами
🔗 Модели на Hugging Face:
https://huggingface.co/Qwen/Qwen3-4B-Instruct-2507
https://huggingface.co/Qwen/Qwen3-4B-Thinking-2507
🔗 Модели на ModelScope:
https://modelscope.cn/models/Qwen/Qwen3-4B-Instruct-2507
https://modelscope.cn/models/Qwen/Qwen3-4B-Thinking-2507
@ai_machinelearning_big_data
#AI #ML #qwen #opensource
👍81🔥42❤20👨💻2
Media is too big
VIEW IN TELEGRAM
OpenAI представит GPT-5 в ходе прямой трансляции 7 августа в 10 утра по тихоокеанскому времени (20.00 МСК). Это станет первым крупным обновлением с момента выхода GPT-4 в марте 2023 года.
По словам тестировщиков, новая система демонстрирует заметный прогресс в программировании и решении научных и математических задач. Однако они отмечают, что скачок по сравнению с GPT-4 менее заметен, чем переход от GPT-3.5 к GPT-4.
Сэм Альтман ранее намекал, что в основе GPT-5 лежит гибридный подход: традиционное масштабирование модели сочетается с технологией «test-time compute», которая динамически выделяет дополнительные вычислительные ресурсы для решения особо сложных задач.
reuters.com
Илон Маск соообщил, что xAI откроет исходный код модели Grok 2 на следующей неделе. Этот шаг последовал за недавним релизом моделей с открытыми весами от OpenAI и свидетельствует об усилении конкуренции в сегменте открытых ИИ-решений.
Ожидается, что публикация Grok 2 в открытом доступе ускорит совместную разработку в области ИИ и укрепит репутационные позиции xAI в сообществе разработчиков.
Elon Musk в сети Х
Компания запустила бета-тестирование Gaming Copilot, ИИ-помощника, встроенного в Game Bar Windows 11. Функция доступна участникам программы Xbox Insiders и впервые интегрирует технологию Xbox Copilot непосредственно в игровой процесс на ПК.
Ассистент распознает, в какую игру играет пользователь, и может анализировать скриншоты, достижения и историю, чтобы отвечать на вопросы, предлагать стратегии и делать снимки экрана, не выходя из полноэкранного режима. Поддерживается голосовое управление, чтобы геймеры могли в реальном времени запрашивать, например, тактику для битвы с боссом или совет по выбору персонажа.
На данный момент превью доступно только на английском языке в США, Австралии, Новой Зеландии, Японии и Сингапуре.
theverge.com
Спустя 2 месяца после начала публичного тестирования, Google официально выпустила своего ИИ-агента для программирования Jules. Инструмент, работающий на модели Gemini 2.5 Pro, способен в асинхронном режиме клонировать кодовые базы, создавать pull-запросы на GitHub и самостоятельно выполнять задачи по исправлению багов или обновлению зависимостей.
С релизом компания представила трехуровневую систему тарификации. Бесплатный план включает до 15 задач в день. Платный доступ интегрирован в подписки Google AI: тариф Pro увеличивает лимиты Jules в 5 раз, а Ultra - в 20 раз.
blog.google
Инструмент, получивший название Claude Code Security Reviewer, использует модель Claude и интегрируется в GitHub Actions, сканируя pull-запросы на наличие потенциальных проблем с безопасностью.
Благодаря способности Claude понимать контекст кода, система может находить уязвимости в разных языках программирования. Она автоматически добавляет комментарии к проблемным участкам, отсеивает вероятные ложные срабатывания и анализирует только измененные файлы. Инструмент доступен на GitHub под лицензией MIT.
anthropic.com
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
10❤68👍27🔥18👨💻3
Что расскажут топ-спикеры на фестивале:
@ai_machinelearning_big_data
#news #ai #opensource
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥38🥱18❤9👍7👨💻2
⚡ Agent Lightning — ускоритель обучения для ИИ-агентов от Microsoft
Agent Lightning — это фреймворк для обучения и оптимизации LLM-агентов с помощью Reinforcement Learning без изменения их кода.
🧠 Поддерживает:
• LangChain
• AutoGen
• OpenAI Agents SDK
• и другие фреймворки на Python
🔧 Как он работает:
• Агент не нужно переписывать — он подключается как есть
• Вся его работа разбивается на отдельные шаги (эпизоды), которые можно анализировать
• Специальный алгоритм LightningRL оценивает, какие действия были полезны, а какие — нет
• Система может учитывать не только финальный результат, но и промежуточные сигналы (награды)
• Эти данные автоматически собираются и используются для дообучения агента
🔥 Преимущества:
• Не требует модификации логики агента
• Можно легко подключить к существующим пайплайнам
• Улучшает точность и устойчивость в сложных задачах: от генерации кода до Text-to-SQL
Отличный инструмент для всех, кто хочет сделать своих LLM-агентов.
🟠 Проект: https://microsoft.com/en-us/research/project/agent-lightning/
🟠 Статья: https://arxiv.org/abs/2508.03680
🟠 Github: https://github.com/microsoft/agent-lightning
@ai_machinelearning_big_data
#agent #reinforcementlearning #mlops #llm #Microsoft
Agent Lightning — это фреймворк для обучения и оптимизации LLM-агентов с помощью Reinforcement Learning без изменения их кода.
🧠 Поддерживает:
• LangChain
• AutoGen
• OpenAI Agents SDK
• и другие фреймворки на Python
🔧 Как он работает:
• Агент не нужно переписывать — он подключается как есть
• Вся его работа разбивается на отдельные шаги (эпизоды), которые можно анализировать
• Специальный алгоритм LightningRL оценивает, какие действия были полезны, а какие — нет
• Система может учитывать не только финальный результат, но и промежуточные сигналы (награды)
• Эти данные автоматически собираются и используются для дообучения агента
🔥 Преимущества:
• Не требует модификации логики агента
• Можно легко подключить к существующим пайплайнам
• Улучшает точность и устойчивость в сложных задачах: от генерации кода до Text-to-SQL
Отличный инструмент для всех, кто хочет сделать своих LLM-агентов.
@ai_machinelearning_big_data
#agent #reinforcementlearning #mlops #llm #Microsoft
Please open Telegram to view this post
VIEW IN TELEGRAM
❤47🔥21👍14👨💻2
This media is not supported in your browser
VIEW IN TELEGRAM
Новый четырёхногий робот весом всего 37 кг
Работа стал: Легче, Прочнее, Быстрее.
Разработан специально для промышленных задач, где важны автономность, манёвренность и надёжность.
Инженерная мощь нового поколения — в компактном корпусе.
@ai_machinelearning_big_data
#ai #robots #Unitree
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥65👍27❤16🥱4👾2🍾1😭1
🔥 А вот и ChatGPT-5
Модель гибридная и выглядит очень круто, особенно в кодинге! На aime-2025 получила 100 процентов!
Альтман заявляет, что модель дадут даже бесплатным пользователям и прямо сегодня.
https://openai.com/index/introducing-gpt-5/
Стрим, кстати, смотрят 155 к человек: https://www.youtube.com/watch?v=0Uu_VJeVVfo
GPT-5 уже доступен в Perplexity, Cursor, Copilot.
@ai_machinelearning_big_data
#Chatgpt5
Модель гибридная и выглядит очень круто, особенно в кодинге! На aime-2025 получила 100 процентов!
Альтман заявляет, что модель дадут даже бесплатным пользователям и прямо сегодня.
https://openai.com/index/introducing-gpt-5/
Стрим, кстати, смотрят 155 к человек: https://www.youtube.com/watch?v=0Uu_VJeVVfo
GPT-5 уже доступен в Perplexity, Cursor, Copilot.
@ai_machinelearning_big_data
#Chatgpt5
1🔥98👍30❤20😐10
Media is too big
VIEW IN TELEGRAM
Спустя всего час после окончания презентации GPT-5, Илон Маск написал в Х, что следующая итерация модели искусственного интеллекта от xAI, Grok 5, будет выпущена до конца 2025 года, и пообещал, что она будет "разрушительно хороша".
Elon Musk в сети Х
OpenAI предложила бонусы за удержание примерно тысяче своих исследователей и инженеров - это около трети всего штата. По данным The Information, суммы выплат варьируются от нескольких сотен тысяч до нескольких миллионов долларов на человека.
Эти денежные и акционерные поощрения призваны удержать ключевые таланты в компании. OpenAI сталкивается с агрессивным хантингом со стороны конкурентов, которые активно переманивают ведущих ИИ-специалистов.
Выплаты бонусов происходят на фоне слухов о возможной продаже акций, которая может оценить OpenAI в 500 миллиардов долларов - вдвое больше текущей оценки.
theinformation.com
NASA совместно с Google Cloud разработали прототип ИИ-системы, которая поможет астронавтам диагностировать и лечить заболевания в условиях ограниченной связи с Землей. Система под названием «Цифровой ассистент бортового врача» объединяет обработку естественного языка с медицинской литературой по космическим полетам, чтобы генерировать рекомендации по лечению и отслеживать здоровье экипажа.
Первые испытания, проведенные по стандартной методике оценки клинической компетентности, показали, что инструмент выдает надежные диагностические предположения. Сейчас модель дорабатывают с практикующими врачами перед ее интеграцией в будущие космические программы.
cloud.google.com
Китайский техгигант планирует представить новую модель, ориентированную на сложные логические рассуждения, уже до конца этого месяца. Кроме того, в ближайшие месяцы компания выпустит обновленную версию своей базовой модели - Ernie 5.0. Первая рмзонинг-модель Baidu представила в марте.
Baidu стала одной из первых крупных китайских компаний, запустивших собственный чат-бот Ernie Bot, аналог ChatGPT. Несмотря на ранний старт, в июле Ernie Bot занимал 10-е место по числу активных месячных пользователей среди ИИ-приложений в Китае.
wsj.com
Microsoft объявила, что в ее сервисе Bing Image Creator теперь доступна модель GPT-4o. Она отличается более точным рендерингом текста и лучшим следованием промптам. Кроме того, GPT-4o позволяет редактировать загруженные изображения или использовать их в качестве референса для создания новых.
По просьбам пользователей, Microsoft сохранила и предыдущую модель - DALL-E 3. Теперь при создании изображения можно выбрать, какую из двух моделей использовать.
Как и раньше, сервис предоставляет 15 «быстрых» генераций. После исчерпания лимита за ускорение придется платить баллами Microsoft Rewards, однако медленная генерация остается неограниченной и бесплатной. Доступ к обновленному инструменту открыт через веб-сайт и мобильные приложения Bing.
blogs.bing.com
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👏31❤24👍6😁6🥰3✍1🔥1
Современное ИТ-образование с фокусом на реальные потребности рынка и индивидуальным подходом к студенту — то, что поможет тебе окрепнуть как специалисту и усилить карьеру.
В магистратуре Центрального университета ты получишь опыт работы в ИТ-компаниях уровня Т-Банка, Яндекса, Авито уже во время учебы. Средняя зарплата студентов — 195 000 ₽.
Что тебя ждет:
• Грант до 75% на все время обучения.
• Закрепление теории на задачах от бизнеса.
• Стажировки в крупных компаниях и трудоустройство.
• Индивидуальный наставник, чтобы достигать целей.
• Занятия по вечерам и выходным.
• Диплом о высшем образовании государственного образца.
Подавай заявку до 24 августа: ссылка
В магистратуре Центрального университета ты получишь опыт работы в ИТ-компаниях уровня Т-Банка, Яндекса, Авито уже во время учебы. Средняя зарплата студентов — 195 000 ₽.
Что тебя ждет:
• Грант до 75% на все время обучения.
• Закрепление теории на задачах от бизнеса.
• Стажировки в крупных компаниях и трудоустройство.
• Индивидуальный наставник, чтобы достигать целей.
• Занятия по вечерам и выходным.
• Диплом о высшем образовании государственного образца.
Подавай заявку до 24 августа: ссылка
🤣31👍14❤3🤬3🥰2
Google разработала масштабируемый процесс *active learning*, который позволяет в десятки тысяч раз сократить объём размеченных данных, необходимых для тонкой настройки больших языковых моделей на сложных задачах — например, при модерации рекламного контента.
1. Стартовая модель (LLM-0) получает промпт и автоматически размечает огромный массив данных.
2. Кластеризация выявляет примеры, где модель путается (наиболее спорные и ценные для обучения).
3. Отбор данных: из этих кластеров выбирают информативные и разнообразные примеры.
4. Экспертная разметка — только для выбранных примеров.
5. Итерации: дообучение модели → новый отбор спорных примеров → разметка → снова обучение.
- Сокращение с 100 000 размеченных примеров до менее 500 при сохранении или улучшении качества.
- Улучшение метрики *Cohen’s Kappa* на 55–65 %.
- В больших продакшн-моделях — до 3–4 порядков меньше данных при сопоставимом или лучшем качестве.
Это метрика, которая показывает, насколько два "судьи" (например, эксперт и модель) согласны между собой с поправкой на случайные совпадения.
- 0.0 — нет согласия (или хуже случайного)
- 0.41–0.60 — умеренное согласие
- 0.61–0.80 — значительное
- 0.81–1.00 — почти полное согласие
В задачах с дисбалансом классов Kappa даёт более честную оценку, чем обычная точность (accuracy).
Чем лучше предыдущих методов:
- Точечная разметка: размечаются только самые информативные примеры.
- Масштабируемость: метод применим к наборам данных с сотнями миллиардов примеров.
- Экономия ресурсов: меньше времени и затрат на разметку.
- Быстрая адаптация: подходит для доменов с быстро меняющимися правилами (реклама, модерация, безопасность).
При умном отборе данных LLM можно адаптировать в тысячи раз быстрее и дешевле, чем при традиционном обучении на больших размеченных наборах.
#GoogleResearch #ActiveLearning #AI #LLM #MachineLearning #DataEfficiency
@ai_machinelearning_big_data
#GoogleResearch #ActiveLearning #AI #LLM #MachineLearning #DataEfficiency
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍108🔥23❤19⚡3🥰3