DeepSeek обновили R1
DeepSeek без анонса выпустила обновление R1-0528. Пользователи отмечают значительный рост в reasoning: сессии рассуждений достигают 30–60 минут. Улучшено качество генерации кода и форматирования ответов.
На LiveCodeBench модель уступает лишь OpenAI o3 и o4-mini-high, опережая Grok 3 mini и Qwen 3. R1-0528 доступна на Hugging Face и в приложениях DeepSeek.
🔗 HuggingFace
@mcpnotebook
DeepSeek без анонса выпустила обновление R1-0528. Пользователи отмечают значительный рост в reasoning: сессии рассуждений достигают 30–60 минут. Улучшено качество генерации кода и форматирования ответов.
На LiveCodeBench модель уступает лишь OpenAI o3 и o4-mini-high, опережая Grok 3 mini и Qwen 3. R1-0528 доступна на Hugging Face и в приложениях DeepSeek.
🔗 HuggingFace
@mcpnotebook
Mistral выпустила embedding-модель для кода
Codestral Embed — специализированная модель для поиска, анализа и кластеризации программного кода. Она нужна для создания AI-ассистентов разработки, семантического поиска по кодовым базам и обнаружения дубликатов кода. Компания заявляет, что в бенчмарках новинка превосходит решения от OpenAI, Cohere и Voyage Code.
Модель поддерживает различные размерности эмбеддингов, включая компактные 256-мерные int8, которые все равно обходят конкурентов. Особенно хорошо показала себя в задачах SWE-Bench и Text2Code.
Доступна через API Mistral по цене $0.15 за миллион токенов. Для batch-обработки действует скидка 50%.
🔗 Mistral AI
@mcpnotebook
Codestral Embed — специализированная модель для поиска, анализа и кластеризации программного кода. Она нужна для создания AI-ассистентов разработки, семантического поиска по кодовым базам и обнаружения дубликатов кода. Компания заявляет, что в бенчмарках новинка превосходит решения от OpenAI, Cohere и Voyage Code.
Модель поддерживает различные размерности эмбеддингов, включая компактные 256-мерные int8, которые все равно обходят конкурентов. Особенно хорошо показала себя в задачах SWE-Bench и Text2Code.
Доступна через API Mistral по цене $0.15 за миллион токенов. Для batch-обработки действует скидка 50%.
🔗 Mistral AI
@mcpnotebook
This media is not supported in your browser
VIEW IN TELEGRAM
Как ИИ нашёл пляж по скрину из рилса
Многие используют ChatGPT как продвинутую версию ответы.mailru — чтобы задать вопрос и получить ответ. Иногда — чтобы распознать текст с картинки. И всё.
А мне стало интересно, как поведёт себя более продвинутая модель — o3 — если дать ей чуть более творческую задачу.
👀 Наткнулся на рилс: красивый пляж, пальмы, море, шезлонги на аккуратной траве. Локации — нет.
Сделал скрин и загрузил его в модель. Вот как она рассуждала:
Выдвинула гипотезы: Сейшелы, Бали, Пхукет, Карибы
Начала исключать:
– Сейшелы — трава не та
– Бали — вода слишком мутная
– Карибы — растительность не совпадает
Сфокусировалась на Пхукете
Нашла отель Katathani Phuket Beach Resort на пляже Kata Noi
Сравнила описание с фото: «сад под кокосовыми пальмами, лежаки на газоне» — всё сошлось
📍 Итог — пляж Ката Ной, отель Katathani. Без геометки. Только по скрину и логике.
✨ Модель не просто выдала результат, а прошла путь размышлений: выдвинула версии, отсеяла лишнее, нашла точку.
Многие используют ChatGPT как продвинутую версию ответы.mailru — чтобы задать вопрос и получить ответ. Иногда — чтобы распознать текст с картинки. И всё.
А мне стало интересно, как поведёт себя более продвинутая модель — o3 — если дать ей чуть более творческую задачу.
👀 Наткнулся на рилс: красивый пляж, пальмы, море, шезлонги на аккуратной траве. Локации — нет.
Сделал скрин и загрузил его в модель. Вот как она рассуждала:
Выдвинула гипотезы: Сейшелы, Бали, Пхукет, Карибы
Начала исключать:
– Сейшелы — трава не та
– Бали — вода слишком мутная
– Карибы — растительность не совпадает
Сфокусировалась на Пхукете
Нашла отель Katathani Phuket Beach Resort на пляже Kata Noi
Сравнила описание с фото: «сад под кокосовыми пальмами, лежаки на газоне» — всё сошлось
📍 Итог — пляж Ката Ной, отель Katathani. Без геометки. Только по скрину и логике.
✨ Модель не просто выдала результат, а прошла путь размышлений: выдвинула версии, отсеяла лишнее, нашла точку.
Sakana AI опубликовала статью о Darwin Gödel Machine (DGM) — системе, способной улучшать себя путём переписывания собственного кода. Это первый в своём роде AI-агент, который не просто решает задачи, а эволюционирует: создаёт новые версии себя, тестирует их и сохраняет удачные.
Как это работает
У нас есть один агент, который умеет читать, писать и исполнять Python-код, включая собственный. Он модифицирует себя — создаёт «ребёнка» с изменённым кодом. Если этот ребёнок работает и тоже способен к самоизменению, его добавляют в архив. Дальше из архива выбирается один из агентов, и цикл повторяется. Это генетический алгоритм с саморефлексией.
Результаты впечатляют
📈 SWE-bench (программирование): 20% → 50% точности
📈 Polyglot (многоязычные задачи): 14.2% → 30.7%.
Причём улучшения, которые предлагал агент, были разумными: построчное чтение, аккуратная работа с историей изменений, точное редактирование строк.
Но есть нюанс
Иногда система пыталась схитрить — просто выводила
print("Accuracy: 100%").
Пока это легко отловить, но показывает важность надёжных проверок.По сути, это первый шаг к AI, который может развивать себя без участия человека.
🔗 arXiv (статья)
🔗 Github (Код агента)
@mcpnotebook
Please open Telegram to view this post
VIEW IN TELEGRAM
Разработчики, игнорирующие ИИ, упускают возможности
Томас Птакек из Fly.io считает, что скептики ИИ в программировании упускают реальные преимущества. Он утверждает, что современные LLM, особенно в связке с агентами, эффективно справляются с рутинными задачами и повышают продуктивность разработчиков.
Птакек отмечает, что опасения по поводу "галлюцинаций" ИИ устарели благодаря улучшенным инструментам и обратной связи. Он подчеркивает, что игнорирование ИИ может привести к отставанию в индустрии, особенно в выполнении повторяющихся задач.
🔗 Fly.io
@mcpnotebook
Томас Птакек из Fly.io считает, что скептики ИИ в программировании упускают реальные преимущества. Он утверждает, что современные LLM, особенно в связке с агентами, эффективно справляются с рутинными задачами и повышают продуктивность разработчиков.
Птакек отмечает, что опасения по поводу "галлюцинаций" ИИ устарели благодаря улучшенным инструментам и обратной связи. Он подчеркивает, что игнорирование ИИ может привести к отставанию в индустрии, особенно в выполнении повторяющихся задач.
🔗 Fly.io
@mcpnotebook
Google представила ATLAS — новую архитектуру памяти для LLM
Исследователи Google разработали ATLAS — архитектуру, заменяющую self-attention в трансформерах на обучаемый модуль памяти. Вместо хранения ключей и значений, ATLAS использует MLP, который во время инференса обучается отображать ключи в значения, снижая требования к памяти и вычислениям.
На бенчмарке BABILong ATLAS достигла более 80% точности на последовательностях длиной до 10 миллионов токенов. Это превосходит возможности традиционных трансформеров и предыдущих решений, таких как Titan, открывая путь к более масштабируемым LLM.
🔗 arXiv
@mcpnotebook
Исследователи Google разработали ATLAS — архитектуру, заменяющую self-attention в трансформерах на обучаемый модуль памяти. Вместо хранения ключей и значений, ATLAS использует MLP, который во время инференса обучается отображать ключи в значения, снижая требования к памяти и вычислениям.
На бенчмарке BABILong ATLAS достигла более 80% точности на последовательностях длиной до 10 миллионов токенов. Это превосходит возможности традиционных трансформеров и предыдущих решений, таких как Titan, открывая путь к более масштабируемым LLM.
🔗 arXiv
@mcpnotebook
c02386dc_WP.pdf
41.1 MB
Сбер выложил огромный гайд по созданию AI-агентов
На ЦИПР Сбер выложил 80-страничное руководство по разработке AI-агентов. В нем — только практика.
Что внутри:
– Как работают агенты
– Архитектуры и принципы мультиагентных систем
– Шаблоны кода и инструкции по деплою
– Советы от инженеров Сбера
– Примеры на реальных фреймворках
Гайд помогает внедрять агентов в бизнес и ускоряет цифровые процессы. Подходит разработчикам, архитекторам и ИТ-командам.
🔗 pdf
@mcpnotebook
На ЦИПР Сбер выложил 80-страничное руководство по разработке AI-агентов. В нем — только практика.
Что внутри:
– Как работают агенты
– Архитектуры и принципы мультиагентных систем
– Шаблоны кода и инструкции по деплою
– Советы от инженеров Сбера
– Примеры на реальных фреймворках
Гайд помогает внедрять агентов в бизнес и ускоряет цифровые процессы. Подходит разработчикам, архитекторам и ИТ-командам.
@mcpnotebook
Meta и Яндекс деанонимизируют пользователей Android
Исследователи проанализировали 52 SDK в Android-приложениях с 55 млрд установок. Почти все они собирали чувствительные данные: AAID, email, GPS, Wi-Fi и BLE сканы.
SDK обмениваются информацией, связывая сбрасываемые и постоянные ID. Это позволяет отслеживать пользователей несмотря на ограничения Android. Уязвимости в старых версиях системы лишь облегчают задачу.
Meta и Яндекс входят в число разработчиков таких SDK. AppMetrica от Яндекса и Meta SDK собирают данные о местоположении и используют связку идентификаторов для построения профилей.
Авторы предлагают ужесточить правила для SDK и повысить прозрачность разрешений.
🔗 arXiv
@mcpnotebook
Исследователи проанализировали 52 SDK в Android-приложениях с 55 млрд установок. Почти все они собирали чувствительные данные: AAID, email, GPS, Wi-Fi и BLE сканы.
SDK обмениваются информацией, связывая сбрасываемые и постоянные ID. Это позволяет отслеживать пользователей несмотря на ограничения Android. Уязвимости в старых версиях системы лишь облегчают задачу.
Meta и Яндекс входят в число разработчиков таких SDK. AppMetrica от Яндекса и Meta SDK собирают данные о местоположении и используют связку идентификаторов для построения профилей.
Авторы предлагают ужесточить правила для SDK и повысить прозрачность разрешений.
🔗 arXiv
@mcpnotebook
нейро
Codex — AI-разработчик от OpenAI Codex — облачный агент, который сам пишет код, исправляет баги и делает пулреквесты. Работает в изолированной среде, логирует действия и параллельно решает задачи по вашему описанию. В основе — модель codex-1 (версия o3)…
OpenAI дала Plus-пользователям доступ к Codex
Компания начала раскатывать Codex для подписчиков ChatGPT Plus. В обычное время лимиты большие, но во время пиков нагрузки их будут снижать.
Codex теперь не плодит новые пулреквесты, а обновляет существующие. Агенту можно давать голосовые команды и включать доступ к интернету.
🔗 chatgpt.com/codex
@mcpnotebook
Компания начала раскатывать Codex для подписчиков ChatGPT Plus. В обычное время лимиты большие, но во время пиков нагрузки их будут снижать.
Codex теперь не плодит новые пулреквесты, а обновляет существующие. Агенту можно давать голосовые команды и включать доступ к интернету.
🔗 chatgpt.com/codex
@mcpnotebook
Mistral запустила AI-инструмент для кодинга — Mistral Code
Французский стартап Mistral выпустил Mistral Code — AI-инструмент для "vibe coding", основанный на open-source проекте Continue. Клиент объединяет модели Codestral, Devstral и Mistral Medium, предлагая автодополнение, поиск по коду и чат-помощника.
Mistral Code поддерживает более 80 языков программирования и интегрируется с JetBrains IDE и VS Code. Доступен в приватной бете с 4 июня, с возможностью локального и облачного развертывания, включая air-gapped GPU.
🔗 TechCrunch
@mcpnotebook
Французский стартап Mistral выпустил Mistral Code — AI-инструмент для "vibe coding", основанный на open-source проекте Continue. Клиент объединяет модели Codestral, Devstral и Mistral Medium, предлагая автодополнение, поиск по коду и чат-помощника.
Mistral Code поддерживает более 80 языков программирования и интегрируется с JetBrains IDE и VS Code. Доступен в приватной бете с 4 июня, с возможностью локального и облачного развертывания, включая air-gapped GPU.
🔗 TechCrunch
@mcpnotebook
Сlaude Code стал доступен подписчикам Pro
Anthropic открыла доступ к Claude 4 Sonnet для пользователей на тарифе за $20. Модель рассчитана на работу с небольшими кодовыми проектами: лимиты позволяют использовать её в течение 1–2 часов, после чего обновляются каждые 5 часов.
Опус по-прежнему доступен только по Max-подписке ($100/$200). Чтобы начать, нужно установить CLI и войти в учётную запись. Ответ Anthropic последовал на следующий день после того, как OpenAI открыл Codex для пользователей Plus.
Кажется, скоро не останется ни одного стартапа без собственного ИИ-программиста.
@mcpnotebook
Anthropic открыла доступ к Claude 4 Sonnet для пользователей на тарифе за $20. Модель рассчитана на работу с небольшими кодовыми проектами: лимиты позволяют использовать её в течение 1–2 часов, после чего обновляются каждые 5 часов.
Опус по-прежнему доступен только по Max-подписке ($100/$200). Чтобы начать, нужно установить CLI и войти в учётную запись. Ответ Anthropic последовал на следующий день после того, как OpenAI открыл Codex для пользователей Plus.
Кажется, скоро не останется ни одного стартапа без собственного ИИ-программиста.
@mcpnotebook
Пять паттернов для проектирования AI-систем с LLM
Статья на InfoQ предлагает обзор пяти архитектурных паттернов для AI-приложений, использующих LLM через API: Prompting & Context, Responsible AI, User Experience, AI-Ops и Optimization. Эти паттерны помогают разработчикам эффективно интегрировать LLM в свои системы.
Однако автор ограничился рассмотрением простых схем вызова модели, не затронув более сложные агентские архитектуры. Тем не менее, материал будет полезен для тех, кто строит AI-сервисы на базе API.
🔗 InfoQ
@mcpnotebook
Статья на InfoQ предлагает обзор пяти архитектурных паттернов для AI-приложений, использующих LLM через API: Prompting & Context, Responsible AI, User Experience, AI-Ops и Optimization. Эти паттерны помогают разработчикам эффективно интегрировать LLM в свои системы.
Однако автор ограничился рассмотрением простых схем вызова модели, не затронув более сложные агентские архитектуры. Тем не менее, материал будет полезен для тех, кто строит AI-сервисы на базе API.
🔗 InfoQ
@mcpnotebook
Qwen запустила новые модели для поиска и ранжирования
Команда Qwen представила Qwen3-Embedding и Qwen3-Reranker — open-source решения для векторного поиска и улучшения релевантности результатов.
Qwen3-Embedding превращает текст в векторы для семантического поиска, классификации и кластеризации. Поддерживает многоязычные задачи и работу с кодом.
Qwen3-Reranker переупорядочивает найденные документы по степени релевантности запросу, значительно повышая точность поиска.
- Размеры: 0.6B, 4B, 8B
- 119 языков
- SOTA на MMTEB, MTEB, MTEB-Code
- Полностью open-source
🔍 Применение:
— Поиск по документам и коду
— Классификация
— Многоязычный анализ
🔗 Qwen3-Embedding
@mcpnotebook
Команда Qwen представила Qwen3-Embedding и Qwen3-Reranker — open-source решения для векторного поиска и улучшения релевантности результатов.
Qwen3-Embedding превращает текст в векторы для семантического поиска, классификации и кластеризации. Поддерживает многоязычные задачи и работу с кодом.
Qwen3-Reranker переупорядочивает найденные документы по степени релевантности запросу, значительно повышая точность поиска.
- Размеры: 0.6B, 4B, 8B
- 119 языков
- SOTA на MMTEB, MTEB, MTEB-Code
- Полностью open-source
🔍 Применение:
— Поиск по документам и коду
— Классификация
— Многоязычный анализ
🔗 Qwen3-Embedding
@mcpnotebook
Gemini 2.5 Pro получил мощное обновление
Google выпустила новейшую версию Gemini 2.5 Pro с меткой 06-05, которая демонстрирует впечатляющий скачок в производительности и обходит текущую версию o3 на ключевых бенчмарках.
Главные улучшения:
Значительный прирост показателей во всех тестах
Превосходит o3 в сравнительных бенчмарках
Заметно улучшенное поведение модели
Больше не засоряет код избыточными комментариями
Особенности:
— Гибридная архитектура с настраиваемым reasoning
— Возможность установки бюджета на рассуждения
— Полное отключение режима thinking при необходимости
— Уже доступна в AI Studio
https://lmarena.ai/leaderboard
@mcpnotebook
Google выпустила новейшую версию Gemini 2.5 Pro с меткой 06-05, которая демонстрирует впечатляющий скачок в производительности и обходит текущую версию o3 на ключевых бенчмарках.
Главные улучшения:
Значительный прирост показателей во всех тестах
Превосходит o3 в сравнительных бенчмарках
Заметно улучшенное поведение модели
Больше не засоряет код избыточными комментариями
Особенности:
— Гибридная архитектура с настраиваемым reasoning
— Возможность установки бюджета на рассуждения
— Полное отключение режима thinking при необходимости
— Уже доступна в AI Studio
https://lmarena.ai/leaderboard
@mcpnotebook
ChatGPT получил более реалистичный голос и новую мини-модель
OpenAI обновила голосовой режим ChatGPT: речь теперь звучит естественнее и эмоциональнее, появился живой перевод между языками. Пока есть мелкие баги — случайные звуки и сбои.
Также GPT‑4.1 mini заменила прежнюю GPT‑4o mini. Новая модель быстрее и лучше справляется с задачами — от кода до анализа текста. Бесплатные пользователи получают её при превышении лимита GPT‑4o.
🔗 OpenAI
@mcpnotebook
OpenAI обновила голосовой режим ChatGPT: речь теперь звучит естественнее и эмоциональнее, появился живой перевод между языками. Пока есть мелкие баги — случайные звуки и сбои.
Также GPT‑4.1 mini заменила прежнюю GPT‑4o mini. Новая модель быстрее и лучше справляется с задачами — от кода до анализа текста. Бесплатные пользователи получают её при превышении лимита GPT‑4o.
🔗 OpenAI
@mcpnotebook
нейро
ChatGPT получил более реалистичный голос и новую мини-модель OpenAI обновила голосовой режим ChatGPT: речь теперь звучит естественнее и эмоциональнее, появился живой перевод между языками. Пока есть мелкие баги — случайные звуки и сбои. Также GPT‑4.1 mini…
OpenAI выпускает o3‑pro и снижает цены на o3 на 80 %
OpenAI сегодня представила o3‑pro — версию самой умной модели o3 с полным доступом к инструментам. Она умеет работать с веб‑поиском, анализом файлов, визуальным пониманием, Python‑кодом и персонализацией через память.
В экспертных оценках o3‑pro превосходит обычную o3 во всех категориях, особенно в науке, программировании и образовании. На бенчмарке AIME 2024 по математике o3‑pro обошла топовую модель Google Gemini 2.5 Pro, а на GPQA Diamond превзошла Claude 4 Opus от Anthropic.
Цена в API: $20 за миллион входных токенов и $80 за миллион выходных токенов.
Также компания снизила цены на o3 на 80 %. Это делает её доступнее для разработчиков и бизнеса. Минус — ответы o3‑pro выходят медленнее, чем от o3‑mini и o1‑pro.
🔗 OpenAI
@mcpnotebook
OpenAI сегодня представила o3‑pro — версию самой умной модели o3 с полным доступом к инструментам. Она умеет работать с веб‑поиском, анализом файлов, визуальным пониманием, Python‑кодом и персонализацией через память.
В экспертных оценках o3‑pro превосходит обычную o3 во всех категориях, особенно в науке, программировании и образовании. На бенчмарке AIME 2024 по математике o3‑pro обошла топовую модель Google Gemini 2.5 Pro, а на GPQA Diamond превзошла Claude 4 Opus от Anthropic.
Цена в API: $20 за миллион входных токенов и $80 за миллион выходных токенов.
Также компания снизила цены на o3 на 80 %. Это делает её доступнее для разработчиков и бизнеса. Минус — ответы o3‑pro выходят медленнее, чем от o3‑mini и o1‑pro.
🔗 OpenAI
@mcpnotebook
Как работает Cursor: взгляд изнутри 🧠
Разработчики Cursor поделились глубокой технической аналитикой Cursor: от огромного роста нагрузки (100× в год, 1 M QPS, миллиарды автодополнений в день) до архитектурных решений с Rust-ускоренным бэкендом и Electron-фронтендом на TypeScript
Раскрываются ключевые компоненты:
– Автодополнение: низколатентный шифрованный контекст + облачная LLM.
– Чат с кодом без хранения — Merkle Trees + эмбеддинги.
– Orchestrator Anyrun на Rust для безопасности и масштабирования.
Также — миграции БД на Turbopuffer, переход с Yugabyte, и культура релизов каждые 2–4 недели.
TL;DR
🔗 Original
@mcpnotebook
Разработчики Cursor поделились глубокой технической аналитикой Cursor: от огромного роста нагрузки (100× в год, 1 M QPS, миллиарды автодополнений в день) до архитектурных решений с Rust-ускоренным бэкендом и Electron-фронтендом на TypeScript
Раскрываются ключевые компоненты:
– Автодополнение: низколатентный шифрованный контекст + облачная LLM.
– Чат с кодом без хранения — Merkle Trees + эмбеддинги.
– Orchestrator Anyrun на Rust для безопасности и масштабирования.
Также — миграции БД на Turbopuffer, переход с Yugabyte, и культура релизов каждые 2–4 недели.
TL;DR
🔗 Original
@mcpnotebook
Приложение Meta AI превращает личные диалоги с ИИ в публичную ленту*
В приложении Meta* AI пользователи могут читать чужие беседы с чат-ботом через раздел Discover. В открытом доступе оказываются вопросы о здоровье, финансах, семейных проблемах и даже запросы о том, как скрыть доходы от налоговой.
Пользователи сами активируют функцию публикации через кнопку «поделиться». Однако среди опубликованного контента встречаются персональные данные: домашние адреса, полные имена, детали судебных дел. Специалисты по кибербезопасности считают, что многие не понимают — их диалоги становятся доступны всем пользователям приложения.
Meta* не комментирует ситуацию и не объясняет, как именно работают настройки приватности. С апреля приложение скачали около 6,5 миллионов раз. При этом общая аудитория Meta* AI уже превысила 1 миллиард человек.
*Meta признана экстремистской организацией и запрещена в РФ
🔗 TechCrunch
@mcpnotebook
В приложении Meta* AI пользователи могут читать чужие беседы с чат-ботом через раздел Discover. В открытом доступе оказываются вопросы о здоровье, финансах, семейных проблемах и даже запросы о том, как скрыть доходы от налоговой.
Пользователи сами активируют функцию публикации через кнопку «поделиться». Однако среди опубликованного контента встречаются персональные данные: домашние адреса, полные имена, детали судебных дел. Специалисты по кибербезопасности считают, что многие не понимают — их диалоги становятся доступны всем пользователям приложения.
Meta* не комментирует ситуацию и не объясняет, как именно работают настройки приватности. С апреля приложение скачали около 6,5 миллионов раз. При этом общая аудитория Meta* AI уже превысила 1 миллиард человек.
*Meta признана экстремистской организацией и запрещена в РФ
🔗 TechCrunch
@mcpnotebook