нейро

DeepSeek обновили R1

DeepSeek без анонса выпустила обновление R1-0528. Пользователи отмечают значительный рост в reasoning: сессии рассуждений достигают 30–60 минут. Улучшено качество генерации кода и форматирования ответов.

На LiveCodeBench модель уступает лишь OpenAI o3 и o4-mini-high, опережая Grok 3 mini и Qwen 3. R1-0528 доступна на Hugging Face и в приложениях DeepSeek.

🔗 HuggingFace

@mcpnotebook

24 views07:40

нейро

Mistral выпустила embedding-модель для кода

Codestral Embed — специализированная модель для поиска, анализа и кластеризации программного кода. Она нужна для создания AI-ассистентов разработки, семантического поиска по кодовым базам и обнаружения дубликатов кода. Компания заявляет, что в бенчмарках новинка превосходит решения от OpenAI, Cohere и Voyage Code.

Модель поддерживает различные размерности эмбеддингов, включая компактные 256-мерные int8, которые все равно обходят конкурентов. Особенно хорошо показала себя в задачах SWE-Bench и Text2Code.

Доступна через API Mistral по цене $0.15 за миллион токенов. Для batch-обработки действует скидка 50%.

🔗 Mistral AI

@mcpnotebook

18 views11:55

нейро

0:15

This media is not supported in your browser

VIEW IN TELEGRAM

Как ИИ нашёл пляж по скрину из рилса

Многие используют ChatGPT как продвинутую версию ответы.mailru — чтобы задать вопрос и получить ответ. Иногда — чтобы распознать текст с картинки. И всё.

А мне стало интересно, как поведёт себя более продвинутая модель — o3 — если дать ей чуть более творческую задачу.

👀 Наткнулся на рилс: красивый пляж, пальмы, море, шезлонги на аккуратной траве. Локации — нет.
Сделал скрин и загрузил его в модель. Вот как она рассуждала:

Выдвинула гипотезы: Сейшелы, Бали, Пхукет, Карибы

Начала исключать:
– Сейшелы — трава не та
– Бали — вода слишком мутная
– Карибы — растительность не совпадает

Сфокусировалась на Пхукете

Нашла отель Katathani Phuket Beach Resort на пляже Kata Noi

Сравнила описание с фото: «сад под кокосовыми пальмами, лежаки на газоне» — всё сошлось

📍 Итог — пляж Ката Ной, отель Katathani. Без геометки. Только по скрину и логике.

✨ Модель не просто выдала результат, а прошла путь размышлений: выдвинула версии, отсеяла лишнее, нашла точку.

18 views14:23

нейро

🤖

Darwin Gödel Machine: первый самомодифицирующийся кодинг агент

Sakana AI опубликовала статью о Darwin Gödel Machine (DGM) — системе, способной улучшать себя путём переписывания собственного кода. Это первый в своём роде AI-агент, который не просто решает задачи, а эволюционирует: создаёт новые версии себя, тестирует их и сохраняет удачные.

Как это работает

У нас есть один агент, который умеет читать, писать и исполнять Python-код, включая собственный. Он модифицирует себя — создаёт «ребёнка» с изменённым кодом. Если этот ребёнок работает и тоже способен к самоизменению, его добавляют в архив. Дальше из архива выбирается один из агентов, и цикл повторяется. Это генетический алгоритм с саморефлексией.

Результаты впечатляют

📈 SWE-bench (программирование): 20% → 50% точности
📈 Polyglot (многоязычные задачи): 14.2% → 30.7%.

Причём улучшения, которые предлагал агент, были разумными: построчное чтение, аккуратная работа с историей изменений, точное редактирование строк.

Но есть нюанс

Иногда система пыталась схитрить — просто выводила print("Accuracy: 100%"). Пока это легко отловить, но показывает важность надёжных проверок.

По сути, это первый шаг к AI, который может развивать себя без участия человека.

🔗 arXiv (статья)
🔗 Github (Код агента)

@mcpnotebook

Please open Telegram to view this post

VIEW IN TELEGRAM

26 views20:48

нейро

Разработчики, игнорирующие ИИ, упускают возможности

Томас Птакек из Fly.io считает, что скептики ИИ в программировании упускают реальные преимущества. Он утверждает, что современные LLM, особенно в связке с агентами, эффективно справляются с рутинными задачами и повышают продуктивность разработчиков.

Птакек отмечает, что опасения по поводу "галлюцинаций" ИИ устарели благодаря улучшенным инструментам и обратной связи. Он подчеркивает, что игнорирование ИИ может привести к отставанию в индустрии, особенно в выполнении повторяющихся задач.

🔗 Fly.io

@mcpnotebook

21 views08:10

нейро

Google представила ATLAS — новую архитектуру памяти для LLM

Исследователи Google разработали ATLAS — архитектуру, заменяющую self-attention в трансформерах на обучаемый модуль памяти. Вместо хранения ключей и значений, ATLAS использует MLP, который во время инференса обучается отображать ключи в значения, снижая требования к памяти и вычислениям.

На бенчмарке BABILong ATLAS достигла более 80% точности на последовательностях длиной до 10 миллионов токенов. Это превосходит возможности традиционных трансформеров и предыдущих решений, таких как Titan, открывая путь к более масштабируемым LLM.

🔗 arXiv

@mcpnotebook

19 views08:11

нейро

c02386dc_WP.pdf

41.1 MB

Сбер выложил огромный гайд по созданию AI-агентов

На ЦИПР Сбер выложил 80-страничное руководство по разработке AI-агентов. В нем — только практика.

Что внутри:
– Как работают агенты
– Архитектуры и принципы мультиагентных систем
– Шаблоны кода и инструкции по деплою
– Советы от инженеров Сбера
– Примеры на реальных фреймворках

Гайд помогает внедрять агентов в бизнес и ускоряет цифровые процессы. Подходит разработчикам, архитекторам и ИТ-командам.

🔗 pdf

@mcpnotebook

19 viewsedited 12:11

нейро

Meta и Яндекс деанонимизируют пользователей Android

Исследователи проанализировали 52 SDK в Android-приложениях с 55 млрд установок. Почти все они собирали чувствительные данные: AAID, email, GPS, Wi-Fi и BLE сканы.

SDK обмениваются информацией, связывая сбрасываемые и постоянные ID. Это позволяет отслеживать пользователей несмотря на ограничения Android. Уязвимости в старых версиях системы лишь облегчают задачу.

Meta и Яндекс входят в число разработчиков таких SDK. AppMetrica от Яндекса и Meta SDK собирают данные о местоположении и используют связку идентификаторов для построения профилей.

Авторы предлагают ужесточить правила для SDK и повысить прозрачность разрешений.

🔗 arXiv

@mcpnotebook

20 viewsedited 13:00

нейро

Codex — AI-разработчик от OpenAI Codex — облачный агент, который сам пишет код, исправляет баги и делает пулреквесты. Работает в изолированной среде, логирует действия и параллельно решает задачи по вашему описанию. В основе — модель codex-1 (версия o3)…

OpenAI дала Plus-пользователям доступ к Codex

Компания начала раскатывать Codex для подписчиков ChatGPT Plus. В обычное время лимиты большие, но во время пиков нагрузки их будут снижать.

Codex теперь не плодит новые пулреквесты, а обновляет существующие. Агенту можно давать голосовые команды и включать доступ к интернету.

🔗 chatgpt.com/codex

@mcpnotebook

32 viewsedited 20:43

нейро

Mistral запустила AI-инструмент для кодинга — Mistral Code

Французский стартап Mistral выпустил Mistral Code — AI-инструмент для "vibe coding", основанный на open-source проекте Continue. Клиент объединяет модели Codestral, Devstral и Mistral Medium, предлагая автодополнение, поиск по коду и чат-помощника.

Mistral Code поддерживает более 80 языков программирования и интегрируется с JetBrains IDE и VS Code. Доступен в приватной бете с 4 июня, с возможностью локального и облачного развертывания, включая air-gapped GPU.

🔗 TechCrunch

@mcpnotebook

30 views19:16

нейро

Сlaude Code стал доступен подписчикам Pro

Anthropic открыла доступ к Claude 4 Sonnet для пользователей на тарифе за $20. Модель рассчитана на работу с небольшими кодовыми проектами: лимиты позволяют использовать её в течение 1–2 часов, после чего обновляются каждые 5 часов.

Опус по-прежнему доступен только по Max-подписке ($100/$200). Чтобы начать, нужно установить CLI и войти в учётную запись. Ответ Anthropic последовал на следующий день после того, как OpenAI открыл Codex для пользователей Plus.

Кажется, скоро не останется ни одного стартапа без собственного ИИ-программиста.

@mcpnotebook

51 views19:16

нейро

Пять паттернов для проектирования AI-систем с LLM

Статья на InfoQ предлагает обзор пяти архитектурных паттернов для AI-приложений, использующих LLM через API: Prompting & Context, Responsible AI, User Experience, AI-Ops и Optimization. Эти паттерны помогают разработчикам эффективно интегрировать LLM в свои системы.

Однако автор ограничился рассмотрением простых схем вызова модели, не затронув более сложные агентские архитектуры. Тем не менее, материал будет полезен для тех, кто строит AI-сервисы на базе API.

🔗 InfoQ

@mcpnotebook

57 viewsedited 19:20

нейро

нейро pinned a photo

10:05

нейро

Qwen запустила новые модели для поиска и ранжирования

Команда Qwen представила Qwen3-Embedding и Qwen3-Reranker — open-source решения для векторного поиска и улучшения релевантности результатов.

Qwen3-Embedding превращает текст в векторы для семантического поиска, классификации и кластеризации. Поддерживает многоязычные задачи и работу с кодом.

Qwen3-Reranker переупорядочивает найденные документы по степени релевантности запросу, значительно повышая точность поиска.

- Размеры: 0.6B, 4B, 8B
- 119 языков
- SOTA на MMTEB, MTEB, MTEB-Code
- Полностью open-source

🔍 Применение:
— Поиск по документам и коду
— Классификация
— Многоязычный анализ

🔗 Qwen3-Embedding

@mcpnotebook

46 views16:20

нейро

Gemini 2.5 Pro получил мощное обновление

Google выпустила новейшую версию Gemini 2.5 Pro с меткой 06-05, которая демонстрирует впечатляющий скачок в производительности и обходит текущую версию o3 на ключевых бенчмарках.

Главные улучшения:
Значительный прирост показателей во всех тестах
Превосходит o3 в сравнительных бенчмарках
Заметно улучшенное поведение модели
Больше не засоряет код избыточными комментариями

Особенности:
— Гибридная архитектура с настраиваемым reasoning
— Возможность установки бюджета на рассуждения
— Полное отключение режима thinking при необходимости
— Уже доступна в AI Studio

https://lmarena.ai/leaderboard

@mcpnotebook

59 viewsedited 16:43

нейро

ChatGPT получил более реалистичный голос и новую мини-модель

OpenAI обновила голосовой режим ChatGPT: речь теперь звучит естественнее и эмоциональнее, появился живой перевод между языками. Пока есть мелкие баги — случайные звуки и сбои.

Также GPT‑4.1 mini заменила прежнюю GPT‑4o mini. Новая модель быстрее и лучше справляется с задачами — от кода до анализа текста. Бесплатные пользователи получают её при превышении лимита GPT‑4o.

🔗 OpenAI

@mcpnotebook

44 views14:13

нейро

ChatGPT получил более реалистичный голос и новую мини-модель OpenAI обновила голосовой режим ChatGPT: речь теперь звучит естественнее и эмоциональнее, появился живой перевод между языками. Пока есть мелкие баги — случайные звуки и сбои. Также GPT‑4.1 mini…

OpenAI выпускает o3‑pro и снижает цены на o3 на 80 %

OpenAI сегодня представила o3‑pro — версию самой умной модели o3 с полным доступом к инструментам. Она умеет работать с веб‑поиском, анализом файлов, визуальным пониманием, Python‑кодом и персонализацией через память.

В экспертных оценках o3‑pro превосходит обычную o3 во всех категориях, особенно в науке, программировании и образовании. На бенчмарке AIME 2024 по математике o3‑pro обошла топовую модель Google Gemini 2.5 Pro, а на GPQA Diamond превзошла Claude 4 Opus от Anthropic.

Цена в API: $20 за миллион входных токенов и $80 за миллион выходных токенов.

Также компания снизила цены на o3 на 80 %. Это делает её доступнее для разработчиков и бизнеса. Минус — ответы o3‑pro выходят медленнее, чем от o3‑mini и o1‑pro.

🔗 OpenAI

@mcpnotebook

53 viewsedited 20:35

нейро

Как работает Cursor: взгляд изнутри 🧠

Разработчики Cursor поделились глубокой технической аналитикой Cursor: от огромного роста нагрузки (100× в год, 1 M QPS, миллиарды автодополнений в день) до архитектурных решений с Rust-ускоренным бэкендом и Electron-фронтендом на TypeScript

Раскрываются ключевые компоненты:
– Автодополнение: низколатентный шифрованный контекст + облачная LLM.
– Чат с кодом без хранения — Merkle Trees + эмбеддинги.
– Orchestrator Anyrun на Rust для безопасности и масштабирования.

Также — миграции БД на Turbopuffer, переход с Yugabyte, и культура релизов каждые 2–4 недели.

TL;DR

🔗 Original

@mcpnotebook

61 views11:01

нейро

Please open Telegram to view this post

VIEW IN TELEGRAM

11:12

нейро

Приложение Meta AI превращает личные диалоги с ИИ в публичную ленту*

В приложении Meta* AI пользователи могут читать чужие беседы с чат-ботом через раздел Discover. В открытом доступе оказываются вопросы о здоровье, финансах, семейных проблемах и даже запросы о том, как скрыть доходы от налоговой.

Пользователи сами активируют функцию публикации через кнопку «поделиться». Однако среди опубликованного контента встречаются персональные данные: домашние адреса, полные имена, детали судебных дел. Специалисты по кибербезопасности считают, что многие не понимают — их диалоги становятся доступны всем пользователям приложения.

Meta* не комментирует ситуацию и не объясняет, как именно работают настройки приватности. С апреля приложение скачали около 6,5 миллионов раз. При этом общая аудитория Meta* AI уже превысила 1 миллиард человек.

*Meta признана экстремистской организацией и запрещена в РФ

🔗 TechCrunch

@mcpnotebook

25 views13:29

About

Blog

Apps

Platform