Анализ данных (Data analysis)

Microsoft вбухивает десятки миллиардов в ИИ, но Copilot пока не стал новым топ-продуктом

Бывший вице-президент Microsoft говорит неприятную вещь: компания рискует пропустить ИИ-волну так же, как когда-то не почувствовала интернет и мобильную эпоху.

На бумаге всё выглядит мощно. Microsoft тратит на ИИ гигантские суммы, встраивает Copilot в Windows, Office, Teams, GitHub и продаёт идею «ИИ в каждом рабочем процессе».

Но продукт не тянет сам себя.

По оценке экспертов, меньше 3,3% пользователей Microsoft 365 реально платят за Copilot. Производители ноутбуков массово добавили NPU в новые устройства, но в Windows и Office так и не появилось killer-приложения, ради которого обычный человек скажет: «Да, мне срочно нужен AI-PC».

Это очень болезненный урок для компании, которая десятилетиями выигрывала за счёт дистрибуции. Раньше достаточно было встроить продукт в Windows или Office, и рынок сам подтягивался. Сейчас так не работает. ИИ нельзя просто положить в меню «Пуск» и ждать магии. Пользователь должен почувствовать пользу сразу.

Бывший VP не списывает Microsoft со счетов. Наоборот, он говорит, что корпоративный ров компании почти невозможно пробить. У Microsoft есть Office, Azure, Active Directory, Teams, контракты, безопасность, доверие CIO и доступ к рабочим данным.

То есть обе мысли могут быть правдой одновременно: Microsoft пока не сделала Copilot продуктом, который люди массово хотят покупать. Но Microsoft всё ещё остаётся одной из немногих компаний, которые могут протащить ИИ в корпоративный мир на уровне инфраструктуры.

https://www.windowslatest.com/2026/05/17/former-microsoft-vp-says-microsoft-missed-the-ai-wave-like-the-internet-and-mobile-as-copilot-scales-back-in-windows-11/

🤣7🔥5❤4👍4

3.54K views10:55

Forwarded from Machinelearning

🌟

Raindrop открыла исходный код локального отладчика агентов Workshop

Инструмент интегрируется с Claude Code, Cursor и другими кодинг-агентами.

Raindrop - стартап из 9 человек, основанный в 2023 году, который позиционирует себя одним из первых, кто оформил мониторинг для ИИ-агентов как отдельный продуктовый класс.

При использовании Workshop модель получает прямой доступ к трассировкам выполнения, читает их, пишет оценочные тесты и правит код, замыкая цикл самовосстановления.

Если агент в проде отклоняется от ожидаемого поведения, разработчик вызывает кодинг-агента прямо в терминале. Тот читает трассу через Workshop, пишет оценку под падающий сценарий, правит код и перезапускает прогон.

Цикл повторяется автоматически, пока не пройдут все проверки.

Workshop работает локально и стримит данные в реальном времени. Каждый токен, вызов инструмента и шаг рассуждения попадает в интерфейс по мере выполнения, без поллинга.

Есть режим воспроизведение, который берёт трассу из продакшена и прогоняет её через ваш экземпляр агента, запущенный локально.

Заявлена поддержка TypeScript, Python, Go и Rust, а также фреймворков Vercel AI SDK, OpenAI Agents SDK, Anthropic SDK, Claude Agent SDK, LangChain, LangGraph, CrewAI, Mastra, Pydantic AI и DSPy.

📌 Лицензирование: MIT License

🟡

Документация

🖥

GitHub

@ai_machinelearning_big_data

#AI #ML #Agents #Workshop #RaindropAI

Please open Telegram to view this post

VIEW IN TELEGRAM

❤8👍8

1.95K views14:57

Китайские кандзи теперь стали бенчмарком для VLLM

Вышел открытый Chronicles-OCR - новый визуальный бенчмарк для проверки, насколько хорошо мультимодальные модели понимают древние китайские иероглифы.

Идея очень крутая: модели дают не современные аккуратные символы из шрифта, а реальные исторические формы письма за 3000 лет эволюции.

В датасете:

• 7 исторических стилей письма - от гадательных костей до скорописи
• 2800 сбалансированных изображений
• разные физические носители, где символы выглядят совсем не как “чистый OCR”
• задачи на поиск символов, распознавание, разбор древнего текста и классификацию стиля письма

Почему это интересно?

Потому что обычный OCR проверяет, умеет ли модель читать текст. А Chronicles-OCR проверяет другое: понимает ли VLLM, как меняется визуальная форма одного и того же знака во времени, на разных материалах и в разных стилях письма.

Для мультимодальных моделей это больное место. Символ может быть тем же самым по смыслу, но визуально выглядеть как совершенно другой объект. И здесь сразу видно, где модель реально “видит”, а где просто угадывает по паттернам.

Paper: https://arxiv.org/abs/2605.11960
GitHub: https://github.com/VirtualLUOUCAS/Chronicles-OCR

👍10🔥8❤5😱3

4.72K views08:57

AI-индустрия научилась идеально генерировать не только текст, но и бессмысленные анонсы.

Каждую неделю нам продают "революцию": новый агент, новый benchmark, новый copilot, новый способ случайно слить данные в AI провайдера. Разобраться, где там реальная польза, а где очередной демо-ролик для инвесторов, становится отдельной работой.

В Похек AI как раз этим и занимаются: фильтруют AI-новости, разбирают обновления OpenAI/Anthropic/других вендоров, тестируют инструменты и пишут про AI security без религиозной веры в каждый новый релиз. Иначе ИИ-новости сейчас выглядят как: OpenAI что-то выкатил, Anthropic что-то улучшил, кто-то снова "убил программистов", а через неделю выясняется, что половина инфоповода была красивым пресс-релизом.

Из полезного для старта - пост Где легально ломать LLM: площадки и лабы, где можно практиковаться без сомнительных историй.

Если интересен AI не как хайп, а как поверхность атаки, инструмент защиты и новая боль для безопасников и разработчиков - канал стоит добавить в подписки)

👍6❤4🔥2🥴2

3.09K views09:03

0:07

Я, закидывающий всю кодовую базу в Claude, чтобы найти одну пропущенную точку с запятой.

😁36❤9👍4🤣4🔥2

3.95K views10:10

0:45

⚡Когда аналитика разнесена по отдельным системам, бизнес долго ждет данные и платит за лишние кластеры, ETL и серверы.

🐘Postgres Pro AXE — аналитическая СУБД от Postgres Professional на знакомом PostgreSQL. Ускоряет доставку аналитики и снижает TCO на хранение и обработку данных.

✔️До 20 раз быстрее Greenplum
На сложных запросах в тестах ClickBench, TPC-H и TPC-DS.

✔️До 10 раз меньше ресурсов
При сопоставимой нагрузке с MPP-аналогами.

✔️Аналитика ближе к рабочим данным
Postgres Pro AXE работает как отдельная аналитическая СУБД или расширяет Postgres Pro Enterprise аналитическими возможностями на существующих узлах.

✔️Быстрый старт для команды
Знакомый PostgreSQL снижает порог входа для администраторов и разработчиков.

✔️Свобода хранения и BI
Локальный сервер, сетевая шара или S3. Данные — в формате Parquet.

🔗Приходите 28 мая на бесплатный вебинар: покажем, как построить аналитику без зоопарка технологий.

❤5🔥2

3.18K views11:30

⚡️ SkyClaw-v1.0: новая модель под tool use и агентные задачи

Skywork представила SkyClaw-v1.0 - агентную модель, оптимизированную под OpenClaw, Hermes и Nanobot.

Фокус на сценариях, где модель должна работать с инструментами и вести задачу в несколько ходов: выбрать tool, собрать аргументы, обработать ответ, продолжить выполнение и не развалиться на длинной цепочке действий.

Вместе с основной версией вышла SkyClaw-v1.0-lite - более быстрая и дешёвая версия для сценариев, где важна стоимость запуска.

Модель обучали в собственном окружении OpenClaw: с качественными инструментами и синтетическими задачами, собранными из реальных пользовательских паттернов. То есть её специально подгоняли под агентную работу, а не просто добавили tool calling поверх обычной языковой модели.

По заявлению Skywork, на PinchBench, Claw-Eval и Skywork-Claw-Bench обе версии обходят:

- Minimax 2.7
- DeepSeek V4 Flash
- Qwen 3.6 35B A3B
- Qwen 3.6 27B

https://www.apifree.ai/model/skywork-ai/skyclaw-v1?tab=api

👍10🔥6❤5

3.01K views14:30

Андрей Карпаты перешёл в Anthropic

Один из самых известных людей в индустрии - сооснователь OpenAI, бывший директор по ИИ в Tesla, автор легендарных лекций по нейросетям - официально объявил о переходе в Anthropic.

В твите он написал, что ближайшие несколько лет на фронтире LLM будут особенно формирующими, и он рад вернуться к R&D в команде Anthropic. Образовательные проекты, включая Eureka Labs, обещает не бросать и вернуться к ним позже.

Карпаты последние пару лет фактически был «свободным агентом» - выпускал собственные туториалы, строил Eureka Labs, считался одной из самых независимых фигур в ИИ.

Его выбор в пользу Anthropic, а не OpenAI, xAI или Google, многое говорит о том, где сейчас концентрируется самая интересная исследовательская работа.
С учётом недавнего policy paper Anthropic про 2028 год и фронтирные модели - у компании явно идёт серьёзная фаза найма под большие задачи.

https://x.com/karpathy/status/2056753169888334312

@data_analysis_ml

1❤20👍11🔥6😁3🤔2🌭2🥴1

22.2K viewsedited 15:24

Please open Telegram to view this post

VIEW IN TELEGRAM

🤔2🌚2

2.73K views16:18

Промышленный ИИ окончательно перестает быть теорией, и на ЦИПР-2026 это показали максимально прикладно.
«Норникель» уже встроил ИИ в цепочку от измельчения руды до выпуска концентрата. Алгоритмы в реальном времени подбирают режимы и меняют параметры, а ключевой фактор, как говорят в Норникеле, скорость: решения принимаются за секунды. На масштабе это дает около 10 млрд рублей в год уже сейчас, с ориентиром 50 млрд к 2030.
Важно, что это не про замену человека, оператор остается в контуре и контролирует безопасность. По сути, это модель «усиленного человека», а не автономного ИИ.
Еще один сдвиг, который прозвучал на ЦИПР: импортозамещение — только первый этап. Поверх него строятся собственные системы с ИИ, от предиктивной аналитики до управления добычей.
И главное: промышленный ИИ уходит от универсальных моделей к доменным. В выигрыше не самый большой LLM, а тот, кто глубже понимает конкретный процесс. Именно такие узкие, встроенные решения сейчас и становятся драйвером industrial AI.

🔥5😁5❤1

2.77K views17:18

2:27

Бывший CEO Google Эрик Шмидт выступил на выпускной церемонии Университета Аризоны с речью про ИИ - и зал встретил это не восторгом, а свистом.

Его освистали после фразы:

«Вам не обязательно интересоваться ИИ. Какую бы карьеру вы ни выбрали, ИИ всё равно будет иметь к ней отношение».

Для студентов, которые выходят на рынок труда, где вакансий меньше, конкуренции больше, а компании всё чаще прикрывают сокращения словами про автоматизацию, такая фраза звучит не как вдохновение, а как предупреждение.

Шмидт, по сообщениям, ушёл со сцены со слезами на глазах. Получился редкий момент, когда технооптимизм столкнулся не с критиками из Twitter, а с аудиторией, которой в этом будущем предстоит жить первой.

😁24💔4😱2💯2

2.8K views18:20

Forwarded from Machinelearning

0:54

Google выкатили сразу два больших релиза: Gemini Omni и Gemini 3.5 Flash

Похоже, Google снова пытается перехватить повестку в ИИ.

Первый релиз - Gemini Omni. Это семейство мультимодальных моделей, которые работают почти со всем сразу: текстом, кодом, изображениями, видео и даже виртуальными мирами.

Модель может принимать разные типы контента и не просто «понимать» их, а редактировать, дополнять и превращать в новые форматы:

- добавить эффекты в видео со смартфона
- сделать картину из грубого наброска
- собрать образовательный подкаст по фото
- работать с кодом, текстом, визуалом и видео в одном контексте

Первая модель семейства - Gemini Omni Flash - должна стать доступна уже сегодня.

Второй релиз - Gemini 3.5 Flash.

Google называет её своей самой сильной моделью для агентов и кодинга. Главное отличие - не просто быстрые ответы, а способность планировать работу по большим кодовым базам, рассуждать на длинной дистанции и запускать subagents параллельно.

По словам Google DeepMind, Gemini 3.5 Flash обходит 3.1 Pro на agentic и coding-бенчмарках вроде Terminal-Bench 2.1, GDPval-AA и MCP Atlas, при этом стоит заметно дешевле фронтирных моделей.

Если коротко:

- Gemini Omni - модель для всего: текст, код, картинки, видео, миры
- Gemini 3.5 Flash - ставка на агентов, кодинг и работу с большими проектами

Ещё выкатили Antigravity 2.0 - инструмент для создания и оркстрации множества ИИ-агентов.

Интересно, насколько хорошо модель будет работать как исполнитель: в IDE, браузере, видео, агентных workflow и реальных продуктах.

Релиз https://x.com/GoogleDeepMind/status/2056786446636212467

Попробовать: https://gemini.google.com/app

👍8

1.86K views20:51

Claude Computer Use: Anthropic наконец объяснила, почему агенты промахиваются по кнопкам

Anthropic выложила практический гайд по computer/browser use для Claude. И там не про «магических агентов будущего», а про скучную инженерию, из-за которой агент либо работает, либо кликает мимо кнопки.

Главный инсайт: точность кликов часто ломается не из-за модели, а из-за скриншотов.

Если отправлять в API нативный 4K-скрин, Claude всё равно может увидеть его в уменьшенном виде. Модель возвращает координаты по одной картинке, а ваш harness кликает по другой системе координат. Итог - стабильные промахи.

Что рекомендует Anthropic:

- заранее downscale скриншотов
- для Claude 4.6 держаться около 1280×720
- для Opus 4.7 можно начинать с 1080p
- не отправлять native 4K без подготовки
- всегда масштабировать координаты обратно в реальный экран
- сначала давать текстовую инструкцию, потом изображение
- для мелких UI-элементов включать zoom или использовать клавиатуру
- логировать transcript и накладывать predicted clicks поверх скриншота

Отдельно интересно про модели. Sonnet 4.6 у них точнее для механических кликов, Opus 4.7 уже почти догнал по click accuracy, но даёт больше reasoning и больший pixel budget.

Самый полезный вывод: browser agent - это не «дал промпт и забыл».

Это система из модели, скриншотов, координат, DPI, zoom, DOM, клавиатуры, логов и fallback-методов. Если хотя бы один слой настроен криво, агент будет выглядеть глупым, хотя проблема вообще не в интеллекте модели.

Агенты становятся реальными не тогда, когда модель «умнее».

А тогда, когда вокруг неё собран нормальный runtime.

https://claude.com/blog/best-practices-for-computer-and-browser-use-with-claude

❤9👍5🤣4🔥3😁1

3.03K views20:52