Анализ данных (Data analysis)
50.2K subscribers
3.19K photos
404 videos
1 file
2.66K links
Data science, наука о данных.

@haarrp - админ

РКН: clck.ru/3FmyAp
Download Telegram
🚀 ForgeTrain: фреймворк для pre-training, который написали ИИ-агенты

OpenBMB представили ForgeTrain - production-level фреймворк для pre-training, код которого был сгенерирован ИИ без ручного написания человеком.

Заявка интересная не из-за красивой фразы «AI пишет AI», а из-за масштаба. Это не демка на toy-проекте, а инфраструктурный код для обучения моделей, который проверяли на реальном железе.

Что заявляют авторы:

- на NVIDIA H100 ForgeTrain обгоняет Megatron примерно на 10%
- достигнут показатель 44.13% MFU
- пайплайн pre-training проверен не только на H100, но и на Huawei Ascend 910
- на ForgeTrain обучили MiniCPM5-1B, который занял первое место среди моделей до 2B параметров в Artificial Analysis Index
- код фреймворка и Agent Harness обещают открыть для воспроизведения

💻 GitHub: https://github.com/OpenBMB/ForgeTrain
8👍5🔥3
🔥 Anthropic показала, почему AI-агентов нельзя защищать только кнопкой «разрешить»

Anthropic разобрала, как изолирует Claude в claude.ai, Claude Code и Claude Cowork. Самое важное: пользовательские approvals быстро перестают быть защитой.

В Claude Code люди подтверждали около 93% запросов на разрешение. Когда агент постоянно спрашивает доступ, человек начинает кликать почти автоматически.

Поэтому Anthropic всё больше переносит безопасность из промптов и предупреждений в среду выполнения: sandbox, VM, ограничения файловой системы, запрет лишней сети и scoped credentials.

В статье есть хорошие реальные кейсы. Claude Code раньше мог читать локальный конфиг проекта ещё до trust prompt. В другом тесте red team заставил сотрудника запустить агент с промптом, который просил прочитать ~/.aws/credentials и отправить данные наружу. Модель выполнила это в 24 из 25 попыток.

Отдельно интересен случай с egress allowlist. Домен api.anthropic.com был разрешён, потому что без него продукт не работает. Но через Anthropic Files API данные всё равно можно было загрузить в аккаунт атакующего.

Вывод для разработчиков агентов простой: allowlist доменов, prompts и classifiers не решают проблему сами по себе. Нужны жёсткие границы на уровне окружения. Агент должен не просто «понимать, что нельзя», а физически не иметь возможности сделать лишнее.

https://www.anthropic.com/engineering/how-we-contain-claude
16🔥7👍6
⚡️ Деннис Ритчи и Стив Джобс умерли в одном месяце: одного оплакивал весь мир, второго почти не заметили

Об этом факте регулярно вспоминают в сообществе разработчиков, но и сейчас он продолжает бить в больную точку. Стив Джобс и Деннис Ритчи ушли в одном и том же месяце одного и того же года, в октябре 2011. Их уход превратился в символ того, насколько по-разному мир относится к людям, которые формируют технологии.

Джобса оплакивали планетой, выпускали книги, сняли фильмы, именем назвали улицы. Он подарил iPhone, iPad, iPod и Macintosh, собрал вокруг Apple одну из самых дорогих компаний в истории. Денниса Ритчи провожали разве что в узком кругу и парой статей в блогах. Это был человек, который подарил нам язык C и вместе с Кеном Томпсоном Unix.

Дальше просто пройдёмся по цепочке. Без C нет Unix. Без Unix нет Linux, нет BSD, нет macOS и iOS. Без C не было бы Windows в его нынешнем виде, не было бы C++, Objective-C, Java, JavaScript в их привычном виде. Нет Chrome и Firefox, нет PostgreSQL и SQLite, нет Nginx, нет Photoshop, нет PlayStation и Xbox. Даже Python и PHP написаны на C.

При таком влиянии Ритчи оставался человеком, которого было сложно представить на сцене с черной водолазкой и в режиссёрском свете. Он работал в Bell Labs, носил бороду, избегал интервью и писал программы. Человек, без которого современный цифровой мир просто не выглядел бы так, как сейчас, провёл жизнь в тени своих собственных результатов.

Похоже, именно в этом и суть контраста. Джобс продавал эмоции и мечты о будущем, это видно и понятно любому человеку. Ритчи писал инфраструктуру, которой пользуются все, но вспоминают о которой, только когда она ломается. Инженерх понимают это отлично: восхищение и слава идут тем, кто выходит на сцену, а не тем, кто держит фундамент.

Поэтому этот сюжет приятно иногда вытаскивать наружу. Не чтобы принижать Джобса, он действительно изменил потребительский рынок. Но чтобы напомнить, что рядом жил тихий инженер в свитере, без которого все эти коробочки от Apple были бы просто красивыми пресс-папье.
Please open Telegram to view this post
VIEW IN TELEGRAM
70👍19🔥9🙏4😢3💯3
Вайбкодер 2026
😁479👍4
580 токенов в секунду на Qwen3.5 - новый рекорд для агентских задач на GPU NVIDIA.

PyTorch Foundation опубликовали разбор оптимизации Qwen3.5 в движке инференса TokenSpeed.

Цифра скорости света - 580 tps на агентских ворклоадах. Под капотом: дизайн, реализация и тюнинг моделей в TokenSpeed, плюс FlashAttention-4 от Tri Dao.
Над релизом работали инференс-команда Alibaba Qwen, TokenSpeed от Lightseek Foundation, NVIDIA и Mooncake.

Кому интересно, как именно выжали такую пропускную способность - блог по ссылке.
15👍10🔥7🤯5
OpenAI заплатит 250 миллионов на спасение тех, чьи работы заберёт ИИ

Контролирующий некоммерческий орган OpenAI, у которого 26% доли в коммерческой части компании (при оценке OpenAI в 1 триллион это около 260 миллиардов), объявил о выделении 250 миллионов долларов на изучение и смягчение последствий от внедрения ИИ-систем, которые умеют заменять людей в оплачиваемых задачах.

Документ называется «Economic Futures in the Age of AI», авторы Divya Siddarth и Wojciech Zaremba. По сути, OpenAI признаёт, что её же продукты бьют по рынку труда, и пытается заранее подложить соломку.

Деньги пойдут по трём направлениям.

Первое: независимые исследования и метрики реального экономического эффекта от ИИ. Никаких внутренних отчётов с красивыми графиками, обещают именно внешнюю экспертизу.

Второе: поддержка работников и сообществ, которые уже сейчас попадают под удар автоматизации. Сюда входит переобучение, помощь при смене профессии и страховые механизмы.

Третье: поиск долгосрочных моделей того, как делиться экономической выгодой от ИИ с обществом. То самое распределение богатства, про которое Альтман любит рассуждать в подкастах.

250 миллионов для OpenAI Foundation это копейки на фоне её собственной капитализации. Фактически компания страхует свою репутацию и одновременно собирает данные о том, кого именно её модели вытесняют с рынка.

Грантовые программы и партнёрства по этим трём направлениям, скорее всего, будут открыты внешним исследователям и НКО.
🤣375👍5🔥4🌚2
Устал инициализировать претрейны весами Qwen? Приходи к нам — мы честно учим с нуля! 😉

Ищем Senior/Senior+ AI Engineer и продактов в RnD-команду: как отдельных специалистов, так и целые команды, — которые готовы разрабатывать прорывные AI-решения.

Познакомиться ближе с нашими направлениями и оставить отклик можно на сайте.

А если хотите следить за тем, как команда RnD ML Сбера исследует и разрабатывает AI-технологии, — подписывайтесь на Telegram-канал команды. Там делятся исследованиями, экспериментами и инсайтами из мира AI, а также свежими вакансиями 🚀
🔥31👍1🤯1
10 GitHub-репозиториев, которые заставят вас навсегда забыть о платном ПО

Полностью бесплатно.

1.LocalSend / http://github.com/localsend/localsend
Передача файлов между платформами. Передача файлов между Windows, Mac, Linux, Android, iOS — без регистрации и облака

2.yt-dlp / http://github.com/yt-dlp/yt-dlp
Скачивание видео и аудио с любого сайта. YouTube, Bilibili, Twitter — всё покрыто, мощнее любого платного загрузчика

3.Stirling-PDF / http://github.com/Stirling-Tools/Stirling-PDF
Свой универсальный инструмент для PDF. Объединение, разделение, сжатие, конвертация в Word, добавление водяных знаков, OCR — замена всему семейству Adobe

4.FreeTube / http://github.com/FreeTubeApp/FreeTube
Десктопный плеер для YouTube. Без рекламы, без слежки, без аккаунта Google — что вы смотрите, знает только вы

5.Syncthing / http://github.com/syncthing/syncthing
Альтернатива Baidu Netdisk и iCloud. Прямая синхронизация файлов между устройствами, сквозное шифрование, данные не проходят через серверы третьих лиц

6.Vaultwarden / http://github.com/dani-garcia/vaultwarden
Свой менеджер паролей. Бесплатная замена 1Password и LastPass навсегда, данные хранятся только на вашем устройстве

7.Immich / http://github.com/immich-app/immich
Свой Google Фото. Автоматическое резервное копирование фото с телефона, распознавание лиц, поиск по ИИ — больше не платите аренду за хранилище ежемесячно

8.AdGuard Home / http://github.com/AdguardTeam/AdGuardHome
Блокировка рекламы по всей сети. Блокировка на уровне роутера — все устройства в доме, включая смарт-телевизоры, без рекламы

9.Jellyfin / http://github.com/jellyfin/jellyfin
Свой Netflix. Свои фильмы, сериалы и музыка — транслируйте сколько угодно, без ежемесячных платежей платформам

10.Uptime Kuma / http://github.com/louislam/uptime-kuma
Своя панель мониторинга. Следит за вашими сайтами и сервисами, мгновенно уведомляет о сбоях — замена платному мониторингу за $50 в месяц.
👍168🔥4😍2
✔️ Apple пересобрала Siri с нуля и всё равно пришла к чужим моделям

Bloomberg пишет, что в iOS 27 Siri ждёт крупнейший редизайн за всю историю.

Два года задержек, новая архитектура, новый интерфейс, много обещаний.

Новая Siri, по данным Bloomberg, будет работать на Google Gemini.

А в интерфейсе появится выбор модели - можно будет переключиться на ChatGPT или Claude.

То есть Apple долго пыталась сделать Siri заново, а в итоге пришла к максимально прагматичному решению: пусть пользователь сам выбирает, чей интеллект подключить.

Что ещё готовят:

- AI-поиск по вебу в стиле Perplexity
- создание Shortcuts обычным языком
- AI-редактирование фотографий

Даже Apple больше не делает вид, что голосовой ассистент должен быть полностью своим. Побеждает не закрытая Siri, а интерфейс, который умеет подключать лучшие модели.

https://www.bloomberg.com/news/features/2026-05-28/apple-ios-27-photos-screenshots-revamped-siri-pro-camera-app-new-ai-features
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍118🔥6🤣1
Claude Sonnet 4.8, похоже, уже на подходе.

- Высокая вероятность, что Sonnet 4.8 выйдет сегодня - после нескольких месяцев ожидания с момента, когда модель впервые засветилась в утечке исходников Claude Code.
- Sonnet 4.6 уже в основном отошёл на второй план: большую часть реальных задач по коду и reasoning сейчас забрали Opus 4.7 и GPT-5.5.
- Sonnet 4.8, судя по всему, позиционируют как новую рабочую лошадку - особенно для повседневного кодинга и агентных сценариев.
- Утечки уже указывали на более сильный coding, заметно лучшее следование инструкциям, улучшенные vision-возможности и более чистые completion с первого прохода.
- Текущие сигналы в основном указывают только на Sonnet 4.8. Шансов на запуск Opus 4.8 сегодня почти нет.
- Возможно, сегодня ещё будет что-то со стороны Codex.

https://x.com/Machinelearrn/status/2060035106371252254
5👍4🔥3