Анализ данных (Data analysis)
50.2K subscribers
3.2K photos
404 videos
1 file
2.65K links
Data science, наука о данных.

@haarrp - админ

РКН: clck.ru/3FmyAp
Download Telegram
Один человек в киберполе не воин...

А когда на кону безопасность компании — тем более.

Открытый диалог StopPhish 2026 собрал экспертов по кибербезопасности. Площадкой встречи стал МосХаб.Сколково — традиционная точка сборки ИТ-сообщества. Вместе с теми, кто отвечает за устойчивость сотрудников к киберугрозам, говорили о главном: как превратить человеческий фактор в надёжный щит.

Участники разобрали изменения в Приказе №117 — документе, который регламентирует требования к обучению персонала в области кибербезопасности, сравнили подходы в банках и госсекторе, поделились кейсами компаний, уже выстроивших осознанную культуру безопасности.

Чтобы её развивать, нужен живой обмен опытом, честные разборы ошибок и сообщество, где CISO, HR-директора и руководители цифровой трансформации говорят на одном языке. Именно такую среду для эффективной коммуникации мы создаём в нашем деловом пространстве.

Подписывайтесь: Telegram | МАКС | ВКонтакте
👍6🔥4
🧩 Microsoft показала SkillOpt - способ обучать навыки агентов без дообучения модели

Обычно agent skills пишут руками, генерируют один раз через LLM или правят хаотично после неудачных запусков. Проблема в том, что такие правки легко делают навык хуже: текст звучит убедительно, но агент начинает чаще ошибаться.

SkillOpt предлагает относиться к skill-файлу как к обучаемому артефакту. Модель не трогают. Меняется только небольшой документ с инструкциями, привычками и процедурой выполнения задачи.

Как это работает: агент решает задачи, система смотрит на успешные и провальные траектории, затем отдельная optimizer-модель предлагает точечные правки в skill-документ. Правка принимается только если новый вариант даёт прирост на отдельной validation-выборке.

В итоге получается не новый чекпоинт и не набор хрупких промптов, а компактный readable-файл, который можно проверить, перенести в другой agent loop и использовать без дополнительных вызовов optimizer-модели.

По статье, SkillOpt тестировали на 6 бенчмарках, 7 моделях и 3 режимах работы: direct chat, Codex и Claude Code. Он оказался лучшим или разделил первое место во всех 52 проверенных случаях. На GPT-5.5 средняя точность выросла на 23.5 пункта в direct chat, на 24.8 в Codex и на 19.1 в Claude Code.

arxiv.org/abs/2605.23904
9👍5🔥4
Как он создал Linux без OPUS 4.8 ??

Есть идеи?)
😁5729👍7🔥6🤯4
✔️ Бывшие исследователи DeepMind подняли $50 млн на лабораторию, где ИИ будет улучшать не только модель, а всю исследовательскую организацию

Команда Inherent хочет строить AI-лабораторию вокруг идеи recursive self-improvement - но не в узком смысле «модель сама себя переписывает».

Их ставка шире: ИИ должен помогать людям во всём исследовательском цикле:

- находить перспективные вопросы
- проектировать эксперименты
- проверять гипотезы
- анализировать результаты
- улучшать сам процесс исследований

Раунд на $50 млн возглавили Index и Radical. В инвесторах также венчурное подразделение NVIDIA, Dwarkesh Patel, Thomas Wolf, Max Jaderberg и другие заметные имена.

У фаундеров сильный бэкграунд. Louis Kirsch связан с линией Шмидхубера по самоулучшающимся системам. Edward Hughes давно пишет про open-endedness как важный путь к сверхчеловеческому ИИ. Tantum Collins работал над AI policy в Белом доме при Байдене.

Inherent хочет, чтобы ИИ жил внутри эксперимента рядом с человеком: не просто был инструментом для ответа, а становился полноценным исследовательским партнёром.

Компанию сразу оформили как Public Benefit Corporation - то есть миссия заложена в структуру бизнеса с первого дня.

https://x.com/Machinelearrn/status/2060704335772721350
Please open Telegram to view this post
VIEW IN TELEGRAM
11🔥9👍5🥴4
В Сан-Франциско дом за $2.995 млн теперь можно купить акциями OpenAI или Anthropic

Это реальный листинг в Duboce Triangle: продавец готов принять не только деньги, но и частные акции OpenAI или Anthropic.

У сотрудников и ранних инвесторов может быть большое состояние на бумаге, но оно застряло в неликвидных акциях. До IPO, tender sale или вторичного рынка эти деньги нельзя просто вывести и принести на сделку по недвижимости.

В итоге человек может формально быть миллионером, но при покупке дома всё равно упираться в классическую проблему: денег на счету нет, а капитал лежит в private equity.

Интерес к объекту появился почти сразу после публикации такого условия. По её словам, на просмотрах часто встречаются сотрудники и инвесторы из AI-компаний, которые хотят покупать жильё, но не могут быстро превратить опционы и акции в ликвидность.

Продавец, судя по описанию, сам верит в OpenAI и Anthropic, поэтому готов рассматривать их акции как часть расчёта. Для обычного рынка это рискованная конструкция, для Сан-Франциско 2026 года - почти логичное продолжение AI-экономики.

zillow.com/homedetails/160-Noe-St-San-Francisco-CA-94114/461638923_zpid/
12🔥6👍4🤣4🥴2
Работа The AI Layoff Trap цепляет самой механикой ловушки вокруг ИИ-автоматизации.

Представьте обычную компанию. Она заменяет часть сотрудников ИИ, снижает расходы и получает преимущество. Конкуренты видят это и повторяют. Потом подключаются остальные. Бизнес действует рационально: режет издержки, защищает маржу, ускоряет процессы.

Уволенные сотрудники были покупателями. Когда таких людей становится много, они тратят меньше. Спрос падает, продажи проседают, компании снова ищут, где урезать расходы. Самый быстрый путь - ещё больше автоматизации.

Так появляется петля: компании заменяют людей ИИ, доходы падают, рынок покупает меньше, бизнес снова режет расходы. Для одной фирмы это выглядит разумно. Для системы в целом такой цикл может стать ловушкой.

Обычно считают стоимость задачи, скорость, качество ответа, экономию на людях. Гораздо реже считают эффект второго порядка: что произойдёт, если такую же оптимизацию одновременно проведут тысячи компаний.

Авторы работы показывают, что базовый доход, налоги на капитал, переобучение, доля работников в бизнесе и договорённости между компаниями в их модели проблему полностью не закрывают. Единственный механизм, который сработал, - налог на автоматизацию задач. Компания заранее учитывает ущерб спросу, который создаёт массовой заменой людей ИИ.

С моделью можно спорить. Но постановка сильная: ИИ может ударить по экономике через обычную конкуренцию. Каждый игрок действует рационально, пока сумма этих решений постепенно ослабляет рынок, на котором все они зарабатывают.

http://arxiv.org/pdf/2603.20617
👍176🤣6💔3🤔2🔥1
MiniMax M3 выглядит как один из самых сильных открытых релизов этого года.

Модель сразу бьёт в три направления, которые сейчас важны для практического ИИ: кодинг, агентные сценарии и мультимодальность. То есть не просто чат-модель с длинным контекстом, а система, которую пытаются сделать пригодной для реальной работы с кодом, терминалом, браузером, изображениями, видео и computer use.

Что заявляют по цифрам:

- 59.0% на SWE-Bench Pro
- 66.0% на Terminal Bench 2.1
- 34.8% на SWE-fficiency
- 28.8% на KernelBench Hard
- 74.2% на MCP Atlas
- контекст до 1M токенов через MiniMax Sparse Attention
- до 15x ускорение декодирования на длинном контексте
- оптимизация CUDA FP8 GEMM kernel с нуля дала 9.4x ускорение на Hopper GPU
- нативная работа с изображениями, видео и computer use

API: http://platform.minimax.io
Тарифы по токенам: https://platform.minimax.io/subscribe/token-plan
MiniMax Code: http://code.minimax.io
13🔥9👍5🌚3🥱2
Lakehouse — новый подход к данным, который убивает DWH и Data Lake

- Высокая вероятность, что массовый переход на Lakehouse начнётся в ближайшие 1-2 года — после того как первые игроки (Т-банк, Магнит, Ламода) уже доказали экономию и масштабируемость. Об этом в интервью «Коммерсанту» рассказал Леонид Савченков, руководитель продуктовой архитектуры платформы данных Yandex Cloud.
- Классические DWH на объёмах от 100 ТБ начинают тормозить: единственный способ — докупать серверы целиком, потому что хранение и вычисления сцеплены.
- Data Lake решал проблему объёма, но не давал нормального управления данными — отчёты строить было сложно.
- Lakehouse разделяет хранение и вычисления: можно нарастить мощности под «Чёрную пятницу» и не платить за лишнее место весь год.
- В отличие от Data Lake, здесь появляются строгие табличные форматы и управление данными как в СУБД.
- Узкое место — нужны спецы по Trino и Spark. Чудес не бывает.
- Для ИИ это идеально: вычисления можно выделить в отдельные мощности, не роняя основные отчёты. X5 уже построил бота по трендам молока в регионах.
- Через пять лет, вероятно, появится новая концепция. Если данных мало — старый DWH всё ещё дешевле и проще.

https://www.kommersant.ru/doc/8691430
9👍6🔥3
🖥 Nvidia представила RTX Spark 0 ARM-чип, который метит туда, где Apple M-серия доминирует.

По памяти: RTX Spark поддерживает до 128 ГБ LPDDR5X (минимум 16 ГБ) с пропускной способностью 300 ГБ/с через NVLink C2C. Для локального запуска LLM и диффузионных моделей это принципиально важная цифра - большой объём единой памяти без разделения между CPU и GPU.

Полный стек NVIDIA включает поддержку CUDA, TensorRT, NVFP4, DLSS, Ray Tracing, Reflex и G-SYNC. Всё, что нужно разработчику под CUDA, будет работать нативно без каких-либо дополнительных прослоек.

Первые устройства на RTX Spark выйдут осенью 2026 года. Свои флагманы на новом чипе уже готовят Microsoft (Surface Laptop Ultra), Asus (ProArt P14, P16), Dell (XPS 16), MSI (Prestige N16 Flip AI), HP (OmniBook X14 Ultra 16), Lenovo (Yoga Pro 9i) и другие. Помимо ноутбуков, в планах у Nvidia - компактные десктопы: Acer, Asus, Dell, Gigabyte, HP, MSI и Lenovo анонсировали RTX Spark Desktop-устройства.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
17👍6🔥5
Keye 2.0 от Kuaishou - интересный шаг для мультимодальных моделей: DeepSeek Sparse Attention впервые нормально утащили в задачу длинного видео.

Главная фишка - 256K контекста. Модель может разбирать часовые видео без типичного развала внимания, когда в начале ролика одно, в середине другое, а к концу модель уже теряет причинно-следственные связи.

Что важно:

- 30B MoE-модель с 3B активных параметров
- поддержка длинных видео и сложной временной логики
- prefill cost ниже примерно на 50%
- результат 74.10 на LongVideoBench
- на VideoMME V2 качество растёт при увеличении входа с 64 до 512 кадров: 35.34% → 42.44%
- есть фокус на timestamps, причинные цепочки, туториалы, игровые видео и длинные влоги

изменился контекст и почему это важно.

Веса уже открыты:

https://modelscope.ai/models/Kwai-Keye/Keye-VL-2.0-30B-A3B
9🔥6👍4
PewDiePie выпустил бесплатный open-source ИИ-агент, который работает локально и не сливает ваши данные корпорациям

За первый день проект собрал почти 20 000 звёзд.

Человек, который больше десяти лет был лицом YouTube-летсплеев и развлекательного контента, теперь собирает железо под LLM, дообучает модели и выкатывает open-source инструменты для локальных агентов.

Сначала он показал домашнюю машину примерно за $20 000, собранную под запуск ИИ-моделей без облачных сервисов. Аргумент у него простой: не отправлять личные данные в чужие API, не зависеть от подписок и держать весь стек у себя.

Потом он начал экспериментировать с дообучением моделей и заявлял, что его вариант на отдельном бенчмарке обгоняет даже топовые закрытые решения.

Теперь появился Odysseus - open-source оболочка для self-hosted AI-среды.

Это уже не просто «запусти модель через терминал». Идея ближе к локальному ChatGPT для своих задач:

- удобный интерфейс
- память
- работа с инструментами
- хранение данных у себя
- поддержка агентов
- подключение моделей через Ollama, llama.cpp и vLLM
- гибкая настройка доступов

Видео: https://youtu.be/rAzT5lcezPs

GitHub: github.com/pewdiepie-archdaemon/odysseus
👍37🔥1714🥱7
Alphabet больше не ведёт себя как классическая софтверная машина с бесконечной маржей

Компания собирается привлечь до $80 млрд через выпуск акций и гибридных инструментов, чтобы залить эти деньги в ИИ-инфраструктуру. Berkshire Hathaway отдельно заходит на $10 млрд, и это делает историю намного интереснее обычного «техгиганту понадобился кеш».

Спрос на ИИ есть. Продукты есть. Модели есть. Проблема в том, где взять достаточно compute, энергии, дата-центров, сетей и чипов, чтобы этот спрос обслужить.

Alphabet не просто завтра выкидывает на рынок $80 млрд обычных акций. Структура сложнее:

- $30 млрд через underwritten offerings
- часть через mandatory convertible preferred
- $10 млрд частным размещением для Berkshire Hathaway
- $40 млрд через ATM-программу
- около $30 млрд из ATM связано с налоговой механикой по employee equity

ИИ-инфраструктура стала настолько дорогой, что даже Alphabet выгоднее комбинировать разные источники финансирования.

Если Berkshire заходит в такой раунд, рынок получает сигнал: AI capex можно рассматривать не только как безумные траты на GPU, а как строительство будущей платной магистрали.


s206.q4cdn.com/479360582/files/doc_news/2026/Jun/01/attachments/2026-June-Alphabet-Equity-Capital-Raise-Press-Release-PDF.pdf
10👍7🔥2
⚡️ Microsoft выпустил MAI-Transcribe-1.5 - модель транскрибации речи, которая обрабатывает аудио в 276 раз быстрее реального времени.

Для сравнения: второй по скорости точный конкурент из топ-10 работает вдвое медленнее.

При этом по качеству - 2.4% WER по бенчмарку Artificial Analysis, третье место в общем зачёте. Впереди только Alibaba Fun-Realtime-ASR-preview (1.7%) и ElevenLabs Scribe v2 (2.2%).

keyword biasing для редких слов - имён собственных, медицинских терминов и поддержка 43 языков включая арабский, японский, китайский.

Скорость такого уровня при точности из топ-3.

https://microsoft.ai/news/introducingmai-code-1-flash/
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
14👍10🔥5