Анализ данных (Data analysis)
50.3K subscribers
3.29K photos
411 videos
1 file
2.72K links
Data science, наука о данных.

@haarrp - админ

РКН: clck.ru/3FmyAp
Download Telegram
Forwarded from 📚Python Books
Один из лучших вводных материалов по прикладной линейной алгебре, который мне попадался.

Этот курс объясняет векторы, матрицы и метод наименьших квадратов с самых основ, а затем связывает их с реальными задачами:

• подгонка данных

• машинное обучение

• оптимизация

• обработка изображений

• системы управления

Это материал, который можно рекомендовать студентам, инженерам и всем, кто хочет понять математический фундамент современной data science.

PDF: http://web.stanford.edu/~boyd/vmls/vmls.pdf
👍133💔3
OpenAI теперь идёт не только в модели, но и в железо.

Компания вместе с Broadcom представила Jalapeño — первый собственный AI-чип для инференса LLM. Его задача простая: быстрее, дешевле и стабильнее запускать ChatGPT, Codex, API и будущих AI-агентов.

Главное: чип сделали от идеи до tape-out всего за 9 месяцев, а в разработке помогали сами модели OpenAI.

Это уже не просто гонка моделей. Это гонка полной AI-инфраструктуры: чипы, сеть, дата-центры, софт и продукты в одной связке.

https://openai.com/index/openai-broadcom-jalapeno-inference-chip/
9🔥7👍6
Самый быстрый запрос — тот, который не пришлось выполнять ✌️

Именно поэтому Redis давно стал одним из основных инструментов для ускорения приложений и снижения нагрузки на базы данных.

Но вместе с производительностью появляются новые вопросы: как работать с устаревшими данными, правильно инвалидировать кэш и не превратить ускорение системы в источник новых проблем?


Об этом поговорят на вебинаре Cloud.ru«Эволюция приложения в облаке: как настроить кэш с Redis и ничего не сломать».

📌 30 июня, 11:00 МСК

Эксперты разберут:
▶️
реальные сценарии использования Redis

▶️
стратегии кэширования

▶️
типичные ошибки, которые встречаются даже в зрелых системах


👉Зарегистрироваться👈

А если вы пропустили предыдущие «серии» — они доступны по ссылкам:

1️⃣
Эволюция приложения в облаке: как навести порядок в артефактах и образах


2️⃣
Эволюция приложения в облаке: как запустить микросервисы в Managed Kubernetes


3️⃣
Эволюция приложения в облаке: как обеспечить стабильность баз данных при росте проекта и нагрузок
Please open Telegram to view this post
VIEW IN TELEGRAM
6🤣3
NVIDIA CUDA-Q всё сильнее становится мостом между квантовыми вычислениями и реальными задачами.

Рабочий квантовый компьютер появится не сам по себе, а через гибридный подход, где QPU работают вместе с GPU-ускоренной симуляцией.

Уже сейчас экосистема двигается в эту сторону:

• Aegiq и Quantum Motion развивают quantum chemistry workflows

• Classiq использует CUDA-Q для поиска квантовых применений в финансах

• FirstQFM показал quantum foundation models на суперкомпьютере Leonardo

• Eclipse Qrisp, Fraunhofer FOKUS и Qilimanjaro строят свои решения вокруг CUDA-Q

• qBraid стал CUDA-Q target и расширяет доступ к разным QPU-провайдерам

• QCentroid делает QuantumOps workflows на CUDA-Q

• Welinq соединяет distributed quantum compiler с GPU-ускоренной проверкой схем

Гибридные workloads, GPU-симуляция, QPU-доступ и инструменты разработки - именно так квантовая индустрия будет двигаться к практической пользе.

https://developer.nvidia.com/cuda-q
10👍5😐2😍1
Лето — время начать: освойте Data Science на выгодных условиях

Хотите не просто теоретически разбираться в устройстве нейросетей, а уметь создавать их самостоятельно? Центр непрерывного образования ФКН НИУ ВШЭ предлагает присоединиться к структурированному и выстроенному практикующими экспертами обучению науке о данных.

Станьте специалистом по Data Science высокого уровня:
🟣первая программа профессиональной переподготовки, получившая аккредитацию Альянса в сфере искусственного интеллекта;
🟣вы пройдете весь путь: от высшей математики и программирования до нейросетей и работы с большими данными.

Программа включает курсы по ключевым дисциплинам:
🟣Математика для анализа данных;
🟣Алгоритмы и структуры данных;
🟣Программирование и автоматизация;
🟣Прикладная статистика для машинного обучения;
🟣Машинное и глубинное обучение.

Специальное предложение для тех, кто запишется на ближайший запуск:
⭐️ Скидка 10% на обучение
⭐️ Курс по BI в подарок

📁Старт: 30 июня.

Подробнее о программе 📍
Please open Telegram to view this post
VIEW IN TELEGRAM
4😁2🔥1
Forwarded from Machinelearning
📌 WSJ: коммерческие сделки OpenAI связаны с ростом личных инвестиций Сэма Альтмана

The Wall Street Journal со ссылкой на судебные документы, ставшие публичными в ходе процесса "Маск против OpenAI", опубликовала расследование о том, что контракты OpenAI повышали оценку стартапов, в которые лично вкладывается Сэм Альтман.

Для контекста: Альтман не владеет долей в самой OpenAI, поэтому его доходы зависят от внешних инвестиций.


🟡Механизм

OpenAI заключает контракт или соглашение о сотрудничестве, что поднимает оценку стартапа. Затем крупные акционеры OpenAI (например, Thrive Capital) или партнёры (SoftBank) выкупают доли стартапа, от чего личное состояние Альтмана растёт, так как он является их инвестором.

🟡Helion

В 2025 году Сэм предлагал OpenAI вложить около $500 млн в термоядерный стартап Helion. Часть сотрудников восприняла идею с настороженностью, и от прямых инвестиций компания отказалась.

В марте 2026 года стороны подписали пересмотренное соглашение о сотрудничестве и тогда же Альтман вышел из совета директоров Helion, объяснив это конфликтом интересов.

В июне 2026 года Helion оценили в $15,5 млрд, а личная доля Альтмана выросла как минимум до $4,1 млрд.

🟡Cerebras

После того как производитель чипов получил от OpenAI обязательство о закупках и провёл IPO, стоимость доли Альтмана выросла более чем в 6 раз по сравнению с декабрём 2025 года.

🟡Retro Biosciences

После соглашения о научном сотрудничестве с OpenAI доля Альтмана в этой компании по продлению жизни к декабрю 2025 года достигла $258 млн.

Всего, по данным WSJ, не менее 10 компаний из инвестиционного портфеля Альтмана имеют сделки с OpenAI.


🟡На это обратили внимание власти

Комитет Палаты представителей США по надзору начал официальное расследование, а генеральные прокуроры нескольких штатов призвали Комиссию по ценным бумагам и биржам проверить деятельность главы OpenAI в преддверии IPO.

Сам Альтман и представители компаний называют сотрудничество обычной практикой.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
7😍2👍1
Anthropic утверждает: Alibaba продолжает в больших масштабах дистиллировать Claude для обучения Qwen. Источник - Bloomberg.

Anthropic обвиняет операторов, связанных с Alibaba, в масштабной кампании по незаконному доступу к Claude через почти 25 000 фейковых аккаунтов.

По данным Bloomberg, Anthropic заявляет, что в рамках этой кампании с апреля по июнь было сгенерировано 28,8 млн обменов с Claude. Целью были способности вроде software engineering и agentic reasoning.

Компания считает это частью более широкой схемы «adversarial distillation», когда китайские лаборатории якобы собирают ответы американских frontier-моделей, чтобы обучать конкурирующие системы за гораздо меньшие деньги.

Посмотрим, насколько хорошим будет Qwen 3.8. Возможно, он окажется FABLEous хорош.

https://www.bloomberg.com/news/articles/2026-06-24/anthropic-accuses-alibaba-of-illicitly-accessing-its-ai-models
😁348🔥2👍1
Почему разрыв между академическим ML и реальными задачами до сих пор существует — и как его сокращают Авито, МФТИ и ВШЭ

Авито открыл набор на три магистратуры с МФТИ и ВШЭ — программы, построенные на реальных задачах компании.

Суть простая: бизнес зашёл в университет не деньгами, а экспертизой. В разработке участвовало 300+ сотрудников, преподают действующие специалисты.

Дальше всё так:

• Студент с первого дня работает с кейсами живых продуктов, а не с учебными датасетами.

• Выпускник выходит с опытом, который обычно нарабатывают первые полгода на позиции.

Три направления: «Прикладное машинное обучение и анализ данных» с МФТИ, «Машинное обучение в цифровом продукте» с ФКН ВШЭ и «Управление продуктом в IT-бизнесе» с ВШБ ВШЭ — для продактов, с прицелом на уровень middle.

Поступить можно из любого региона России.

Подробнее по ссылкам:
МФТИ
ВШЭ (ML)
ВШЭ (продакт)
2
Qwen показали Qwen-AgentWorld - модель, которая учится симулировать среду, в которой агент действует.

Обычно LLM тренируют лучше пользоваться инструментами: искать, писать код, кликать по вебу, работать с терминалом.

А здесь идея другая: научить модель моделировать сами окружения.

Qwen-AgentWorld симулирует 7 типов агентных сред:

• MCP
• Search
• Terminal
• SWE
• Web
• OS
• Android

То есть модель пытается предсказывать, что произойдёт после действия агента в среде. Не пост-фактум адаптация, а цель обучения с первого дня.

Если языковая модель умеет моделировать окружение, её можно использовать как тренировочную площадку для агентов.

Авторы идут по двум направлениям:

1. построить foundation model для симуляции сред

2. проверить, усиливает ли world modeling обучение агентов

Самое интересное: по их данным, agentic RL в контролируемой симуляции может быть эффективнее, чем обучение в реальных средах. А предварительное обучение на предсказание окружений усиливает агентов даже без отдельного agent-specific fine-tuning.

Грубо говоря, это шаг к «тренажёру реальности» для AI-агентов.

Paper: https://arxiv.org/abs/2606.24597
Blog: https://qwen.ai/blog?id=qwen-agentworld
GitHub: https://github.com/QwenLM/Qwen-AgentWorld
HuggingFace: https://huggingface.co/collections/Qwen/qwen-agentworld
ModelScope: https://modelscope.cn/collections/Qwen/Qwen-AgentWorld
9👍7🤯2
🖥 IBM показала технологию чипов ниже 1 нанометра.

Речь о 0,7 нм, или 7 ангстремах. Это уже масштаб, где индустрия упирается почти в атомные размеры.

В чипе представлена новая 3D-архитектура nanostack.

Вместо того чтобы просто уменьшать транзисторы, IBM предлагает укладывать их слоями и плотнее размещать внутри чипа.

Что обещают:
• почти 100 млрд транзисторов на чипе размером с ноготь
• до 50% больше производительности
• или до 70% выше энергоэффективность по сравнению с 2 нм
• более плотную SRAM для AI-нагрузок.

IBM говорит о пути к производству примерно в ближайшие 5 лет.

https://newsroom.ibm.com/2026-06-25-ibm-debuts-worlds-first-sub-1-nanometer-chip-technology
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥32👍116😁1🌚1
Google добавили computer use в Gemini 3.5 Flash.

Теперь модель может вызывать функции, а работать с интерфейсом как пользователь: видеть экран, понимать задачу, нажимать, проверять и продолжать действие.

Раньше computer use был отдельной моделью, теперь это часть основной Gemini Flash.

Отдельно добавили защиту: подтверждение чувствительных действий и остановку задач при подозрении на prompt injection.

https://blog.google/innovation-and-ai/models-and-research/gemini-models/introducing-computer-use-gemini-3-5-flash/
🔥116👍6
🌺 Релиз Ornith-1.0 - новое семейство open-source LLM, специализированных под agentic coding.

Ornith-1.0 выходит в разных размерах:

• 9B Dense

• 31B Dense

• 35B MoE

• 397B MoE

Модели показывают state-of-the-art результаты среди open-source моделей сопоставимого размера на coding-бенчмарках:

• Terminal-Bench 2.1 — 77.5

• SWE-Bench — 82.4 на verified, 62.2 на pro, 78.9 на Multilingual

• NL2Repo — 48.2

• SWE Atlas — 41.2 на QnA, 42.6 RF, 39.1 TW

• ClawEval — 77.1

Ornith-1.0 дообучали поверх Gemma 4 и Qwen 3.5.

Reinforcement learning используется не только для генерации решений, но и для создания task-specific scaffolds, которые направляют эти решения.

То есть модель совместно улучшает и «каркас» задачи, и итоговое решение. За счёт этого она генерирует более качественные ответы в agentic coding.

Все модели выпущены под MIT-лицензией, поэтому их можно использовать и в коммерческих, и в исследовательских проектах.

📖Tech Blog: http://deep-reinforce.com/ornith_1_0.html
🤗Huggingface: http://huggingface.co/collections/deepreinforce-ai/ornith-10
8👍5🔥1🥱1
🚨 Правительство США будет решать, кто получит доступ к GPT-5.6.

OpenAI выпустит GPT-5.6 только в формате ограниченного preview для небольшой группы партнёров.

Сэм Альтман сказал сотрудникам, что правительство будет «одобрять доступ отдельно для каждого клиента».

Министр торговли Говард Латник лично звонил Альтману с предупреждением: не запускать модель без согласований с другими ведомствами.

Это уже де-факто режим лицензирования.

https://www.theinformation.com/articles/trump-administration-asks-openai-stagger-release-new-model-security-concerns
🤣14🔥6🌚53👍3