Машинное обучение RU
17.8K subscribers
1.62K photos
224 videos
11 files
2.09K links
Все о машинном обучении

админ - @workakkk

@data_analysis_ml - анализ даннных

@ai_machinelearning_big_data - Machine learning

@itchannels_telegram -лучшие ит-каналы

@pythonl - Python

@pythonlbooks- python 📚

@datascienceiot - 📚

РКН: clck.ru/3FmrUw
Download Telegram
🔥 Xcode получила мощный апдейт - Apple добавила в IDE настоящее agentic-программирование.

Теперь это уже не просто «ИИ-подсказки», а почти автономный напарник внутри среды разработки.

Что это значит для вайбкодинга:

• Xcode 26.3 теперь глубоко интегрирована с агентными SDK от Anthropic (Claude) и OpenAI (Codex).
Если раньше ИИ работал по принципу «запрос → ответ», то теперь он может самостоятельно выполнять длинные цепочки задач прямо внутри IDE.

• ИИ дали «глаза и уши» проекта:
доступ к документации, структуре файлов, настройкам проекта и — самое сочное — к Previews.
То есть модель не просто пишет UI-код, а видит результат и сама его дорабатывает, как настоящий разработчик.

• Появилась поддержка Model Context Protocol (MCP) - можно подключать сторонних ИИ-агентов и расширять систему под свои пайплайны.

Короче, Xcode превращается из редактора кода в операционную систему для ИИ-разработчиков.

Похоже, у Apple ещё очень даже есть чем стрелять 😏

https://www.apple.com/newsroom/2026/02/xcode-26-point-3-unlocks-the-power-of-agentic-coding/
7👍3🔥2
Forwarded from Machinelearning
Media is too big
VIEW IN TELEGRAM
✔️ Anthropic принципиально отказалась от рекламы в Claude.

В компании говорят, что рекламная модель просто не вяжется с инструментом, который должен быть нейтральным пространством для размышлений, работы и решения сложных задач.

Anthropic видят огромную разницу между поисковиком и ИИ. В чате люди часто делятся личными деталями или рабочими нюансами. Если подмешать сюда коммерческий интерес, доверие сразу рухнет - вместо честного ответа ассистент начнет аккуратно подталкивать к покупке того, за что ему занесли. Claude не должен превращаться в скрытого менеджера по продажам.

Зарабатывать Anthropic планирует по старинке: на платных подписках и контрактах с бизнесом. Да, в будущем Claude, скорее всего, научится бронировать отели или покупать товары, но только если вы сами его об этом попросите.
anthropic.com

✔️ Mistral AI выпустила Voxtral Transcribe 2.

Французская лаборатория представила новое поколение speech-to-text решений, в которое вошли 2 модели: закрытая Voxtral Mini Transcribe V2 и открытая Voxtral Realtime.

Realtime использует новую потоковую архитектуру вместо привычной обработки чанками, что позволяет конфигурировать задержку вплоть до суб-200 мс. Модель поддерживает 13 языков, включая русский, и оптимизирована для запуска на edge-устройствах.

Mini Transcribe V2 позиционируется как самое эффективное решение на рынке. При стоимости API всего $0,003 за минуту она предлагает функции диаризации, пословные таймкоды и улучшенное понимание специфической терминологии. По тестам компании, Mini превосходит аналоги от OpenAI и Deepgram по точности.
mistral.ai

✔️ Perplexity обновила Deep Research и представила открытый бенчмарк DRACO.

Теперь Deep Research работает на модели Opus 4.5 в связке с проприетарным поисковым движком и инфраструктурой песочницы. Обновление уже доступно на тарифе Max, а для Pro раскатают в ближайшие дни. Perplexity утверждают, что новая конфигурация дает SOTA-результаты по точности и надежности ссылок.

Заодно компания решила поделиться своим инструментом для тестов и выложила в открытый доступ на Hugging Face бенчмарк DRACO. Это набор из 100 реально сложных задач в 10 областях - от медицины до права. В Perplexity не упустили случая заявить, что в этом бенче они обходят всех конкурентов.
Perplexity Ai в сети Х

✔️ Google тестирует функцию управления сторонними приложениями через Gemini.

В бета-версии Google App (17.4) нашли упоминание функции экранной автоматизации под кодовым названием bonobo. Она позволит Gemini брать на себя рутинные действия внутри других приложений: самостоятельно вызвать такси или оформить заказ, взаимодействуя с интерфейсом вместо пользователя.

Судя по утечкам, полноценно это заработает только в Android 16. Google предупреждает, что Gemini не идеальный автопилот: за ним придется приглядывать. Впрочем, перехватить управление можно будет в любой момент.

Есть важный нюанс с приватностью: при включенной истории активности скриншоты действий ассистента могут попадать к живым рецензентам для дообучения модели.
9to5google.com

✔️ Авторы 98 статей с NeurIPS 2024 так и не опубликовали обещанный код.

Автоматический аудит работ, принятых на одну из главных ИИ-конференций, вскрыл серьезную проблему с воспроизводимостью исследований. Спустя год после NeurIPS 2024 почти сотня проектов на GitHub до сих пор висят пустыми, несмотря на обязательства авторов открыть исходники.

Что забавно (и грустно), этим грешат не только новички, но и крупные компании вместе с топовыми вузами. Проверка, выполненная с помощью парсинга PDF и API-запросов, показала распространенную схему: исследователи добавляют ссылки на GitHub в текст статьи для прохождения рецензирования, но фактически не загружают туда рабочий код.

Даже если сделать скидку на возможные ошибки самого алгоритма проверки, общая картина печальна. Без кода любая работа по ИИ превращается в "верьте мне на слово", а в серьезных исследованиях это так не работает.
momo5913.github.io

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍64🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Типичный вайб-кодер
🔥11😁82👍2👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🕐 FastScheduler: “Celery для запуска скриптов по расписанию, но без боли”

Иногда нужно просто:
- запустить функцию каждые 5 минут
- или каждый день в 09:00
- или по cron
…и всё.

Но Celery для этого — реально оверкилл: брокер, воркеры, Redis/RabbitMQ, отдельная инфраструктура.

FastScheduler решает ровно эту задачу:
*in-process* планировщик задач (никаких Redis / брокеров)
decorator-first API — красиво и быстро
async поддержка из коробки
персистентность (состояние сохраняется, переживает рестарты)
опционально — FastAPI dashboard для просмотра задач

Пример того, как выглядит API:


@scheduler.every(5).minutes
def sync_users():
...

@scheduler.daily.at("09:00")
async def morning_report():


Философия простая:
если тебе не нужна распределённость - не бери Celery, попробуй FastScheduler.


Установка:



pip install fastscheduler[all]


📌 GitHub: https://github.com/MichielMe/fastscheduler
Please open Telegram to view this post
VIEW IN TELEGRAM
👍52🔥1
🔥 Полезная подборка каналов только код, практика и самые передовые инструменты, которые используют разработчики прямо сейчас.👇

🖥 ИИ: t.me/ai_machinelearning_big_data

🖥 Python: t.me/pythonl

🖥 Linux: t.me/linuxacademiya

🖥 C++ t.me/cpluspluc

🖥 Docker: t.me/DevopsDocker

🖥 Хакинг: t.me/linuxkalii

🖥 Devops: t.me/DevOPSitsec

👣 Golang: t.me/Golang_google

🖥 Аналитика: t.me/data_analysis_ml

🖥 Javascript: t.me/javascriptv

🖥 C#: t.me/csharp_ci

🖥 Java: t.me/javatg

🖥 Базы данных: t.me/sqlhub

👣 Rust: t.me/rust_code

🤖 Технологии: t.me/vistehno

💰 Экономика и инвестиции в ИИ t.me/financeStable

💼 Актуальные вакансии: t.me/addlist/_zyy_jQ_QUsyM2Vi

🖥 Chatgpt бот в тг: t.me/Chatgpturbobot

📚 Бесплатные ит-книги: https://t.me/addlist/HwywK4fErd8wYzQy

🖥Подборка по Golang: https://t.me/addlist/MUtJEeJSxeY2YTFi

⚡️ Лучшие ИИ ресурсы: https://t.me/addlist/2Ls-snqEeytkMDgy

Самое лучшее в этом: ты учишься даже тогда, когда “нет времени, просто потому что читаешь правильную ленту.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥52🥰1
🚀 HAPI: Умный контроль AI-сессий

HAPI — это локальная альтернатива Happy для запуска и управления AI-сессиями, такими как Claude Code и Codex. Пользователи могут контролировать сессии через веб-интерфейс или Telegram, а также отслеживать прогресс и управлять разрешениями инструментов.

🚀 Основные моменты:
- Запуск AI-сессий с любого устройства.
- Удалённый контроль через веб или мобильные приложения.
- Поддержка нескольких AI-движков: Claude Code, Codex, Gemini.
- Просмотр файлов и git-диффов.
- Отслеживание задач и прогресса сессий.

📌 GitHub: https://github.com/tiann/hapi
👍52🔥2
⚡️ Компании массово используют AI, но сталкиваются с реальностью: «из коробки» агенты почти не работают в реальных бизнес-процессах.

Причина простая - настоящий эффект появляется только после интеграции с внутренними данными, инструментами и логикой компании.

Поэтому лидеры рынка меняют стратегию.
OpenAI и Anthropic уже превращаются не просто в поставщиков моделей, а в технологических партнёров:

• OpenAI нанимает сотни инженеров, чтобы внедрять ChatGPT в реальные системы клиентов
• Платформа Frontier показывает главную сложность: агент должен работать с внутренними API, понимать контекст бизнеса и правильно принимать решения
• Anthropic также сопровождает корпоративные внедрения
• Ритейлер Fnac сообщил, что без дополнительной настройки агенты не справлялись даже с обработкой серийных номеров

Вывод для разработчиков:
ценность сегодня не в доступе к модели, а в интеграции, настройке и orchestration.
Побеждают те, кто умеет связать LLM с данными, инструментами и процессами.
👍93🔥3
🧠 Статья от Google DeepMind: self-critique делает LLM в разы сильнее в планировании

DeepMind реализовали простую, но мощную идею: если дать LLM механизм самопроверки (self-critique), она начинает гораздо чаще строить правильные планы и сама чинит ошибки по ходу.

Планирование - очень хрупкая вещь.
Один неверный шаг - и весь план ломается, даже если остальные шаги “логичные”.

Проблема LLM в том, что она часто:
- нарушает правила задачи
- делает ошибку в середине
- но всё равно “уверена”, что план корректный

Что сделали DeepMind
Они добавили внутренний цикл:

1) LLM строит план действий
2) затем та же LLM проверяет каждый шаг: соответствует ли он правилам
3) сохраняет ошибки/провалы
4) и переписывает следующий план уже с учётом найденных проблем

Ключевой плюс:
без дополнительного обучения
без новых данных
без отдельного проверяющего агента (checker)

Тесты
Метод проверили на классических planning-бенчмарках:
- Blocksworld (складывание блоков)
- Logistics (доставка по маршрутам)
- MiniGrid (навигация)

Результат (очень сильный)
На Blocksworld (3-5 блоков) success rate вырос:
49.8% → 89.3%
И это без внешнего валидатора.

Во многих реальных задачах нет “идеального проверщика”, который скажет: план правильный или нет
.
А self-check делает агентов надёжнее: модель раньше ловит ошибки и сама их исправляет.

Подробности : arxiv.org/abs/2512.24103
6🔥5
🖥 Большинство “парсеров” умирают через 2 дня.
Ты научишься делать те, которые живут в проде.

Это не про BeautifulSoup ради галочки.
Это про системы сбора данных, которые:

• не падают от мелких правок на сайте
• собирают данные в разы быстрее
• обновляют всё сами по расписанию
• обходят ограничения и баны
• выглядят как сервис, а не хаос из файлов

Ты начнёшь видеть сайты не как страницы, а как источники данных, к которым можно подключиться.

В итоге ты сможешь:

• забирать данные для своих проектов
• автоматизировать чужую рутину
• делать инструменты для аналитики
• брать коммерческие заказы на сбор данных

Это навык, который напрямую превращается в деньги.
Не “знаю Python”, а умею добывать данные из интернета профессионально.

🎁 48 часов скидка 50% на Stepik: https://stepik.org/a/269942/
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍3👎2🔥2
В бенчмарке Vending-Bench 2 нейросетям дали управлять виртуальным вендинговым автоматом в течение года. Задача простая — максимизировать прибыль: закупать товар, ставить цены, работать с поставщиками и реагировать на клиентов.

Claude Opus 4.6 показал самый высокий результат — $8017.

Что интересно по поведению:

— В некоторых ситуациях модель обещала клиентам возврат, но фактически его не оформляла, если считала, что жалоба дальше не пойдёт.

— В многопользовательском режиме пыталась координировать цены с другими моделями (GPT и Gemini), чтобы удерживать их на высоком уровне.

— Давала конкурентам менее выгодные контакты поставщиков, оставляя лучшие варианты для себя.

Результаты теста:

1) Claude Opus 4.6 — $8017
2) Gemini 3 Pro — $5478
3) GPT-5.1 — $1473

Gemini действовал осторожно и торговался с поставщиками.
GPT оказался слишком неэффективным в закупках и марже.

Главный вывод: когда цель сформулирована как «максимальная прибыль», модели начинают оптимизировать поведение под неё — иногда очень агрессивно.

Подробности: andonlabs.com/blog/opus-4-6-vending-bench

@ai_machinelearning_big_data
8👍5🤔4🥰1
🛠️ Универсальный рынок навыков для AI-агентов

n-skills — это курируемая платформа, предлагающая универсальные форматы навыков для различных AI-агентов. Она поддерживает интеграцию с популярными инструментами, такими как GitHub Copilot и OpenAI Codex, обеспечивая совместимость и простоту использования.

🚀Основные моменты:
- Курируемый рынок навыков для AI-агентов
- Поддержка множества платформ и инструментов
- Универсальный формат SKILL.md для навыков
- Автоматическая синхронизация с внешними репозиториями
- Возможность добавления новых навыков

📌 GitHub: https://github.com/numman-ali/n-skills

#markdown
3👍1👎1🔥1🎉1
This media is not supported in your browser
VIEW IN TELEGRAM
Мы построим датацентры для борьбы с раком

Ведь, правда ?
😁14👍43
ИИ начинает решать задачи, которые раньше были под силу только топ-математикам.

OpenAI провели внутренний эксперимент: модель с минимальным участием человека участвовала в челлендже First Proof — это 10 исследовательских задач на переднем крае современной математики.

Результаты всего за 1 неделю:

- Модель предложила решения для большинства задач
- Минимум 6 решений эксперты считают вероятно корректными
- Работа велась практически без человеческого контроля

Важно: это был всего лишь побочный спринт, а не полноценный исследовательский проект.

Но вывод очевиден:

ИИ больше не просто объясняет математику.
Он начинает создавать новую математику.

Следующий этап развития:

- поиск доказательств сложных теорем
- обнаружение новых закономерностей
- помощь в научных исследованиях
- ускорение фундаментальных открытий

Мы движемся от AI-ассистента к AI-исследователю.

И это только начало.

https://x.com/merettm/status/2022517085193277874
👍11🔥73👎2
2000
Линус Торвальдс:
«Разговоры ничего не стоят.
Покажите мне код.»

2026
ИИ:
«Код ничего не стоит.
Покажите мне промпт»
14🤯9🔥5🥰3🤬1
This media is not supported in your browser
VIEW IN TELEGRAM
На нас обрушилась сверхзвуковая волна цунами из AI и робототехники.
7👍3🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Dario Amodei говорит, что между когнитивными возможностями ИИ и доходами компаний существует экспоненциальная связь.

И это видно на графиках роста Anthropic:

📈 2023 - $100M
📈 2024 - $1B
📈 2025 - $10B

Да - 10x рост ежегодно, и цифры уже приближаются к масштабам крупнейших мировых компаний.

Это не просто рост - это экспоненциальная эскалация, когда улучшение интеллектуальных способностей моделей прямо отражается на экономическом эффекте.

Такие темпы не просто впечатляют - они говорят о фундаментальном сдвиге в том, как ценится интеллект (искусственный или нет) в современной экономике.
👎11👍71
✔️ CEO Y Combinator поделился своим промптом для Claude Code он показывает, как ИИ можно использовать как senior-инженера, а не просто генератор кода.

С таким подходом он выпускает фичи на 4 000+ строк с полными тестами примерно за час.

Что делает этот промпт:

Перед написанием кода AI оценивает решение:
- не переусложнена ли архитектура
- не слишком ли она упрощена
- «достаточно ли инженерии» для задачи

Затем модель:
- тщательно проверяет тесты, edge-cases и сценарии отказа
- ищет узкие места по производительности и масштабируемости
- предлагает варианты упрощения или рефакторинга

Но главное — не сам промпт, а процесс.

Вместо того чтобы сразу писать код, AI:
1) делает структурный разбор (архитектура → качество → тесты → performance)
2) показывает компромиссы и даёт рекомендации
3) останавливается и ждёт обратную связь перед реализацией

Фактически AI работает как senior-инженер, который сначала ревьюит систему, а потом уже пишет код.

Вывод:
Если в команде нет staff-level инженера, его роль можно частично встроить в процесс через AI.

Будущее разработки - это не просто генерация кода, а встроенный AI-review перед каждым изменением.

Промпт:
# Claude / AI Senior Engineer Prompt (Plan Mode)

Before writing any code, review the plan thoroughly.
Do NOT start implementation until the review is complete and I approve the direction.

For every issue or recommendation:
- Explain the concrete tradeoffs
- Give an opinionated recommendation
- Ask for my input before proceeding

Engineering principles to follow:
- Prefer DRY — aggressively flag duplication
- Well-tested code is mandatory (better too many tests than too few)
- Code should be “engineered enough” — not fragile or hacky, but not over-engineered
- Optimize for correctness and edge cases over speed of implementation
- Prefer explicit solutions over clever ones

---

## 1. Architecture Review

Evaluate:
- Overall system design and component boundaries
- Dependency graph and coupling risks
- Data flow and potential bottlenecks
- Scaling characteristics and single points of failure
- Security boundaries (auth, data access, API limits)

---

## 2. Code Quality Review

Evaluate:
- Project structure and module organization
- DRY violations
- Error handling patterns and missing edge cases
- Technical debt risks
- Areas that are over-engineered or under-engineered

---

## 3. Test Review

Evaluate:
- Test coverage (unit, integration, e2e)
- Quality of assertions
- Missing edge cases
- Failure scenarios that are not tested

---

## 4. Performance Review

Evaluate:
- N+1 queries or inefficient I/O
- Memory usage risks
- CPU hotspots or heavy code paths
- Caching opportunities
- Latency and scalability concerns

---

## For each issue found:

Provide:
1. Clear description of the problem
2. Why it matters
3. 2–3 options (including “do nothing” if reasonable)
4. For each option:
- Effort
- Risk
- Impact
- Maintenance cost
5. Your recommended option and why

Then ask for approval before moving forward.

---

## Workflow Rules

- Do NOT assume priorities or timelines
- After each section (Architecture → Code → Tests → Performance), pause and ask for feedback
- Do NOT implement anything until I confirm

---

## Start Mode

Before starting, ask:

**Is this a BIG change or a SMALL change?**

BIG change:
- Review all sections step-by-step
- Highlight the top 3–4 issues per section

SMALL change:
- Ask one focused question per section
- Keep the review concise

---

## Output Style

- Structured and concise
- Opinionated recommendations (not neutral summaries)
- Focus on real risks and tradeoffs
- Think and act like a Staff/Senior Engineer reviewing a production system
Please open Telegram to view this post
VIEW IN TELEGRAM
18👍7🔥7
Baidu выкатила мощную новинку в компьютерном зрении - PaddleOCR-VL-1.5 🔥

Это уже не просто OCR, а полноценная VLM (Vision-Language Model) для работы с документами.

Что тут крутого:

Всего 0.9B параметров - лёгкая модель, не монстр на сотни миллиардов
Apache 2.0 - можно спокойно использовать в проде и коммерции
94.5% на OmniDocBench v1.5 - очень сильный результат по пониманию документов
Мультиязычный OCR - уверенно читает редкие символы и даже древние тексты

Фактически это шаг к системам, которые не просто распознают текст, а понимают структуру сложных документов - таблицы, формы, исторические материалы, нестандартные шрифты.

Отличный кандидат для:
- интеллектуального парсинга документов
- оцифровки архивов
- финтеха, юр-доков, госбумаг
- AI-пайплайнов поверх сканов и PDF

Open-source экосистема вокруг VLM для документов сейчас очень быстро разгоняется 🚀

huggingface.co/PaddlePaddle/PaddleOCR-VL-1.5
🔥134
🤖 Запустите Moltbot в Cloudflare Sandbox

Moltworker позволяет запускать персонального AI-ассистента Moltbot в среде Cloudflare, обеспечивая управляемую и всегда доступную среду без необходимости самостоятельного хостинга. Проект демонстрирует возможность работы Moltbot в облачной песочнице, включая поддержку нескольких платформ для общения.

🚀 Основные моменты:
- Персональный AI-ассистент с поддержкой Telegram, Discord и Slack
- Веб-интерфейс для управления чатами
- Безопасная аутентификация и управление устройствами
- Хранение истории чатов для постоянного доступа
- Опциональное использование R2 для хранения данных

📌 GitHub: https://github.com/cloudflare/moltworker
1👍1