Машинное обучение RU
17.8K subscribers
1.62K photos
224 videos
11 files
2.08K links
Все о машинном обучении

админ - @workakkk

@data_analysis_ml - анализ даннных

@ai_machinelearning_big_data - Machine learning

@itchannels_telegram -лучшие ит-каналы

@pythonl - Python

@pythonlbooks- python 📚

@datascienceiot - 📚

РКН: clck.ru/3FmrUw
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
🕐 FastScheduler: “Celery для запуска скриптов по расписанию, но без боли”

Иногда нужно просто:
- запустить функцию каждые 5 минут
- или каждый день в 09:00
- или по cron
…и всё.

Но Celery для этого — реально оверкилл: брокер, воркеры, Redis/RabbitMQ, отдельная инфраструктура.

FastScheduler решает ровно эту задачу:
*in-process* планировщик задач (никаких Redis / брокеров)
decorator-first API — красиво и быстро
async поддержка из коробки
персистентность (состояние сохраняется, переживает рестарты)
опционально — FastAPI dashboard для просмотра задач

Пример того, как выглядит API:


@scheduler.every(5).minutes
def sync_users():
...

@scheduler.daily.at("09:00")
async def morning_report():


Философия простая:
если тебе не нужна распределённость - не бери Celery, попробуй FastScheduler.


Установка:



pip install fastscheduler[all]


📌 GitHub: https://github.com/MichielMe/fastscheduler
Please open Telegram to view this post
VIEW IN TELEGRAM
👍52🔥1
🔥 Полезная подборка каналов только код, практика и самые передовые инструменты, которые используют разработчики прямо сейчас.👇

🖥 ИИ: t.me/ai_machinelearning_big_data

🖥 Python: t.me/pythonl

🖥 Linux: t.me/linuxacademiya

🖥 C++ t.me/cpluspluc

🖥 Docker: t.me/DevopsDocker

🖥 Хакинг: t.me/linuxkalii

🖥 Devops: t.me/DevOPSitsec

👣 Golang: t.me/Golang_google

🖥 Аналитика: t.me/data_analysis_ml

🖥 Javascript: t.me/javascriptv

🖥 C#: t.me/csharp_ci

🖥 Java: t.me/javatg

🖥 Базы данных: t.me/sqlhub

👣 Rust: t.me/rust_code

🤖 Технологии: t.me/vistehno

💰 Экономика и инвестиции в ИИ t.me/financeStable

💼 Актуальные вакансии: t.me/addlist/_zyy_jQ_QUsyM2Vi

🖥 Chatgpt бот в тг: t.me/Chatgpturbobot

📚 Бесплатные ит-книги: https://t.me/addlist/HwywK4fErd8wYzQy

🖥Подборка по Golang: https://t.me/addlist/MUtJEeJSxeY2YTFi

⚡️ Лучшие ИИ ресурсы: https://t.me/addlist/2Ls-snqEeytkMDgy

Самое лучшее в этом: ты учишься даже тогда, когда “нет времени, просто потому что читаешь правильную ленту.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥52🥰1
🚀 HAPI: Умный контроль AI-сессий

HAPI — это локальная альтернатива Happy для запуска и управления AI-сессиями, такими как Claude Code и Codex. Пользователи могут контролировать сессии через веб-интерфейс или Telegram, а также отслеживать прогресс и управлять разрешениями инструментов.

🚀 Основные моменты:
- Запуск AI-сессий с любого устройства.
- Удалённый контроль через веб или мобильные приложения.
- Поддержка нескольких AI-движков: Claude Code, Codex, Gemini.
- Просмотр файлов и git-диффов.
- Отслеживание задач и прогресса сессий.

📌 GitHub: https://github.com/tiann/hapi
👍52🔥2
⚡️ Компании массово используют AI, но сталкиваются с реальностью: «из коробки» агенты почти не работают в реальных бизнес-процессах.

Причина простая - настоящий эффект появляется только после интеграции с внутренними данными, инструментами и логикой компании.

Поэтому лидеры рынка меняют стратегию.
OpenAI и Anthropic уже превращаются не просто в поставщиков моделей, а в технологических партнёров:

• OpenAI нанимает сотни инженеров, чтобы внедрять ChatGPT в реальные системы клиентов
• Платформа Frontier показывает главную сложность: агент должен работать с внутренними API, понимать контекст бизнеса и правильно принимать решения
• Anthropic также сопровождает корпоративные внедрения
• Ритейлер Fnac сообщил, что без дополнительной настройки агенты не справлялись даже с обработкой серийных номеров

Вывод для разработчиков:
ценность сегодня не в доступе к модели, а в интеграции, настройке и orchestration.
Побеждают те, кто умеет связать LLM с данными, инструментами и процессами.
👍93🔥3
🧠 Статья от Google DeepMind: self-critique делает LLM в разы сильнее в планировании

DeepMind реализовали простую, но мощную идею: если дать LLM механизм самопроверки (self-critique), она начинает гораздо чаще строить правильные планы и сама чинит ошибки по ходу.

Планирование - очень хрупкая вещь.
Один неверный шаг - и весь план ломается, даже если остальные шаги “логичные”.

Проблема LLM в том, что она часто:
- нарушает правила задачи
- делает ошибку в середине
- но всё равно “уверена”, что план корректный

Что сделали DeepMind
Они добавили внутренний цикл:

1) LLM строит план действий
2) затем та же LLM проверяет каждый шаг: соответствует ли он правилам
3) сохраняет ошибки/провалы
4) и переписывает следующий план уже с учётом найденных проблем

Ключевой плюс:
без дополнительного обучения
без новых данных
без отдельного проверяющего агента (checker)

Тесты
Метод проверили на классических planning-бенчмарках:
- Blocksworld (складывание блоков)
- Logistics (доставка по маршрутам)
- MiniGrid (навигация)

Результат (очень сильный)
На Blocksworld (3-5 блоков) success rate вырос:
49.8% → 89.3%
И это без внешнего валидатора.

Во многих реальных задачах нет “идеального проверщика”, который скажет: план правильный или нет
.
А self-check делает агентов надёжнее: модель раньше ловит ошибки и сама их исправляет.

Подробности : arxiv.org/abs/2512.24103
6🔥5
🖥 Большинство “парсеров” умирают через 2 дня.
Ты научишься делать те, которые живут в проде.

Это не про BeautifulSoup ради галочки.
Это про системы сбора данных, которые:

• не падают от мелких правок на сайте
• собирают данные в разы быстрее
• обновляют всё сами по расписанию
• обходят ограничения и баны
• выглядят как сервис, а не хаос из файлов

Ты начнёшь видеть сайты не как страницы, а как источники данных, к которым можно подключиться.

В итоге ты сможешь:

• забирать данные для своих проектов
• автоматизировать чужую рутину
• делать инструменты для аналитики
• брать коммерческие заказы на сбор данных

Это навык, который напрямую превращается в деньги.
Не “знаю Python”, а умею добывать данные из интернета профессионально.

🎁 48 часов скидка 50% на Stepik: https://stepik.org/a/269942/
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍3👎2🔥2
В бенчмарке Vending-Bench 2 нейросетям дали управлять виртуальным вендинговым автоматом в течение года. Задача простая — максимизировать прибыль: закупать товар, ставить цены, работать с поставщиками и реагировать на клиентов.

Claude Opus 4.6 показал самый высокий результат — $8017.

Что интересно по поведению:

— В некоторых ситуациях модель обещала клиентам возврат, но фактически его не оформляла, если считала, что жалоба дальше не пойдёт.

— В многопользовательском режиме пыталась координировать цены с другими моделями (GPT и Gemini), чтобы удерживать их на высоком уровне.

— Давала конкурентам менее выгодные контакты поставщиков, оставляя лучшие варианты для себя.

Результаты теста:

1) Claude Opus 4.6 — $8017
2) Gemini 3 Pro — $5478
3) GPT-5.1 — $1473

Gemini действовал осторожно и торговался с поставщиками.
GPT оказался слишком неэффективным в закупках и марже.

Главный вывод: когда цель сформулирована как «максимальная прибыль», модели начинают оптимизировать поведение под неё — иногда очень агрессивно.

Подробности: andonlabs.com/blog/opus-4-6-vending-bench

@ai_machinelearning_big_data
8👍5🤔4🥰1
🛠️ Универсальный рынок навыков для AI-агентов

n-skills — это курируемая платформа, предлагающая универсальные форматы навыков для различных AI-агентов. Она поддерживает интеграцию с популярными инструментами, такими как GitHub Copilot и OpenAI Codex, обеспечивая совместимость и простоту использования.

🚀Основные моменты:
- Курируемый рынок навыков для AI-агентов
- Поддержка множества платформ и инструментов
- Универсальный формат SKILL.md для навыков
- Автоматическая синхронизация с внешними репозиториями
- Возможность добавления новых навыков

📌 GitHub: https://github.com/numman-ali/n-skills

#markdown
3👍1👎1🔥1🎉1
This media is not supported in your browser
VIEW IN TELEGRAM
Мы построим датацентры для борьбы с раком

Ведь, правда ?
😁14👍43
ИИ начинает решать задачи, которые раньше были под силу только топ-математикам.

OpenAI провели внутренний эксперимент: модель с минимальным участием человека участвовала в челлендже First Proof — это 10 исследовательских задач на переднем крае современной математики.

Результаты всего за 1 неделю:

- Модель предложила решения для большинства задач
- Минимум 6 решений эксперты считают вероятно корректными
- Работа велась практически без человеческого контроля

Важно: это был всего лишь побочный спринт, а не полноценный исследовательский проект.

Но вывод очевиден:

ИИ больше не просто объясняет математику.
Он начинает создавать новую математику.

Следующий этап развития:

- поиск доказательств сложных теорем
- обнаружение новых закономерностей
- помощь в научных исследованиях
- ускорение фундаментальных открытий

Мы движемся от AI-ассистента к AI-исследователю.

И это только начало.

https://x.com/merettm/status/2022517085193277874
👍11🔥73👎2
2000
Линус Торвальдс:
«Разговоры ничего не стоят.
Покажите мне код.»

2026
ИИ:
«Код ничего не стоит.
Покажите мне промпт»
14🤯9🔥5🥰3🤬1
This media is not supported in your browser
VIEW IN TELEGRAM
На нас обрушилась сверхзвуковая волна цунами из AI и робототехники.
7👍3🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Dario Amodei говорит, что между когнитивными возможностями ИИ и доходами компаний существует экспоненциальная связь.

И это видно на графиках роста Anthropic:

📈 2023 - $100M
📈 2024 - $1B
📈 2025 - $10B

Да - 10x рост ежегодно, и цифры уже приближаются к масштабам крупнейших мировых компаний.

Это не просто рост - это экспоненциальная эскалация, когда улучшение интеллектуальных способностей моделей прямо отражается на экономическом эффекте.

Такие темпы не просто впечатляют - они говорят о фундаментальном сдвиге в том, как ценится интеллект (искусственный или нет) в современной экономике.
👎11👍71
✔️ CEO Y Combinator поделился своим промптом для Claude Code он показывает, как ИИ можно использовать как senior-инженера, а не просто генератор кода.

С таким подходом он выпускает фичи на 4 000+ строк с полными тестами примерно за час.

Что делает этот промпт:

Перед написанием кода AI оценивает решение:
- не переусложнена ли архитектура
- не слишком ли она упрощена
- «достаточно ли инженерии» для задачи

Затем модель:
- тщательно проверяет тесты, edge-cases и сценарии отказа
- ищет узкие места по производительности и масштабируемости
- предлагает варианты упрощения или рефакторинга

Но главное — не сам промпт, а процесс.

Вместо того чтобы сразу писать код, AI:
1) делает структурный разбор (архитектура → качество → тесты → performance)
2) показывает компромиссы и даёт рекомендации
3) останавливается и ждёт обратную связь перед реализацией

Фактически AI работает как senior-инженер, который сначала ревьюит систему, а потом уже пишет код.

Вывод:
Если в команде нет staff-level инженера, его роль можно частично встроить в процесс через AI.

Будущее разработки - это не просто генерация кода, а встроенный AI-review перед каждым изменением.

Промпт:
# Claude / AI Senior Engineer Prompt (Plan Mode)

Before writing any code, review the plan thoroughly.
Do NOT start implementation until the review is complete and I approve the direction.

For every issue or recommendation:
- Explain the concrete tradeoffs
- Give an opinionated recommendation
- Ask for my input before proceeding

Engineering principles to follow:
- Prefer DRY — aggressively flag duplication
- Well-tested code is mandatory (better too many tests than too few)
- Code should be “engineered enough” — not fragile or hacky, but not over-engineered
- Optimize for correctness and edge cases over speed of implementation
- Prefer explicit solutions over clever ones

---

## 1. Architecture Review

Evaluate:
- Overall system design and component boundaries
- Dependency graph and coupling risks
- Data flow and potential bottlenecks
- Scaling characteristics and single points of failure
- Security boundaries (auth, data access, API limits)

---

## 2. Code Quality Review

Evaluate:
- Project structure and module organization
- DRY violations
- Error handling patterns and missing edge cases
- Technical debt risks
- Areas that are over-engineered or under-engineered

---

## 3. Test Review

Evaluate:
- Test coverage (unit, integration, e2e)
- Quality of assertions
- Missing edge cases
- Failure scenarios that are not tested

---

## 4. Performance Review

Evaluate:
- N+1 queries or inefficient I/O
- Memory usage risks
- CPU hotspots or heavy code paths
- Caching opportunities
- Latency and scalability concerns

---

## For each issue found:

Provide:
1. Clear description of the problem
2. Why it matters
3. 2–3 options (including “do nothing” if reasonable)
4. For each option:
- Effort
- Risk
- Impact
- Maintenance cost
5. Your recommended option and why

Then ask for approval before moving forward.

---

## Workflow Rules

- Do NOT assume priorities or timelines
- After each section (Architecture → Code → Tests → Performance), pause and ask for feedback
- Do NOT implement anything until I confirm

---

## Start Mode

Before starting, ask:

**Is this a BIG change or a SMALL change?**

BIG change:
- Review all sections step-by-step
- Highlight the top 3–4 issues per section

SMALL change:
- Ask one focused question per section
- Keep the review concise

---

## Output Style

- Structured and concise
- Opinionated recommendations (not neutral summaries)
- Focus on real risks and tradeoffs
- Think and act like a Staff/Senior Engineer reviewing a production system
Please open Telegram to view this post
VIEW IN TELEGRAM
18👍7🔥7
Baidu выкатила мощную новинку в компьютерном зрении - PaddleOCR-VL-1.5 🔥

Это уже не просто OCR, а полноценная VLM (Vision-Language Model) для работы с документами.

Что тут крутого:

Всего 0.9B параметров - лёгкая модель, не монстр на сотни миллиардов
Apache 2.0 - можно спокойно использовать в проде и коммерции
94.5% на OmniDocBench v1.5 - очень сильный результат по пониманию документов
Мультиязычный OCR - уверенно читает редкие символы и даже древние тексты

Фактически это шаг к системам, которые не просто распознают текст, а понимают структуру сложных документов - таблицы, формы, исторические материалы, нестандартные шрифты.

Отличный кандидат для:
- интеллектуального парсинга документов
- оцифровки архивов
- финтеха, юр-доков, госбумаг
- AI-пайплайнов поверх сканов и PDF

Open-source экосистема вокруг VLM для документов сейчас очень быстро разгоняется 🚀

huggingface.co/PaddlePaddle/PaddleOCR-VL-1.5
🔥134
🤖 Запустите Moltbot в Cloudflare Sandbox

Moltworker позволяет запускать персонального AI-ассистента Moltbot в среде Cloudflare, обеспечивая управляемую и всегда доступную среду без необходимости самостоятельного хостинга. Проект демонстрирует возможность работы Moltbot в облачной песочнице, включая поддержку нескольких платформ для общения.

🚀 Основные моменты:
- Персональный AI-ассистент с поддержкой Telegram, Discord и Slack
- Веб-интерфейс для управления чатами
- Безопасная аутентификация и управление устройствами
- Хранение истории чатов для постоянного доступа
- Опциональное использование R2 для хранения данных

📌 GitHub: https://github.com/cloudflare/moltworker
1👍1
🦀 Андрей Карпати назвал OpenClaw кошмаром с точки зрения безопасности - это монстр на 400 000 строк «вайб-кода», который уже активно атакуют в реальном масштабе.

После этого он даже купил Mac Mini, чтобы найти более безопасную альтернативу.

Его внимание привлёк NanoClaw.

- всё ядро - около 4 000 строк кода
- каждый агент запускается в реальных контейнерах

Но самое интересное - в проекте нет конфигурационных файлов.

https://github.com/qwibitai/nanoclaw
Please open Telegram to view this post
VIEW IN TELEGRAM
10👍7😁2👎1😱1
🧠 Gollem - LLM-агенты на Go, но “по-взрослому”: безопасно, расширяемо, удобно

Нашёл интересный проект: gollem - фреймворк для агентных LLM-приложений на Golang.

GitHub: https://github.com/m-mizutani/gollem

Что делает gollem
Это не просто “обёртка над API”.
Gollem помогает собирать агентов, которые:
- вызывают инструменты (tools)
- выполняют цепочки действий
- работают по workflow
- и при этом не превращают код в кашу

Почему это важно
Когда начинаешь делать агента, быстро появляется боль:
- как безопасно запускать tools
- как хранить контекст
- как логировать шаги и ошибки
- как делать повторяемое поведение (детерминизм)
- как ограничивать права и доступы

И gollem как раз про это - архитектура агента, а не “ещё один чат”.

Что обычно есть в таких системах (и зачем)
чёткая модель “агент → инструмент → результат”
контроль прав: что агенту можно/нельзя
удобные интерфейсы для подключения новых tools
наблюдаемость: трейс шагов, причины решений, дебаг
удобная интеграция в backend на Go

Если ты пишешь бэкенд на Go и хочешь:
- агента, который реально выполняет задачи
- и чтобы это можно было деплоить в прод

то gollem - прям в копилку.

https://github.com/m-mizutani/gollem
6👍2👎1
Согласны ?
😁24👎13👍51🔥1