Хотите разобраться, как PyTorch работает изнутри, а не только вызывать .fit()?
Держите: awesome-cuda-books, кураторский список лучших книг по CUDA и параллельным вычислениям на GPU. 668 звёзд на GitHub.
CUDA от NVIDIA — основная платформа, поверх которой работают PyTorch, TensorFlow и большинство ML-фреймворков. Чтобы разобраться в том, что происходит на уровне ядер и памяти видеокарты, без хорошей книги не обойтись. Учебников по теме немало, и отфильтровать подходящие без ориентира непросто. А тут прямо готовая библиотека, так что забирайте.
#python #pytorch
@tproger
Читайте также в VK, Max и Дзен
Держите: awesome-cuda-books, кураторский список лучших книг по CUDA и параллельным вычислениям на GPU. 668 звёзд на GitHub.
CUDA от NVIDIA — основная платформа, поверх которой работают PyTorch, TensorFlow и большинство ML-фреймворков. Чтобы разобраться в том, что происходит на уровне ядер и памяти видеокарты, без хорошей книги не обойтись. Учебников по теме немало, и отфильтровать подходящие без ориентира непросто. А тут прямо готовая библиотека, так что забирайте.
#python #pytorch
@tproger
Читайте также в VK, Max и Дзен
🌚3🎄3🙉3🔥2🤝2😘2❤🔥1🤨1😭1🦄1😎1
Каждая часть системы работала правильно. Приложение всё равно падало
Веб создаёт данные, бэкенд обрабатывает, мобилка показывает — и каждый кусок по отдельности проходит тесты. А баг рождается ровно там, где они встречаются впервые.
Собрали пять кейсов из практики мобильного тестирования:
— Промокод с кириллицей, который веб спокойно создавал, а мобилка отказывалась принимать.
— RatingBar, который на Samsung стабильно накидывал лишнюю звезду.
— Пуши, отвалившиеся на всех iPad из-за одной строки «iPadOS» в JSON.
— Кнопка в чате бота, уехавшая за край экрана у клиентов с длинным списком счетов.
— WebSocket, который не закрывался при выходе из чата и копил соединения до краша.
@tproger
Читайте также в VK, Max и Дзен
Веб создаёт данные, бэкенд обрабатывает, мобилка показывает — и каждый кусок по отдельности проходит тесты. А баг рождается ровно там, где они встречаются впервые.
Собрали пять кейсов из практики мобильного тестирования:
— Промокод с кириллицей, который веб спокойно создавал, а мобилка отказывалась принимать.
— RatingBar, который на Samsung стабильно накидывал лишнюю звезду.
— Пуши, отвалившиеся на всех iPad из-за одной строки «iPadOS» в JSON.
— Кнопка в чате бота, уехавшая за край экрана у клиентов с длинным списком счетов.
— WebSocket, который не закрывался при выходе из чата и копил соединения до краша.
@tproger
Читайте также в VK, Max и Дзен
5❤4🤷♀3✍3🤣2👻2🤪2👍1👎1👏1👌1🎃1
Self-hosted платформа для агентов с песочницами и audit log
Один агент с shell-доступом выглядит удобно ровно до момента, когда надо понять, кто разрешил действие, в каком контейнере оно выполнялось и можно ли повторить цепочку. Horizons пытается закрыть именно эту инженерную часть.
В проекте агенты описываются декларативно: имя, sandbox image, доступные инструменты, расписание. Действия проходят approval gates, записываются в append-only audit log, а MCP gateway поддерживает stdio и HTTP. Получается не «чатик с инструментами», а среда исполнения с правилами.
Можно разобрать репозиторий как пример self-hosted agent execution. Внутри полезно смотреть не только на SDK, но и на модель разрешений, журнал действий и границы песочницы.
@tproger
Читайте также в VK, Max и Дзен
Один агент с shell-доступом выглядит удобно ровно до момента, когда надо понять, кто разрешил действие, в каком контейнере оно выполнялось и можно ли повторить цепочку. Horizons пытается закрыть именно эту инженерную часть.
В проекте агенты описываются декларативно: имя, sandbox image, доступные инструменты, расписание. Действия проходят approval gates, записываются в append-only audit log, а MCP gateway поддерживает stdio и HTTP. Получается не «чатик с инструментами», а среда исполнения с правилами.
Можно разобрать репозиторий как пример self-hosted agent execution. Внутри полезно смотреть не только на SDK, но и на модель разрешений, журнал действий и границы песочницы.
@tproger
Читайте также в VK, Max и Дзен
😁5😴3💊2🐳1🍌1💔1🍓1😈1💅1🆒1😎1
Агенты становятся быстрее не от промптов, а от runtime-подсказок
Когда агентный пайплайн тормозит, первое желание: переписать промпт или заменить модель. NVIDIA NeMo Agent Toolkit смотрит ниже: на маршрутизацию, приоритеты, трассировку и выполнение графов агентных задач.
В проекте есть Dynamo Runtime Intelligence для выбора cache-control и приоритетов по профилю запроса, Agent Performance Primitives для ускорения графовых фреймворков, интеграция с LangSmith и публикация workflow как MCP-серверов через FastMCP. Это уже не демо-чат, а инфраструктура вокруг агентных систем.
Если вы собираете не одного бота, а цепочку инструментов, стоит изучить подход. Детали помогают понять, какие части агентного стека стоит измерять до того, как винить модель.
@tproger
Читайте также в VK, Max и Дзен
Когда агентный пайплайн тормозит, первое желание: переписать промпт или заменить модель. NVIDIA NeMo Agent Toolkit смотрит ниже: на маршрутизацию, приоритеты, трассировку и выполнение графов агентных задач.
В проекте есть Dynamo Runtime Intelligence для выбора cache-control и приоритетов по профилю запроса, Agent Performance Primitives для ускорения графовых фреймворков, интеграция с LangSmith и публикация workflow как MCP-серверов через FastMCP. Это уже не демо-чат, а инфраструктура вокруг агентных систем.
Если вы собираете не одного бота, а цепочку инструментов, стоит изучить подход. Детали помогают понять, какие части агентного стека стоит измерять до того, как винить модель.
@tproger
Читайте также в VK, Max и Дзен
❤8😢2❤🔥1🤩1🐳1🤣1😇1😨1🎄1🤪1😘1
MCP-сервер, который лечит галлюцинации документации
У AI-ассистента есть неприятная привычка: он уверенно вспоминает API из старой версии библиотеки и пишет код, который выглядит правдоподобно до первого запуска. Grounded Docs MCP Server предлагает скучное, но сильное решение: дать ассистенту свой актуальный индекс документации.
Проект позиционируется как open-source альтернатива Context7, Nia и Ref.Tools. Идея в том, чтобы локально собрать документы, держать их свежими и отдавать через MCP в инструменты кодинга, вместо того чтобы просить модель угадывать сигнатуры из памяти.
Можно посмотреть, как устроен такой сервер и какие сценарии он закрывает. В деталях особенно полезна мысль: качество AI-кода часто упирается не в модель, а в источник контекста.
@tproger
Читайте также в VK, Max и Дзен
У AI-ассистента есть неприятная привычка: он уверенно вспоминает API из старой версии библиотеки и пишет код, который выглядит правдоподобно до первого запуска. Grounded Docs MCP Server предлагает скучное, но сильное решение: дать ассистенту свой актуальный индекс документации.
Проект позиционируется как open-source альтернатива Context7, Nia и Ref.Tools. Идея в том, чтобы локально собрать документы, держать их свежими и отдавать через MCP в инструменты кодинга, вместо того чтобы просить модель угадывать сигнатуры из памяти.
Можно посмотреть, как устроен такой сервер и какие сценарии он закрывает. В деталях особенно полезна мысль: качество AI-кода часто упирается не в модель, а в источник контекста.
@tproger
Читайте также в VK, Max и Дзен
👍10🍌5💯2🍓2👎1🏆1🤨1🤓1👻1🙈1🦄1
Forwarded from Нейроканал
Коллеги из Tproger собрали подборку облачных GPU-провайдеров для ML на 2026 год. Внутри — какие карты реально доступны у разных провайдеров (от Tesla T4 до H200 и B300), под какие сценарии берут конкретные конфигурации и сколько это стоит за час аренды.
Рекомендую, пишут про решения, которыми я лично пользуюсь.
@neuro_channel (теперь ещё в VK и Max)
Рекомендую, пишут про решения, которыми я лично пользуюсь.
@neuro_channel (теперь ещё в VK и Max)
Tproger
Облачные GPU для ML в 2026 году: где арендовать сервер для нейросетей
Разбираем облачные сервисы с GPU на 2026 год. Сравнение инфраструктуры, доступные видеокарты (от T4 до H200) и реальные цены на инстансы для ML и инференса.
1👍6👎5🤪3🔥2🤔2😘2❤🔥1🏆1👨💻1😨1🫡1
Как искать инвестиции и партнёров для своего проекта? И как получить первых клиентов?
Если эти вопросы вас волнуют, приходите в онлайн-школу МФТИ «Предпринимательское планирование: от идеи до бизнес-модели».
За пять недель вы соберёте проектное предложение, с которым можно идти на разговор с инвестором, заказчиком или соучредителем.
Вас ждёт:
— Обучение в малой группе из шести человек.
— Живое общение с двумя преподавателями-практиками, подробный разбор проектов.
— Пересборка мышления с постоянной доработки продукта на проектирование компании.
Школа стартует через неделю, 1 июня.
Посмотреть программу и записаться: techpredschool.ru
Если эти вопросы вас волнуют, приходите в онлайн-школу МФТИ «Предпринимательское планирование: от идеи до бизнес-модели».
За пять недель вы соберёте проектное предложение, с которым можно идти на разговор с инвестором, заказчиком или соучредителем.
Вас ждёт:
— Обучение в малой группе из шести человек.
— Живое общение с двумя преподавателями-практиками, подробный разбор проектов.
— Пересборка мышления с постоянной доработки продукта на проектирование компании.
Школа стартует через неделю, 1 июня.
Посмотреть программу и записаться: techpredschool.ru
2👍6🤨5🌭3🦄3❤🔥2☃2🤯1💯1😨1🙉1👾1
Свой AI-агент без магии: CRUD-подход, память и инструменты
Когда говорят «агент», легко представить огромную платформу, которую страшно трогать без команды ML-инженеров. Автор FastStream и мейнтейнер AG2 предлагает инженерный взгляд: агент состоит из понятных частей, а не из чёрного ящика.
В разборе OpenClaw используется как повод показать базовую конструкцию: модель, инструменты, контекст, память, интеграции и правила выполнения. Смысл не в том, чтобы срочно писать свой фреймворк, а в том, чтобы перестать бояться архитектуры агентов.
Если хочется разобрать агентную механику на пальцах, материал хорошо работает как инженерная карта. Детали помогут отличить полезную автоматизацию от красивой кнопки «сделай всё».
@tproger
Читайте также в VK, Max и Дзен
Когда говорят «агент», легко представить огромную платформу, которую страшно трогать без команды ML-инженеров. Автор FastStream и мейнтейнер AG2 предлагает инженерный взгляд: агент состоит из понятных частей, а не из чёрного ящика.
В разборе OpenClaw используется как повод показать базовую конструкцию: модель, инструменты, контекст, память, интеграции и правила выполнения. Смысл не в том, чтобы срочно писать свой фреймворк, а в том, чтобы перестать бояться архитектуры агентов.
Если хочется разобрать агентную механику на пальцах, материал хорошо работает как инженерная карта. Детали помогут отличить полезную автоматизацию от красивой кнопки «сделай всё».
@tproger
Читайте также в VK, Max и Дзен
❤13👍3😎3👎2🗿2🥰1😱1😢1🍓1💋1😨1
This media is not supported in your browser
VIEW IN TELEGRAM
Стрим о защите контейнеров, который нельзя пропустить
Что реально угрожает контейнерным приложениям сегодня и как это отражается на их жизненном цикле?
Dev friendly контейнерная безопасность: shift-left с помощью Kaspersky Container Security и не замедлять релизы?
Какова роль ИИ в защите контейнеров?
Настоящее и будущее контейнерных сред обсудят эксперты «Лаборатории Касперского» и платформы «Штурвал» 28 мая в 11:00.
Чтобы не пропустить, регистрируйтесь.
Это #партнёрский пост
Что реально угрожает контейнерным приложениям сегодня и как это отражается на их жизненном цикле?
Dev friendly контейнерная безопасность: shift-left с помощью Kaspersky Container Security и не замедлять релизы?
Какова роль ИИ в защите контейнеров?
Настоящее и будущее контейнерных сред обсудят эксперты «Лаборатории Касперского» и платформы «Штурвал» 28 мая в 11:00.
Чтобы не пропустить, регистрируйтесь.
Это #партнёрский пост
🎄4😁3⚡1👍1😢1💔1💋1😭1🤗1💘1😎1
Стройка уже во всю присматривается к ИИ, но до сих пор не понимает, как его внедрять
В строительстве уже дошли до знакомой айтишной стадии: демо работает, презентация красивая, а дальше начинается интеграция с реальными процессами, данными и ответственными людьми. Вот тут и начинаются трудности. По данным ДОМ․РФ и Сколково, 17% цифровых решений в отрасли уже используют ИИ, но в проектировании таких решений всего 3%. При этом в «ДОМ․РФ Технологии» ждут, что к 2028 году ИИ будет больше чем у половины девелоперов.
То есть проблема уже не в том, чтобы «прикрутить нейросеть». Это как раз нетрудно. Руководителям, проектировщикам и городским командам нужно понимать, где взять данные, какой процесс нужно менять и как правильно считать эффект. Москва с этим уже экспериментирует на уровне города: Сколтех и правительство Москвы развивают ИИ для градостроительства, а городской Центр ИИ сделал сервисы для планировок и цифрового нормоконтроля.
На этом фоне курс от Академии «ДОМ.РФ Технологии» и Сколтеха выглядит не как очередное «обучим нейросетям», а как симптом рынка. Два месяца онлайн или очный интенсив про данные, аналитику, ИИ-агентов и внедрение в операционные процессы. То есть ровно про ту часть, в которой сейчас возникла сложность в сфере.
#новости #ии
В строительстве уже дошли до знакомой айтишной стадии: демо работает, презентация красивая, а дальше начинается интеграция с реальными процессами, данными и ответственными людьми. Вот тут и начинаются трудности. По данным ДОМ․РФ и Сколково, 17% цифровых решений в отрасли уже используют ИИ, но в проектировании таких решений всего 3%. При этом в «ДОМ․РФ Технологии» ждут, что к 2028 году ИИ будет больше чем у половины девелоперов.
То есть проблема уже не в том, чтобы «прикрутить нейросеть». Это как раз нетрудно. Руководителям, проектировщикам и городским командам нужно понимать, где взять данные, какой процесс нужно менять и как правильно считать эффект. Москва с этим уже экспериментирует на уровне города: Сколтех и правительство Москвы развивают ИИ для градостроительства, а городской Центр ИИ сделал сервисы для планировок и цифрового нормоконтроля.
На этом фоне курс от Академии «ДОМ.РФ Технологии» и Сколтеха выглядит не как очередное «обучим нейросетям», а как симптом рынка. Два месяца онлайн или очный интенсив про данные, аналитику, ИИ-агентов и внедрение в операционные процессы. То есть ровно про ту часть, в которой сейчас возникла сложность в сфере.
#новости #ии
👎13✍11👍9❤8🤣6🔥4🤩1🐳1💯1🎃1🎄1
Сайт узнаёт ваши вкладки не через куки, а через SSD
Если вы думали, что приватность в браузере — это про куки, новая техника FROST добавит вам бессонницы. Вредоносный сайт создаёт гигабайтный файл в изолированном хранилище OPFS и измеряет задержки чтения вашего SSD. Когда другая вкладка обращается к диску, задержки меняются. Свёрточная нейросеть по этим колебаниям определяет, что именно у вас открыто.
Исследователи показали полноценную атаку на macOS с чипом M2, базовый примитив подтверждён на Linux. Пока это лабораторный proof-of-concept, но работает во всех основных браузерах без единого клика.
Если вы думали, что приватность в браузере — это про куки, новая техника FROST добавит вам бессонницы. Вредоносный сайт создаёт гигабайтный файл в изолированном хранилище OPFS и измеряет задержки чтения вашего SSD. Когда другая вкладка обращается к диску, задержки меняются. Свёрточная нейросеть по этим колебаниям определяет, что именно у вас открыто.
Исследователи показали полноценную атаку на macOS с чипом M2, базовый примитив подтверждён на Linux. Пока это лабораторный proof-of-concept, но работает во всех основных браузерах без единого клика.
👀28🎉2🦄2💊2🤷♂1❤🔥1👎1👏1🤩1😈1🙈1
Держите: Claude Opus 4.8 с fast mode втрое дешевле и сотнями параллельных агентов
Anthropic обновила флагман до версии 4.8 по той же цене, а для разработчиков главное новшество простое: режим fast mode теперь стоит втрое меньше и работает в 2,5 раза быстрее.
Модель заметно прибавила в надёжности. По оценкам Anthropic, Opus 4.8 в четыре раза реже молча пропускает собственные ошибки в коде. На бенчмарке Super-Agent она стала единственной моделью, дошедшей до конца во всех сценариях, и обошла GPT-5.5 при равной стоимости.
В Claude Code появились динамические рабочие процессы — теперь можно запускать сотни параллельных подагентов в одной сессии. Подробности на Tproger.
Anthropic обновила флагман до версии 4.8 по той же цене, а для разработчиков главное новшество простое: режим fast mode теперь стоит втрое меньше и работает в 2,5 раза быстрее.
Модель заметно прибавила в надёжности. По оценкам Anthropic, Opus 4.8 в четыре раза реже молча пропускает собственные ошибки в коде. На бенчмарке Super-Agent она стала единственной моделью, дошедшей до конца во всех сценариях, и обошла GPT-5.5 при равной стоимости.
В Claude Code появились динамические рабочие процессы — теперь можно запускать сотни параллельных подагентов в одной сессии. Подробности на Tproger.
❤15👀4⚡2👍2😢2💊2🕊1💯1💔1💘1😘1
Как RWB строит промышленный ИИ
На Inside AI Meetup команда RWB открыто рассказала, как выглядит промышленный ИИ на масштабе Wildberries: миллионы пользователей, десятки миллионов заказов, тысячи ML-сервисов и GPU.
Главный вывод неожиданный: серебряной пули нет. Нельзя просто взять правильную модель и получить готовый продукт. Сначала данные, архитектура, инфра, 100500 экспериментов — и только потом, возможно, что-то полетит.
Из интересного:
• AIOps у RWB сработал не потому, что там волшебный ИИ, а потому что команда выстроила нормальную автоматизацию.
• LLM не спасает, если в данных хаос: сырые отзывы, вопросы и описания товаров нельзя просто скармливать модели — их надо сначала привести в нормальный вид.
• А еще LangChain, по версии RWB, хорош для прототипов, но в продакшене может превратиться в болото абстракций. Там уже решают vLLM, Triton, token-aware routing, KV-cache routing и скучная инженерка.
В общем, ИИ — это дорогое, сложное и очень инженерное продолжение старой доброй автоматизации.
Полный обзор митапа читайте на Tproger
На Inside AI Meetup команда RWB открыто рассказала, как выглядит промышленный ИИ на масштабе Wildberries: миллионы пользователей, десятки миллионов заказов, тысячи ML-сервисов и GPU.
Главный вывод неожиданный: серебряной пули нет. Нельзя просто взять правильную модель и получить готовый продукт. Сначала данные, архитектура, инфра, 100500 экспериментов — и только потом, возможно, что-то полетит.
Из интересного:
• AIOps у RWB сработал не потому, что там волшебный ИИ, а потому что команда выстроила нормальную автоматизацию.
• LLM не спасает, если в данных хаос: сырые отзывы, вопросы и описания товаров нельзя просто скармливать модели — их надо сначала привести в нормальный вид.
• А еще LangChain, по версии RWB, хорош для прототипов, но в продакшене может превратиться в болото абстракций. Там уже решают vLLM, Triton, token-aware routing, KV-cache routing и скучная инженерка.
В общем, ИИ — это дорогое, сложное и очень инженерное продолжение старой доброй автоматизации.
Полный обзор митапа читайте на Tproger
❤14🔥4🍾4🎄3😨2👎1🙏1🏆1🎃1🤝1🗿1