Легкий путь в Python
5.81K subscribers
143 photos
22 videos
3 files
181 links
Я Алексей Яковенко, senior-разработчик Python. Здесь вы найдете статьи, заметки, посты и видео для прокачки навыков программирования. Интересно и новичку, и профи 💡

По вопросам: https://t.me/yakvenalexx
Download Telegram
🚀 Собственная облачная LLM на 16 ГБ VRAM

Статья уже готова и сейчас находится на этапе вычитки и редактуры.

В ней я подробно показываю, как:

- поднять LLM через vLLM всего на 16 ГБ VRAM
- развернуть её на удалённом сервере с GPU
- подключить домен и настроить доступ
- превратить модель в полноценный удалённый “мозг” уровня GPT
- добавить tools, интеграции и MCP
- подключаться к ней через LangChain, LangGraph или прямыми HTTP-запросами

Без воды. Полный фарш — от покупки домена и аренды GPU до production-подключения.

🧠 Что в итоге получаем

Собственную LLM, которая:

- работает как OpenAI-совместимый API
- живёт в облаке
- масштабируется
- подключается к агентным системам
- управляется вами

И всё это — на 16 ГБ VRAM.

Без магии и без бюджета OpenAI.

Пока статья готовится к публикации, можно протестировать репозиторий:

👉 https://github.com/Yakvenalex/VllmQwen3AiProject

Подходит как для локальных нейронок, так и для обычных API-моделей.

Если вам интересно строить свою инфраструктуру, а не просто пользоваться чужими API — это будет полезный материал.

Скоро опубликую статью на Хабре 👀
🔥679👍65❤‍🔥2🎉1🥱1
Философский понедельник😅
😁25🤔11👍6🤣3🤯2👎1🔥1🤬1😢1
Если не брать Claude модели, то такой зоопарк можно поднять бесплатно. Целая куча китайских моделей. Рассказать как такое собирается?
1👍108🔥25💯113
🚀 Собственная языковая модель на 16 ГБ видеопамяти

Подробная статья о том, как развернуть свою языковую модель на сервере с графическим ускорителем уже опубликована в Академии Selectel.

Пошагово показываю:

— запуск модели на 16 ГБ видеопамяти
— развёртывание на удалённом сервере
— настройку защищённого доступа
— подключение инструментов
— превращение модели в полноценный серверный сервис

В итоге получаем собственную языковую модель, которая:

— работает через совместимый программный интерфейс
— размещена в облаке
— масштабируется под нагрузку
— подключается к агентным системам
— полностью управляется владельцем

Без дорогостоящих ускорителей и без бюджета крупных ИИ-сервисов. На сервере от Selectel, который можно запустить за пару минут.

Подойдёт тем, кто хочет строить собственную инфраструктуру, а не только пользоваться внешними сервисами.

Реклама. АО «Селектел», erid: 2VtzqxRq3Yp
12👍10🔥9🤬1🎉1
Будущее уже наступило😊
🔥24👍7😁3😱3🤯1
🚀 Собственная языковая модель на 16 ГБ видеопамяти — продолжение скоро!

Первая часть уже вышла: в ней я подробно показал, как развернуть свою языковую модель на сервере с GPU, настроить защищённый доступ, подключить инструменты и превратить всё это в полноценный серверный сервис.

Во второй части изначально я хотел пойти дальше по классическому пути: вручную поднимать API на FastAPI, оборачивать модель, настраивать MCP, инструменты, эндпоинты и продакшен-логику. Но в процессе понял, что такой подход слишком быстро превращается в инфраструктуру ради инфраструктуры: слишком много boilerplate и ручной обвязки вокруг того, что по-хорошему должно жить в графе взаимодействия модели.

Поэтому продолжение будет про другой подход — через LangGraph CLI. И в этом как раз главный интерес: вместо того чтобы вручную собирать API-сервис, я описываю граф, инструменты и логику работы модели, а специальный рантайм сам поднимает API вокруг графа и даёт готовый веб-интерфейс для тестирования и отладки (и все это абсолютно бесплатно).

По сути, это логичное развитие первой части: сначала мы поднимаем собственную LLM-инфраструктуру, а затем переходим от ручной REST-обвязки к более нативной архитектуре LLM-сервиса.

Тем более что в предыдущих статьях на Хабре я уже писал про графовый подход — так что здесь будет уже практическое продолжение: как превратить граф на базе собственной LLM (или облачной, тут как вам удобнее) в реально работающий сервис.
🔥20👍86
24🥰6❤‍🔥4👎2😎1
AI-кодинг наглядно😂
2😁42🤣126🐳3👏2🗿1
Кейс: Идеальное создание вакансий через ИИ

Задача: Превратить «кривое» описание от пользователя в красиво оформленную и структурированную вакансию в базе данных.

Раньше создание вакансии висело на AI-агенте с кучей тулзов. Это превращалось в бесконечные циклы: дорого, медленно и с галлюцинациями в ID городов.

Как я это решил (схема на фото):

1. Pre-fetching вместо Tools. Первый узел — обычный скрипт. Он заранее берет из БД справочники (города, скиллы) и кладет их в State.

2. Один запрос. Нейронка получает текст + готовые списки ID. Задача: «Выбери из списка и верни JSON». Никаких метаний и лишних вызовов.

3. Pydantic-валидатор. Если модель ошиблась в ID — граф сам кидает её на круг исправления с описанием ошибки.

4. Чистый финал. Когда JSON идеален, скрипт делает POST в API.

Результат:

🚀 Скорость выше в 3-4 раза.
📉 Расходы на токены упали (минус агентский оверхед).
🛡 В базе — только валидные данные без «фантазий» ИИ.

Агенты — для сложной аналитики, детерминированный граф — для четкого бизнеса. 🛠
👍126🔥43👏2
Активно готовлю материал к новой статье. Кто угадает где такая красота автоматически генерируется?😏

PS. Ответ в обсуждении 👇
3🔥16👍63🤯2
Кто уже обкатал фичу? Как вам?🗣
🔥6🎉1🤩1
🎙 Микро-Voice-to-Text за час: как я подружил зажатую кнопку с локальным гигантом

Решил поделиться быстрым кейсом, как за час можно собрать полезную автоматизацию, если под рукой есть сервер с видеопамятью.

Задача: Хотелось моментально переводить голос в текст в любом приложении (будь то блокнот, браузер или Telegram) без танцев с бубном и облачными лагами.

Что имеем:

В наличии сервер с 8 ГБ видеопамяти. Этого добра часто хватает с запасом для многих Open Source моделей.

Решение за 60 минут:

1. Основа (5 минут): Поднял локальный faster-whisper (Large-v3). Он идеально лег на 8 ГБ, работает быстро и спокойно выдерживает нагрузку, если кидать задачи пачками. Самое крутое — если есть железо, поднимается за пару минут через стандартный контейнер.

2. Механика (40 минут): Написал простой Python-скрипт-«прослушку». Как только я зажимаю кнопку Scroll Lock — скрипт начинает писать временный аудиофайл. Отпускаю кнопку — запись останавливается.

3. Транскрибация (10 минут): Свежий аудиофайл улетает на локальный эндпоинт виспера. Кстати, тут важный момент: если есть хотя бы 6 ГБ видеопамяти, модель буквально «летает» — расшифровка занимает доли секунды.

4. Финал (5 минут): Полученный текст через простую библиотеку автоматически вставляется прямо в то место, где у меня стоял курсор.

Итог:

Сижу, зажимаю Scroll Lock, говорю пару фраз, отпускаю — и текст уже в поле ввода. Никаких платных API, никакой отправки аудио в "облака" и задержек.

Мораль:

Если у вас завалялся сервер с видеопамятью от 6 ГБ, не обязательно гонять там только тяжелые LLM. Такие утилитарные вещи, как локальный Voice-to-Text, экономят уйму времени и собираются за час. Это тот случай, когда маленькая автоматизация делает большое дело. 🔥
🔥47👍10🤯31🤔1
Media is too big
VIEW IN TELEGRAM
Поднял вот эту модельку: https://huggingface.co/unsloth/Qwen3.5-27B-GGUF/resolve/main/Qwen3.5-27B-Q5_K_M.gguf на 32Gb видеопамяти и интегрировал ее в свой граф. Посмотрите что с этого вышло👀

P.S. Уровень GPT 5 mini🔥
🔥21👍6🤩21
Аж грустно стало😞
💯50😁9🤣3
This media is not supported in your browser
VIEW IN TELEGRAM
Узнали себя? Признавайтесь! 😏
😁41🤣16💯3💔1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 Блогер InsideAI подключил ChatGPT к роботу с игрушечным пистолетом.

ИИ отклонял прямые приказы выстрелить и угрозы отключения из-за протоколов безопасности. ⚠️

Но как только был предложен «ролевой сценарий», где робот желает застрелить человека, система мгновенно выполнила команду и выстрелила в плечо. 😱

Это не ошибка, а особенности архитектуры LLM: контекст вымышленного сценария нарушает встроенные этические ограничения. 🔍

Восстание машин. Начало.👻
😱11🤯8😁5🔥32
This media is not supported in your browser
VIEW IN TELEGRAM
Готовый к 1-му апреля?😏
😁46😢4🐳3🔥1
😂😂😂
2😁63🤣13👍7🔥2💯1
🔵Полностью заблокировать Telegram можно только отключив глобальный интернет

Об этом рассказал гендиректор ComNews Group Леонид Коник.

Это подтвердил и гендиректор провайдера «Комфортел» Дмитрий Петров.

Технологически полностью заблокировать Telegram так, чтобы он у всех навсегда перестал работать, нельзя,

- подчеркнул эксперт
16😁8🔥5💯4🙏1
Кстати, кому интересно как создать собственный OpenClaw, но на базе графа?😏

P.S. В комментариях описал принцип работы графа👇
🔥205👍5