Прийти в айти
12 subscribers
30 photos
1 video
1 file
10 links
Личный блог. Юрист, решивший сменить профессию и погрузиться в разработку.
Download Telegram
Что с технической точки зрения представляет zemuch.ru?

1) Это парсер, который собирает данные с torgi.gov.ru, дополняет их данными с публичной кадастровой карты и сохраняет все в базу.
2) Для веб сайта – это фреймворк Django, который по разным адресам выдает разные странички) Где-то заранее сделанные (главная, например), где-то берет нужное из базы данных и отображает (участки, блог, избранное)
3) Картинки – сгенерированы нейронкой)) (и часть текста переписана другой). Так что можно смело говорить AI-based)))
Я обещал рассказать про парсинг - вкратце это сделали за меня))
Forwarded from Selectel Newsfeed
Бывают задачи, когда нужно автоматизировать сбор и анализ данных из разных источников.

Этот процесс называют парсингом и его легко реализовать на Python. В карточках рассказываем, что для этого нужно ➡️

Подписывайтесь на телеграм-канал @Selectel, чтобы не пропускать новые материалы и подборки 🏢
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🚀 От юриста до специалиста по Data Governance: мой путь в IT

Привет, друзья! 👋

Давно меня чего-то тут не было🙄
Надо вспомнить, о чем вообще этот канал..)
О! О том, как я из юристов решил стать программистом (даже шутки за 300 можно не переписывать почти, круто же, да?))
И знаете что? Это было одно из самых крутых решений в моей жизни!
Полгода я уже практикующий разработчик в банке. Официально - Разработчик систем хранения. По факту немного другое - один из сопровождающих инженеров-разработчиков системы управления данными - Data Governance.
DG включает в себя контроль над основными понятиями банка, качеством данных и помогает банку наращивать, систематизировать и сохранять знания и экспертизу.

Сегодня я хочу поделиться своей историей и вдохновить тех, кто, возможно, тоже мечтает о смене профессии, но боится начать.


### Почему Data Governance?
Data Governance — это не просто про данные. Это про то, как сделать так, чтобы данные стали ценным активом для компании. В банке, где я сейчас работаю, это особенно важно: здесь данные должны быть точными, защищёнными и доступными для принятия решений.
(Хотя конечно туда позвали, я и пошёл 😆)

### Что я освоил за этот год
1. Python — мой главный инструмент для автоматизации процессов, работы с данными и создания скриптов. Просто питон, pandas (хотя им конечно в основном просто перебираю эксельки), fastapi ( отдельный ван лав, делаем на нем внутренний портал данных, быстро работает и быстро разрабатывается), ml (как сделать rag систему за 1 месяц и 1 разработчика - тема для отдельного поста)
2. Linux — научился работать в командной строке, настраивать серверы и управлять системами. Очень подтянулся по навыкам управления системой через консоль (5 серверов в управлении - это вам не хухры-мухры, даже с основной системой на линухе дома)
3. Базы данных — углубился в SQL, изучил принципы проектирования баз данных и оптимизации запросов. Причём иногда сэкуэль заставляет больше всего подумать


### Что было сложнее всего?
Переход из гуманитарной сферы в техническую — это вызов. Особенно поначалу, когда каждая команда в Linux или строка кода на Python казалась чем-то невероятно сложным. Но я быстро понял, что главное — это не бояться задавать вопросы, искать информацию и постоянно практиковаться. Всю информацию можно найти, усвоить, осознать. Надо только потратить ряд жопочасов..)) у меня на это ушло около 3 лет, и я бы не верил курсам, обещающим прийти в айти за пару месяцев.

### Советы тем, кто хочет повторить
1. Не бойтесь начинать с нуля. Да, будет сложно, но это того стоит.
2. Учитесь каждый день. IT — это сфера, где нельзя стоять на месте. Потом поищу максимальную серию на степике, но это несколько месяцев точно))
3. Освойте Python и Linux. Эти навыки открывают двери в мир данных. Linux ваще тема.
4. Ищите менторов и единомышленников. Поддержка очень важна. Ментор может помочь определиться с планом учения и работы над собой. У меня не было, и думаю, зря. Было бы проще и быстрее.
5. Верьте в себя. Все достижимо. Все.


#DataGovernance #Python #Linux #IT #Карьера #Переквалификация
🔥2
🚀 Локальная LLM на своём ПК: дешевле, чем кажется?

Привет, коллеги! 👨💻 Сегодня разберём, как собрать систему для запуска локальных языковых моделей (LLM) типа Llama 3 или Mistral без облаков и подписок. И да, это реально даже на бюджетном железе!

### Зачем локальная LLM?
- Конфиденциальность: Ваши данные не утекают в облако.
- Кастомизация: Модель можно дообучать под свои задачи (даже для анализа договоров, как мы, бывшие юристы, любим 😉).
- Оффлайн-работа: Не нужен интернет — идеально для чувствительных задач.

### Собираем систему за ~65 000 ₽
Пример конфига для запуска моделей до 13B параметров (например, Llama 3 8B или Mistral 7B):

1. CPU: Xeon E5-2678 v3 (12 ядер / 24 потока) — ~12 000 ₽ (б/у).
2. Материнка: Серверная плата на LGA 2011-3 — ~7000 ₽.
3. Видеокарта: NVIDIA RTX 3060 Ti (8 ГБ VRAM) — ~25 000 ₽ (б/у).
4. ОЗУ: 64 ГБ DDR4 ECC — ~12 000 ₽.
5. SSD: 1 ТБ NVMe — ~5000 ₽.
6. БП: 600 Вт — ~4000 ₽.
7. Охлаждение: Кулер + корпус — ~3000 ₽.

Итого: ~65 000 ₽ (цены за б/у компоненты, новые — дороже).

### Почему именно Xeon и 3060 Ti?
- Xeon: Много потоков за копейки (спасибо рынку б/у серверного железа).
- RTX 3060 Ti: 8 ГБ VRAM хватает для моделей до 13B в 4-битной квантовке. Для 7B-моделей — вообще «летает».

### Что можно делать?
- Генерировать текст, анализировать документы, писать код.
- Запускать PrivateGPT для работы с локальными файлами.
- Допиливать модели под свои нужды (например, для юридических шаблонов).

### Альтернативы для экономных:
- Если 8 ГБ VRAM мало — ищите RTX 3090 (24 ГБ) б/у, но это уже +50 000 ₽.
- Для моделей 7B хватит даже GTX 1660 Super (6 ГБ) за 15 000 ₽.

### Итог
Локальные LLM — не фантастика. За 65-70 тыс. рублей можно собрать систему, которая потянет большинство opensource-моделей. И да, это окупится, если вы работаете с данными, где важна безопасность.

А вы уже пробовали локальные LLM? Или пока ждёте, когда ChatGPT научится читать мысли? 😄

#AI #LLM #SelfHosted #Hardware #IT

P.S. Если нужна помощь с подбором железа — пишите в комменты. Помогу, как юрист, переквалифицировавшийся в IT-шника! 🛠️
Кстати, пост сгенерирован ллмкой, но вся инфа верна) ну цены могут скакать, но за около 60 тыс рублей реально собрать компутер для запуска аи чата дома . не на максималках, но все же)
"Проебываться - это тоже софтскилл.

Доброе утро, коллеги"

Нашел шутку на морях этих ваших интернетов.
Или коротко о работе в айти😂

На самом деле нет, это не так. Я вот три дня работаю с 8 до 9 ( и это не 9 утра, это 21 вечера).но это, конечно, редкость, к счастью))

На самом деле обычный день выглядит так: в 9 читаю почту и сообщения, в 10 Дейли ( ежедневная встреча команды и обсуждение текущих вопросов и задач), дальше весь день или решение задач, или иногда еще встречи с командой/другими командами /мероприятия общебановские / мероприятия от hr / еще созвоны. На них я чаще отдыхаю, тк просто сижу и слушаю обычно🙈))
Чего-то давно меня тут не было)
Кажется, кто-то обещал поддерживать блог, но ой...

На самом деле, что-то как-то я погрузился в реал и на написание как-то времени не осталось((

Я все также айтишник, как не странно)))
Только теперь Senior. С уклоном в fullstack... Так получилось))все там же в банке в Data Governance.

Но приятно, что наш начальник дата офиса ценит наши разработки))) мой код (преимущественно, последнее время ещё появились помощники)), видиние продукта - наши лидеры, дизайн - тоже))


Но сделали реально крутые вещи. Data Portal становится реально порталом в данные. Сделали создание проверок качества данных на базе документации, сделали автоматический (почти) data и business lineage (все вендоры говорили, что это невозможно... А мы сделали))), начинаем делать данные краеугольным камнем в процессах архитектуры и ИБ)

А ещё у меня родилась дочь))) и это прям радость-счастье-милота)))
2
Идея для первого коммерческого проекта: Бот-наполнитель Telegram-каналов

Когда я переходил из юриспруденции в разработку, главным страхом был: "А найду ли я первую работу без опыта?". Сейчас, будучи сеньором, я понимаю: лучший кейс для портфолио — это работоспособный и монетизируемый проект.

Вот идея, которую я бы с радостью реализовал тогда. Она не требует выхода за пределы Telegram, что делает её идеальной для старта.

Суть идеи: Бот, который кормит каналы контентом из самого Telegram

Проблема: ведение канала — это труд. Постоянно нужно искать, что публиковать. Решение: бот, который автоматически находит релевантный контент в других уголках Telegram и предлагает его вам.

Как это будет работать (Техническое ядро):

1. Источники — другие Telegram-каналы.
· Владелец канала добавляет бота в закрытую группу/канал "Наблюдателей".
· Бот мониторит десятки-сотни каналов-доноров по заданной тематике (конкуренты, смежные ниши, новостные паблики).
2. Фильтрация и анализ.
· Бот анализирует посты-доноры: количество просмотров, реакций, комментариев. Находит "живые" темы.
· Фильтрует по ключевым словам и исключает слова (например, "скачать", "халява").
· Определяет тип контента: текст, фото, видео, ссылка.
3. Формирование контент-плана.
· Бот не просто копирует, а готовит черновик поста. Например: "Нашёл в канале "N": [Тема]. Высокая активность (XX комментариев). Предлагаю сделать обзор/запостить с указанием источника/поднять дискуссию".
· Складывает эти заготовки в отдельный канал или выдает списком админу на модерацию.

Почему это проще, чем кажется?

· API Telegram Bot API и библиотека python-telegram-bot — твои лучшие друзья.
· Не нужно парсить сайты, бороться с капчей. Вся работа внутри одной экосистемы.
· Логика на Python: циклы, условия, работа с JSON. Уровень сложности — уверенный джун.

А где здесь деньги? Модели монетизации для старта:

1. Фримиум: Базовая функция — 3 источника для мониторинга. Платная подписка — 50+ источников, приоритетная очередь, продвинутая аналитика.
2. Единоразовая продажа "настройки под канал". Ты не продаешь код, ты продаешь услугу по его настройке и запуску для конкретного клиента.
3. "Контентный паек": Продажа готового, уже отсортированного потока идей из проверенных источников для конкретной ниши (например, "IT-новости", "Маркетинг для малого бизнеса").

Почему это крутая идея для начинающего?

· Решает реальную боль. Ты не просто пишешь "еще одного бота", а создаешь инструмент для бизнеса.
· Потрясающее портфолио. Рабочий проект с реальными пользователями (пусть и 2-3) на собеседовании стоит 10 абстрактных пет-проектов.
· Полный цикл разработки: от идеи и ТЗ до реализации, "продажи" и поддержки.

Эта идея — отличный трамплин. Она не сделает тебя миллионером, но даст бесценный опыт, уверенность и, возможно, первые деньги в IT.

Как думаете, какой функционал был бы самым ценным в таком боте? И какие каналы вы бы сами стали мониторить?

#стартвIT #python #telegrambot #идеядляпроекта #портфолио #монетизация #junior
🔥1
AI-мозги для бота: как ИИ может прокачать ваш контент-генератор для Telegram

Когда я писал про идею бота для наполнения каналов, многие спросили: «А можно ли это сделать по-умному, с ИИ?». Отвечаю: не можно, а нужно! AI — это как нанять супер-ассистента, который не просто собирает, но и осмысливает контент.

Без AI vs С AI

Было (просто бот):

· Фильтрует посты по ключевым словам
· Считает реакции
· Копирует заголовки

Стало (AI-бот):

· Понимает смысл и контекст постов
· Находит скрытые тренды
· Генерирует уникальные формулировки
· Дает рекомендации на основе семантического анализа

Конкретные примеры применения AI в боте:

1. Умное резюмирование

# AI может делать вот такие выжимки:
"В исходном посте 500 слов о преимуществах Python. Ключевые тезисы:
1) Простота синтаксиса
2) Большое сообщество
3) Универсальность"

1. Переработка контента под ваш стиль

· "Перепиши этот пост в более провокационном стиле"
· "Сделай краткую версию для Stories"
· "Адаптируй под аудиторию начинающих разработчиков"

1. Генерация идей на основе трендов

· "На основе 100+ проанализированных постов выявлен растущий интерес к WebAssembly"
· "Предлагаем сделать серию постов про миграцию с Python 3.9 на 3.11"

1. Автоматизация рубрик

· "Понедельник: разбор кода"
· "Среда: новости экосистемы"
· "Пятница: карьерные советы"

Техническая реализация — проще чем кажется:

· OpenAI API или YandGPT для работы с текстом
· Hugging Face для готовых NLP-моделей
· LangChain для создания сложных цепочек обработки

Пример кода для рерайта поста:

async def rewrite_post(original_text, style="professional"):
prompt = f"Перепиши этот текст в {style} стиле: {original_text}"
response = await openai.ChatCompletion.acreate(
model="gpt-4",
messages=[{"role": "user", "content": prompt}]
)
return response.choices[0].message.content

Почему это game-changer для монетизации:

1. Уникальное предложение — конкуренты просто копируют, вы — преобразуете
2. Выше ценник — AI-функции оправдывают премиальную стоимость
3. Лучшее качество — контент становится уникальным, а не репостным

Сложности, которые стоит учесть:

· Токены API — считайте бюджет заранее
· Качество генерации — нужен человеческий контроль
· Этический момент — прозрачность использования AI

Вывод:
AI превращает простой агрегатор в интеллектуальную контент-фабрику.Это тот случай, когда технологии действительно создают новую ценность, а не просто автоматизируют рутину.

А вы использовали AI в своих проектах? Какие задачи делегируете нейросетям?

#ai #python #telegrambot #ии #chatgpt #openai #разработка #нейросети #автоматизация

---

P.S. Такой проект уже не просто «бот», а серьезный SaaS-продукт. Идеально для портфолио и реального бизнеса!
🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥1
Айти в банке - концерты зиверт на корпоратив 😂
🔥1
Итоги года: мой персональный микс

Поймал себя на мысли, что в этом году моя лента удивительно бедна традиционными «итогами года». Решил исправить ситуацию и заполнить этот новогодний слот своим собственным микшом событий. Год выдался на редкость насыщенным, полным контрастов и, без сомнений, уникальным.

Трек «Карьера: драйв и признание»
На профессиональном фронте— настоящий прорыв. Меня включили в топ-40 лучших сотрудников нашего Банка, что само по себе невероятно круто! А внутри команды удостоился почти что авторской номинации: «За то, что готов работать, когда организм говорит не работать». Приятно, когда твою преданность делу замечают. Ещё один важный рубеж: в начале года я официально получил статус Senior разработчика. Теперь с чистой совестью могу писать в профиле: fullstack-dev-mlops — звучит солидно!

Трек «Семья: ноты радости и заботы»
Главное событие года— в мае у нас родилась дочь! Это совершенно новый, прекрасный и ответственный уровень жизни. Правда, недавно на осмотре у неё обнаружили астигматизм. Теперь наш график дополнен поездками к офтальмологам. Врачи успокаивают, что ситуация не критичная, но внимания, конечно, требует.

Трек «Здоровье: проверка на прочность»

Пока жив,здоров и полон планов. Но… есть одно «но», которое пришлось принять. Летом (в июле-августе) организм устроил неожиданный стресс-тест. Диагноз — рассеянный склероз, неврологическое аутоиммунное заболевание. Отношусь к этому с попыткой сохранить чувство юмора: попросил друзей в записной книжке сменить мой ник на «Склеротик» 🙂 Главное — не сдаваться: пляшем под эту новую музыку и методично лечимся. Единственное, что омрачает, — осознание, насколько в нашей реальности дорого болеть: дорогие не только врачи и анализы, но и официальное оформление больничного, которое бьет по бюджету.

Трек «Музыка: саундтрек года»
На фоне всей этой какофонии событий,самому играть почти не получалось. В основном — слушал. Хотя пару набросков всё-таки создал в коллаборации с нейросетью Suno (которая, кстати, просто офигенная!)). Может, в следующем году из этого что-то вырастет.

Вот такой вышел год — яркий, сложный, разный.(кто делал, чтобы новый год был интереснее?)) Но однозначно прожитый не зря. Встречаем новый!
3🍾2🔥1🙏1
Планы
Закончившийся оливье и опустошенные бутылки из под шампанского - хороший повод подумать о будущем)
Начал составлять списочек)) (кстати, в телеграмм можно создавать списки задач в избранном - чем не личный таск-трекер?)
Одна из целей - профессиональное развитие. Решил попробовать ещё один язык - популярный, быстрый (хотя у меня есть некоторая предвзятость после любимого питона))) - Go или Golang.
Интересно, За что его так любят))
Попробуем сделать из этого лёгкое шоу - учить почти в прямом эфире))
З.ы. - на скриншоте-этот же текст, только переписанный встроенным в honor 400 pro ai... Скоро все будет делаться роботами))
1🔥1