IT для гуманитариев
41 subscribers
9 photos
2 videos
14 links
Download Telegram
Написал статью на основе своего курсача и переживаешь, что почти не будет рецензий? Ребята из Японии и США придумали лайфхак специально для тебя😉

Просто берешь и прячешь промпты для ИИ в своих трудах, а они найдут правильные слова для твоего шедевра🤌
В общем, пользуйся на здоровье, пока твой научник про это не знает🤭
Тут подробнее про суть проблемы: https://habr.com/ru/news/925408/
👍1
Очередной оффтоп из айти мира🔥
Но для начала немного предыстории...

В далеком 2024 году, когда я заканчивал магистратуру, тема моей ВКР звучала примерно так "Оценка финансовых данных с помощью методов глубинного обучения". Если проще, то оценка финансового положения компания с помощью обучения нейросетей. Если на примерах, то ожидалось примерно следующее: мы передаем алгоритму документы с финансовыми отчетностями компании, а он нам говорит, что ждет компанию в будущем, и что с ней сейчас.
Основная проблема в ВКР заключала именно в обработке данных, ведь эти отчетности кто-то на коленке написал, кто-то бережно отсканировал, у кого-то все нормально и она текстом) И данные в этих pdf файлах разные: картинки, тексты и таблички. По сути, половину времени я потратил на извлечение данных😞

Но что я вижу сейчас, переходя на главную страницу гитхаба, ЧУДО!!! Microsoft выпустила крутой пакет для питона, способоный переводить любой мусор во внятный текст🥳🥳🥳 Основная цель этого тула именно в подготовке данных для передачи в лингвистические модели или другие нейросети! Кушает это чудо всякие форматы, даже Youtube URLs

В общем, ловите: https://github.com/microsoft/markitdown
🔥8
Немного оффтопа🔥

Участвовал в конференции IT&Innovations Forum 2025
Это про что? Здесь были представители от IT компаний и CEO различных ритейлеров. Представители бизнеса искали новые идеи для себя, обменивались опытом и изучали айти продукты, которые прямо сейчас могут купить и начать пользоваться.
Айтишники представляли свои стенды или просто бесцельно шатались. Общались, нетворкались и пытались продать свои продукты💵

Мы были со стороны айти и предлагали свой сервис построения рекомендаций. Он уже работает у нас в различных компаниях холдинга, поэтому выходим на рынок📈 Если вам такое надо, пишите, звоните, о цене договоримся😉

Были и различные доклады. Очень уж много про ИИ, нейросети, AI, как удобно. ИИ, ИИ, мы тут ИИ всунули, здесь ИИ применили, сократили издержки, бла-бла-бла... Доклады не о чем. Цифры взятые с потолка + желание всех уволить и использовать ИИ. Хотелось бы больше конкретики и особенностей применения "под капотом", как на некоторых других чисто айтишных конференциях😎 Тот же e-code от озона или доклады на ODS встречах. Но в целом, а чего вы хотели, ведь на доклады давали всего по 15 минут(

Из позитивного: нашим продуктом многие заинтересовались!)

Фото/видео пришлю далее
👍1
Не вайбкодьте☝️
3
Что такое подмодули гит, они же git submodules?🤔
Внезапно...

По своей сути, это ссылка на git репозиторий, которая существует внутри другого репозитория, основного.
Например, есть репозиторий какого-то сервиса, в котором куча других микросервисов. Вот эти микросервисов могут существовать как раз в виде под модулей, чтобы разработчики не мешали друг другу и могли спокойно работать в своих "подрепозиториях".
Круто? Конечно, круто😍

Особенно это оценят те, кто работал с Airflow. Ведь обычно его делают для одного репозитория, в котором куча несвязанного друг с другом кода. И тогда вы можете козырнуть знанием ГИТ подмодулей и добавлять их уже таким образом:
git submodule add <ссылка на репу> <название папки, в которую добавляем>

Здесь ты можешь прочитать подробнее из документации гита
Здесь видос про то, как ребята реализуют подмодули для Airflow
Это ссылка на мой репо с примером подмодуля
👍4
Ходил я как-то на буткемп Центрального университета, он же ЦУ, он же университет ТБанка...🏫

Так вот, ходил я как-то в ЦУ на небольшой буткемп, посвященный NLP. Честно говоря, потраченного времени жаль( Но, если ты новичок в NLP и в душе не чаешь, что такое эмбеддинги, то сгоняй, будет интересно👍

Пойдем по пунктам, которые я выделил, так сказать, инсайты:
1. Магистратура ЦУ построена по формату индивидуальных учебных планов. Те, кто из Вышки или из зарубежных ВУЗов, такое точно знают. Это когда у тебя есть направление, например, Машинное обучение, а дальше ты сам выбираешь кучу курсов на каждый семестр из числа предложенных/рекомендованных. Это круто, т.к. позволяет сократить кучу бесполезного времени на общие курсы и сосредоточиться на прикладных.
2. Магистратура ЦУ доступна аж с 3 курса бакалавриата!!!
3. Все маги ЦУ - платные. НО! У них в течение года проходит куча халявных грантов и есть обычный отбор по мотивационному письму/резюме😱
4. LLM модель deberta-large крутая, как и LORA. SOTA (state-of-the-art) LLM модели очень хорошо дообучаются, достаточно нескольки тысяч примеров, и они норм научаться классифицировать ваш специфический датасет.
https://huggingface.co/microsoft/deberta-v3-large
5. Вспомнили про PEFT, это такой способ дообучения больших моделей, когда не хватает ресурсов компа/коллаба.
https://huggingface.co/docs/peft/index
6. Большинство программ ЦУ - очные, и они в целом за такой подход. Я бы все таки хотел удаленный формат, хоть и скучаю по лекциям в ВУЗе)
2
This media is not supported in your browser
VIEW IN TELEGRAM
Небольшой видосик центрального атриума
👍3
Немного вайб-кодинга, математики и маркетинги. И БУМ! Мой первый MVP внешнего веб сервиса с питоном под капотом.
И вам, мои преданные подписчики, я предлагаю потыкаться в этой штуке😍 Совершенно бесплатно, НО за обратную связь: https://forms.gle/saww145HL1F3UrYY6

Вот немного вводных про инструмент...
Есть разные маркетинговые метрики, которые считаются для потока клиентов. Например, если в этом месяце мороженое покупало 5 человек, а в следующем из их осталось только 4, то ушел один человек, это пойдет в метрику оттока. Аналогично считается приток.
Короче говоря, на вход инструменту мы даем таблицу с транзакциями клиентов по датам, а на выходе получаем статистики притока/оттока по месяцам. Удобно? Вот и проверите!)

ВАЖНО! Если эта штука зависла, пишите мне, я перезапущу всю инфраструктуру и у вас все заработает❤️ Или разберусь, почему у вас что-либо не работает.

Дисклеймер! Отзывы на сайте фейковые, но ты не докажешь, и используются для демонстрации. Также ряд ссылок не работает, также используется для демонстрации. Вам нужны по сути только регистрация и вход.

Вот ссыль на инструмент: https://client-calculator.ru/
🔥5