PythonTalk
4.68K subscribers
1.34K photos
43 videos
7 files
1.24K links
Привет, меня зовут Олег Булыгин 👋

🐍 Здесь я делюсь полезной информацией для тех, кто пишет код на Python: от разработки до Data Science.

По вопросам: @obulygin91
Download Telegram
Информация о канале, для тех, кто подписался недавно 😀

Привет, меня зовут Олег Булыгин 👋🏻

🐍 Я эксперт по Python и Data Science. В 2020 году ушёл из найма, сейчас реализую собственные проекты, занимаюсь IT-образованием и консультированием.

👨‍💻 Опыт в образовании. В IT-образовании с 2017 года. За это время провел более 1500 лекций и вебинаров, обучил тысячи студентов, многие из которых сейчас работают в ведущих IT-компаниях. Создаю авторские курсы, консультирую крупные компании по вопросам Data Science и участвую в разработке образовательных программ для университетов и онлайн-школ.

Сотрудничаю с такими образовательными площадками, как Нетология, Яндекс Практикум, SkillFactory, MathsHub, преподаю на магистерский программах ВУЗов.

🎯 Стремлюсь сделать обучение качественным и честным для всех, кто хочет развиваться в IT-сфере.

🧠 Если тебя интересует программирование на Python, data science и другие смежные темы в IT, то ты найдёшь на канале что-то полезное для себя 🙂

Тут есть несколько регулярных рубрик, которые можно найти по тегам:

📝 #статья: полезные лонгриды и авторские материалы

🤔#квиз: опрос с вариантами ответа на знание нюансов и особенностей языка Python

📔#термин: определение технических терминов в формате карточек

🐍#синтаксис: примеры кода в формате карточек, которые кратко раскрывают какой-либо синтаксический элемент языка

👨🏻‍💻#тестовое: примеры реальных тестовых заданий, которые дают на собеседованиях на позиции, связанные с Python

🗞#новости, #рынок_труда: события, которые так или иначе затрагивают специалистов в сфере it и влияют на нашу профессиональную жизнь

🗓#итоги_месяца: саммари по материалам, которые вышли на канале за месяц, если вы вдруг что-то упустили

👩🏻‍💻#задача: алгоритмические задачи, для которых ищем оптимальные решения

🗣 Где общаемся? В комментах под постами и в чатике. Обсуждать можно абсолютно любые темы.
Крайне приветствуется обмен опытом. Задавайте вопросы, отвечайте на вопросы.
Крайне не приветствуется и будет караться хамское и неуважительное поведение, риторика ненависти в любых проявлениях.

Также канал есть в:
〰️ Teletype
〰️ Сетке
〰️ Дзен

Всем добра 🖖🏻
Хранить эмбеддинги в mp4 файле? Звучит как полная дичь? Возможно. Но это работает.

Наткнулся на проект Memvid — это Python-библиотека, которая предлагает интересный подход к RAG. Вместо того чтобы разворачивать тяжелые векторные базы данных, которые жрут RAM и требуют серверов, эта штука кодирует миллионы текстовых чанков в один компактный видеофайл.

Что обещают:
👉🏻 Видео как база данных. Вся ваша база знаний — это один .mp4 файл, который можно просто скопировать.
👉🏻 Никаких серверов и RAM. Работает оффлайн, не требует GPU и сложной инфраструктуры.
👉🏻 10x сжатие. Видеокодеки сжимают данные эффективнее, чем многие другие методы.
👉🏻 Быстрый семантический поиск. Находит нужную инфу по смыслу с субсекундным откликом.
👉🏻 Поддержка LLM. Прикручивается к OpenAI, Anthropic или локальным моделям в три строчки кода.

Сама идея хранить данные в видео не нова (привет, попытки использовать YouTube как бесплатное хранилище), но тут ребята добавили слой семантики и сделали это реально удобным.

Главный минус — иммутабельность. Чтобы добавить или удалить данные, нужно пересоздавать весь видеофайл.

Но для read-only архивов, личных баз знаний или учебных материалов, где данные меняются редко, — выглядит как гениальный в своей простоте хак.
Будни большинства вайб-кодеров-джунов. Да, вайб-кодеров пора делить на грейды 🌚