🖥 Полный гайд по реальным SQL-вопросам с собеседований
Введение. Собеседования на позиции, связанные с данными (аналитики, инженеры, ученые данных), всё чаще включают нестандартные и продвинутые вопросы по SQL.
Большие технологические компании (Google, Amazon и др.) предъявляют высокие требования: важна не только правильность запроса, но и умение оптимизировать его и разбираться в реальных бизнес-данных[1][2].
В этом гайде мы разберем категории наиболее распространенных сложных SQL-задач с реальных собеседований – от платформ вроде DataLemur, LeetCode, StrataScratch – и подробно поясним решения.
Каждая задача сопровождена анализом: условие, оптимальный подход, используемые SQL-конструкции, возможные ошибки и финальное решение (для PostgreSQL и MySQL, с указанием различий где необходимо).
В конце добавлен отдельный раздел о современных базах данных, включая векторные БД (Pinecone, Weaviate, Milvus и др.), с примерами того, что могут спросить про них на собеседовании и как выглядят SQL-подобные запросы для работы с векторами.
https://uproger.com/polnyj-gajd-po-realnym-sql-voprosam-s-sobesedovanij/
@python_be1
https://uproger.com/polnyj-gajd-po-realnym-sql-voprosam-s-sobesedovanij/
Введение. Собеседования на позиции, связанные с данными (аналитики, инженеры, ученые данных), всё чаще включают нестандартные и продвинутые вопросы по SQL.
Большие технологические компании (Google, Amazon и др.) предъявляют высокие требования: важна не только правильность запроса, но и умение оптимизировать его и разбираться в реальных бизнес-данных[1][2].
В этом гайде мы разберем категории наиболее распространенных сложных SQL-задач с реальных собеседований – от платформ вроде DataLemur, LeetCode, StrataScratch – и подробно поясним решения.
Каждая задача сопровождена анализом: условие, оптимальный подход, используемые SQL-конструкции, возможные ошибки и финальное решение (для PostgreSQL и MySQL, с указанием различий где необходимо).
В конце добавлен отдельный раздел о современных базах данных, включая векторные БД (Pinecone, Weaviate, Milvus и др.), с примерами того, что могут спросить про них на собеседовании и как выглядят SQL-подобные запросы для работы с векторами.
https://uproger.com/polnyj-gajd-po-realnym-sql-voprosam-s-sobesedovanij/
@python_be1
https://uproger.com/polnyj-gajd-po-realnym-sql-voprosam-s-sobesedovanij/
UPROGER | Программирование
Полный гайд по реальным SQL-вопросам с собеседований
Введение. Собеседования на позиции, связанные с данными (аналитики, инженеры, ученые данных), всё чаще включают нестандартные и продвинутые вопросы по SQL. Большие технологические компании (Google, Amazon и др.) предъявляют высокие требования: важна не только…
Парсим ЛЮБЫЕ данные из интернета за секунду — нашли ОГРОМНЫЙ сборник библиотек, веб-сервисов и локальных инструментов, которые помогут собрать информацию для ваших задач.
• Спарсить получится ВСЁ: пикчи, видео, метаданные, аудио, документы, теги, SEO-данные, метрики ресурса, посетителей и еще КУЧУ ВСЕГО.
• В основе инструментов лежат самые популярные и действенные языки программирования на данный момент: Python, PHP, JS и Go.
• Все сервисы имитируют поведение реального ЧЕЛОВЕКА на сайтах и обойдут любые ограничения от простой капчи до продвинутых защитных барьеров.
• К каждому сервису дана ПОДРОБНАЯ инструкция — разберется даже пятиклассник.
• Все программы регулярно обновляются и поддерживаются разработчиками.
😶😶😶😶😶😶😶😶😶
Извлекаем любые данные для своих проектов — тут. (https://github.com/lorien/awesome-web-scraping)
👍
@python_be1
• Спарсить получится ВСЁ: пикчи, видео, метаданные, аудио, документы, теги, SEO-данные, метрики ресурса, посетителей и еще КУЧУ ВСЕГО.
• В основе инструментов лежат самые популярные и действенные языки программирования на данный момент: Python, PHP, JS и Go.
• Все сервисы имитируют поведение реального ЧЕЛОВЕКА на сайтах и обойдут любые ограничения от простой капчи до продвинутых защитных барьеров.
• К каждому сервису дана ПОДРОБНАЯ инструкция — разберется даже пятиклассник.
• Все программы регулярно обновляются и поддерживаются разработчиками.
😶😶😶😶😶😶😶😶😶
Извлекаем любые данные для своих проектов — тут. (https://github.com/lorien/awesome-web-scraping)
👍
@python_be1
🖥 Гайд по собеседованию Python-разработчика (Middle) 2025 года
В этом гайде собраны реальные и актуальные вопросы из интервью в крупных технологических компаниях и стартапах (Google, Amazon, Stripe, Booking и др.).
Каждая тема разобрана через призму того, что именно проверяют интервьюеры, как лучше структурировать ответ и какие подводные камни важно учитывать.
👉 Гайд: https://uproger.com/gajd-po-sobesedovaniyu-python-razrabotchika-middle-2025-goda/
@python_be1
В этом гайде собраны реальные и актуальные вопросы из интервью в крупных технологических компаниях и стартапах (Google, Amazon, Stripe, Booking и др.).
Каждая тема разобрана через призму того, что именно проверяют интервьюеры, как лучше структурировать ответ и какие подводные камни важно учитывать.
👉 Гайд: https://uproger.com/gajd-po-sobesedovaniyu-python-razrabotchika-middle-2025-goda/
@python_be1
🚀 Обучение LLM-агентов для многоповоротного принятия решений
AgentGym-RL — это фреймворк для тренировки LLM-агентов, способных принимать решения в сложных многоповоротных сценариях с использованием методов усиленного обучения. Он предлагает разнообразные реальные сценарии и поддерживает популярные алгоритмы RL, улучшая производительность моделей до уровня коммерческих решений.
🚀 Основные моменты:
- Модульная система для гибкости и расширяемости.
- Поддержка различных реальных сред, включая веб-навигацию и глубокий поиск.
- Метод ScalingInter-RL для стабильного обучения агентов.
- Интерактивный интерфейс для визуализации взаимодействий.
📌 GitHub: https://github.com/WooooDyy/AgentGym-RL
#python
@python_be1
AgentGym-RL — это фреймворк для тренировки LLM-агентов, способных принимать решения в сложных многоповоротных сценариях с использованием методов усиленного обучения. Он предлагает разнообразные реальные сценарии и поддерживает популярные алгоритмы RL, улучшая производительность моделей до уровня коммерческих решений.
🚀 Основные моменты:
- Модульная система для гибкости и расширяемости.
- Поддержка различных реальных сред, включая веб-навигацию и глубокий поиск.
- Метод ScalingInter-RL для стабильного обучения агентов.
- Интерактивный интерфейс для визуализации взаимодействий.
📌 GitHub: https://github.com/WooooDyy/AgentGym-RL
#python
@python_be1
Скидываем написание кода на ChatGPT: ИИ-агент Codex мощно обновился. Теперь он работает (https://openai.com/index/introducing-upgrades-to-codex/) на базе новой модели GPT-5-Codex.
Это специальная версия GPT-5, заточенная под написание кода агентом. В бенчмарке SWE-bench она набрала 74,5%. Агент стал меньше ошибаться, быстрее находить баги и лучше работать с большими задачами на несколько часов.
Протестить можно везде, где был доступен Codex и до этого — даже на телефоне или в браузере (https://openai.com/codex/).
@python_be1
Это специальная версия GPT-5, заточенная под написание кода агентом. В бенчмарке SWE-bench она набрала 74,5%. Агент стал меньше ошибаться, быстрее находить баги и лучше работать с большими задачами на несколько часов.
Протестить можно везде, где был доступен Codex и до этого — даже на телефоне или в браузере (https://openai.com/codex/).
@python_be1
Академия Алгоритмов и Систем делится новыми материалами по основам программирования на языке Python!
https://rutube.ru/plst/1188041/
Для кого эта серия?
🔥 Для новичков, начинающих свой путь в программировании.
🔥 Для тех, кто хочет расширить свои знания и умения в сфере IT.
Как часто выходят новые видео?
- Интервал публикации видео 1-5 дней!
Наслаждайтесь процессом обучения и создайте свой собственный путь в мире программирования! 🚀
@python_be1
https://rutube.ru/plst/1188041/
https://rutube.ru/plst/1188041/
Для кого эта серия?
🔥 Для новичков, начинающих свой путь в программировании.
🔥 Для тех, кто хочет расширить свои знания и умения в сфере IT.
Как часто выходят новые видео?
- Интервал публикации видео 1-5 дней!
Наслаждайтесь процессом обучения и создайте свой собственный путь в мире программирования! 🚀
@python_be1
https://rutube.ru/plst/1188041/
RUTUBE
Основы языка программирования Python – смотреть плейлист, все 9 видео подборки от "Академия Алгоритмов и Систем" онлайн в хорошем…
Основы языка программирования Python подготовил для Вас 9 видеороликов - смотри онлайн бесплатно!
WeClone (https://github.com/xming521/WeClone) — комплексное решение для создания цифрового аватара на основе истории чатов
Настройте LLM с помощью журналов чатов, чтобы передать свой уникальный стиль, а затем привяжите его к чат-боту, чтобы оживить своего цифрового двойника.
Основные характеристики
▫️ Комплексное решение для создания цифровых аватаров, включающее экспорт данных чата, предварительную обработку, обучение модели и развертывание
▫️ Доработайте LLM, используя историю чатов с поддержкой модальных данных изображений, чтобы придать ему аутентичный «колорит»
▫️ Интеграция с Telegram и WhatsApp (скоро появится) для создания собственного цифрового аватара
🐱
@python_be1
Настройте LLM с помощью журналов чатов, чтобы передать свой уникальный стиль, а затем привяжите его к чат-боту, чтобы оживить своего цифрового двойника.
Основные характеристики
▫️ Комплексное решение для создания цифровых аватаров, включающее экспорт данных чата, предварительную обработку, обучение модели и развертывание
▫️ Доработайте LLM, используя историю чатов с поддержкой модальных данных изображений, чтобы придать ему аутентичный «колорит»
▫️ Интеграция с Telegram и WhatsApp (скоро появится) для создания собственного цифрового аватара
🐱
@python_be1
🖥 Python: Совет по работе с серверами
Полезный совет Python-разработчиков, работающих с серверами
Когда вы управляете удалёнными серверами, часто приходится подключаться по SSH, выполнять команды и собирать логи. Банальные вызовы через subprocess или ручное использование ssh не дают гибкости. Куда интереснее использовать программируемое SSH-взаимодействие прямо из Python, с динамическим выполнением команд, обработкой stdout/stderr и тонкой настройкой соединения.
Трюк в том, чтобы работать с сервером так, будто вы пишете локальный скрипт: подключение по ключу, выполнение последовательности команд, сбор результатов и даже поднятие туннелей. Для этого можно использовать библиотеку paramiko. Её «фишка» — вы получаете прямой объект-канал для команд, что позволяет реализовать, например, автоматическое деплой-меню или собственный health-checker для кластера.
#Python #Программирование #Разработка #Python3 #Backend #Frontend #DataScience #MachineLearning #ArtificialIntelligence #DeepLearning #WebDevelopment #Django #Flask #FastAPI #API #REST #Scripting #Automation #DevOps #DataAnalysis #Pandas #NumPy #Matplotlib #Seaborn #Jupyter #BigData #CloudComputing #AWS #Azure #GoogleCloud #Testing #PyTest #UnitTest #CI_CD #Databases #SQL #NoSQL #MongoDB #PostgreSQL #SQLite #OpenSource #SoftwareEngineering #Coding #CleanCode #PythonLibraries #TensorFlow #PyTorch #ScikitLearn #NLP #ComputerVision
@python_be1
Полезный совет Python-разработчиков, работающих с серверами
Когда вы управляете удалёнными серверами, часто приходится подключаться по SSH, выполнять команды и собирать логи. Банальные вызовы через subprocess или ручное использование ssh не дают гибкости. Куда интереснее использовать программируемое SSH-взаимодействие прямо из Python, с динамическим выполнением команд, обработкой stdout/stderr и тонкой настройкой соединения.
Трюк в том, чтобы работать с сервером так, будто вы пишете локальный скрипт: подключение по ключу, выполнение последовательности команд, сбор результатов и даже поднятие туннелей. Для этого можно использовать библиотеку paramiko. Её «фишка» — вы получаете прямой объект-канал для команд, что позволяет реализовать, например, автоматическое деплой-меню или собственный health-checker для кластера.
#Python #Программирование #Разработка #Python3 #Backend #Frontend #DataScience #MachineLearning #ArtificialIntelligence #DeepLearning #WebDevelopment #Django #Flask #FastAPI #API #REST #Scripting #Automation #DevOps #DataAnalysis #Pandas #NumPy #Matplotlib #Seaborn #Jupyter #BigData #CloudComputing #AWS #Azure #GoogleCloud #Testing #PyTest #UnitTest #CI_CD #Databases #SQL #NoSQL #MongoDB #PostgreSQL #SQLite #OpenSource #SoftwareEngineering #Coding #CleanCode #PythonLibraries #TensorFlow #PyTorch #ScikitLearn #NLP #ComputerVision
@python_be1
🌍📊 OmniWorld: Многофункциональный набор данных для 4D моделирования
OmniWorld — это обширный набор данных, предназначенный для 4D моделирования, включая геометрическую реконструкцию и генерацию видео. Он охватывает различные домены и форматы, обеспечивая богатую мультимодальность.
🚀Основные моменты:
- 4000+ часов данных, 600K+ последовательностей, 300M+ кадров
- Разнообразные источники: симуляторы, роботы, люди и интернет
- Высокое качество аннотаций для 4D моделирования и генерации видео
📌 GitHub: https://github.com/yangzhou24/OmniWorld
@python_be1
OmniWorld — это обширный набор данных, предназначенный для 4D моделирования, включая геометрическую реконструкцию и генерацию видео. Он охватывает различные домены и форматы, обеспечивая богатую мультимодальность.
🚀Основные моменты:
- 4000+ часов данных, 600K+ последовательностей, 300M+ кадров
- Разнообразные источники: симуляторы, роботы, люди и интернет
- Высокое качество аннотаций для 4D моделирования и генерации видео
📌 GitHub: https://github.com/yangzhou24/OmniWorld
@python_be1
📈 Гайд по продвинутым вопросам для разработчика LLM
Собеседования на позицию разработчика больших языковых моделей (LLM) в топовых AI-компаниях предъявляют высокие требования к знаниям.
Кандидату необходимо понимать устройство архитектуры трансформеров, владеть методами эффективного обучения и инференса, разбираться в оптимизациях памяти и скорости (таких как LoRA, FlashAttention, vLLM, ZeRO), знать тонкости распределённого тренинга, принципов LLMOps (MLOps для больших моделей) и нюансов продакшн-развертывания LLM.
Также часто проверяют умение решать реальные задачи: от проектирования пайплайна для Sparse MoE до анализа проблем с памятью на GPU, понимания различий между методами обучения с подкреплением (RLHF vs DPO) и способов масштабирования моделей.
Этот гайд структурирован по ключевым темам, соответствующим областям знаний, которые обычно проверяются на собеседованиях. Для каждой темы мы рассмотрим, что пытаются проверить интервьюеры, приведём пример формулировки вопроса и дадим подробный разбор ответа с обсуждением трэйд-оффов, примеров кода или схем, где это уместно. Вы можете изучать материал по разделам, чтобы сфокусироваться на интересующей области.
👉 Гайд (https://uproger.com/gajd-po-prodvinutym-voprosam-dlya-razrabotchika-llm/)
@python_be1
Собеседования на позицию разработчика больших языковых моделей (LLM) в топовых AI-компаниях предъявляют высокие требования к знаниям.
Кандидату необходимо понимать устройство архитектуры трансформеров, владеть методами эффективного обучения и инференса, разбираться в оптимизациях памяти и скорости (таких как LoRA, FlashAttention, vLLM, ZeRO), знать тонкости распределённого тренинга, принципов LLMOps (MLOps для больших моделей) и нюансов продакшн-развертывания LLM.
Также часто проверяют умение решать реальные задачи: от проектирования пайплайна для Sparse MoE до анализа проблем с памятью на GPU, понимания различий между методами обучения с подкреплением (RLHF vs DPO) и способов масштабирования моделей.
Этот гайд структурирован по ключевым темам, соответствующим областям знаний, которые обычно проверяются на собеседованиях. Для каждой темы мы рассмотрим, что пытаются проверить интервьюеры, приведём пример формулировки вопроса и дадим подробный разбор ответа с обсуждением трэйд-оффов, примеров кода или схем, где это уместно. Вы можете изучать материал по разделам, чтобы сфокусироваться на интересующей области.
👉 Гайд (https://uproger.com/gajd-po-prodvinutym-voprosam-dlya-razrabotchika-llm/)
@python_be1
🆕 PDF Arranger — лёгкий и удобный инструмент для работы с PDF.
✨ Возможности:
- Объединение и разделение файлов
- Поворот и обрезка страниц
- Перестановка и удаление страниц
- Интуитивный drag-and-drop интерфейс
💻 Доступен для Linux, Windows (включая портативную версию) и BSD.
Полностью опенсорс (GPL-3.0).
Идеален, если нужно быстро подготовить PDF к печати или презентации — без сложных настроек.
📌 GitHub (https://github.com/pdfarranger/pdfarranger)
#PDF #opensource #Linux #devtools
@python_be1
✨ Возможности:
- Объединение и разделение файлов
- Поворот и обрезка страниц
- Перестановка и удаление страниц
- Интуитивный drag-and-drop интерфейс
💻 Доступен для Linux, Windows (включая портативную версию) и BSD.
Полностью опенсорс (GPL-3.0).
Идеален, если нужно быстро подготовить PDF к печати или презентации — без сложных настроек.
📌 GitHub (https://github.com/pdfarranger/pdfarranger)
#PDF #opensource #Linux #devtools
@python_be1
This media is not supported in your browser
VIEW IN TELEGRAM
🖥 Полезный совет по ускорению Python-кода
Многие считают, что list comprehension всегда оптимален. Но при больших объёмах данных связка map + filter может быть быстрее: она выполняется на уровне C и не создаёт лишних промежуточных структур.
Когда нужно одновременно фильтровать и преобразовывать элементы, map + filter часто выигрывает по скорости.
#Python, #программирование, #кодинг, #разработка, #собеседование, #интервью, #PythonJobs, #DataScience, #MachineLearning, #AI, #backend, #webdev, #Django, #Flask, #FastAPI, #API, #REST, #asyncio, #многопоточность, #многозадачность, #библиотеки, #NumPy, #Pandas, #TensorFlow, #PyTorch, #SQL, #ORM, #SQLAlchemy, #тестирование, #unittest, #pytest, #TDD, #алгоритмы, #структурыданных, #OOP,
@python_be1
Многие считают, что list comprehension всегда оптимален. Но при больших объёмах данных связка map + filter может быть быстрее: она выполняется на уровне C и не создаёт лишних промежуточных структур.
Когда нужно одновременно фильтровать и преобразовывать элементы, map + filter часто выигрывает по скорости.
#Python, #программирование, #кодинг, #разработка, #собеседование, #интервью, #PythonJobs, #DataScience, #MachineLearning, #AI, #backend, #webdev, #Django, #Flask, #FastAPI, #API, #REST, #asyncio, #многопоточность, #многозадачность, #библиотеки, #NumPy, #Pandas, #TensorFlow, #PyTorch, #SQL, #ORM, #SQLAlchemy, #тестирование, #unittest, #pytest, #TDD, #алгоритмы, #структурыданных, #OOP,
@python_be1
Kreuzberg (https://github.com/Goldziher/kreuzberg) — платформа для интеллектуального анализа документов на Python.
Извлечение текста, метаданных и структурированной информации из документов различных форматов с помощью единого расширяемого API.
Создана на основе проверенных платформ с открытым исходным кодом, включая Pandoc, PDFium и Tesseract.
🐱
@python_be1
Извлечение текста, метаданных и структурированной информации из документов различных форматов с помощью единого расширяемого API.
Создана на основе проверенных платформ с открытым исходным кодом, включая Pandoc, PDFium и Tesseract.
🐱
@python_be1
🖥 Новинка: `pyx` — Python-native пакетный реестр от Astral (в Beta)
Что такое `pyx`:
- Python-native registry, часть платформы Astral и продвинутый бэкенд для `uv`.
- Обеспечивает более быструю, безопасную и GPU-осознанную работу с пакетами (как приватными, так и публичными, включая PyPI и PyTorch).
Почему это важно:
- Следует философии Astral: поддержка open-source, без превращения инструментов в конкурирующие SaaS-продукты.
- Первый шаг к вертикальной интеграции с существующими open-source инструментами.
- Уже в бета-версии с ранними партнёрами — Ramp, Intercom и fal.
Впечатление:
`pyx` выглядит как обдуманный, open-source-ориентированный подход к packaging infrastructure, который может сделать разработку Python-экосистемы быстрее и мощнее.
https://simonwillison.net/2025/Aug/13/pyx/#atom-tag
@python_be1
Что такое `pyx`:
- Python-native registry, часть платформы Astral и продвинутый бэкенд для `uv`.
- Обеспечивает более быструю, безопасную и GPU-осознанную работу с пакетами (как приватными, так и публичными, включая PyPI и PyTorch).
Почему это важно:
- Следует философии Astral: поддержка open-source, без превращения инструментов в конкурирующие SaaS-продукты.
- Первый шаг к вертикальной интеграции с существующими open-source инструментами.
- Уже в бета-версии с ранними партнёрами — Ramp, Intercom и fal.
Впечатление:
`pyx` выглядит как обдуманный, open-source-ориентированный подход к packaging infrastructure, который может сделать разработку Python-экосистемы быстрее и мощнее.
https://simonwillison.net/2025/Aug/13/pyx/#atom-tag
@python_be1
This media is not supported in your browser
VIEW IN TELEGRAM
🐐 В 2009 году Дженсен Хуанг объяснял, что такое CUDA. Если бы ты вложил $10,000 в Nvidia, сегодня это было бы около $8.8 млн.
@python_be1
@python_be1
This media is not supported in your browser
VIEW IN TELEGRAM
В копилку полезного для питонистов: нашёл классный визуализатор памяти для Python. С его помощью можно наглядно посмотреть, как работают ссылки, изменяемые типы данных, поверхностное и глубокое копирование.
Полезно и для учебы, и для отладки. Забираем c GitHub (https://github.com/bterwijn/memory_graph), можно потыкать онлайн (https://memory-graph.com/)
@python_be1
Полезно и для учебы, и для отладки. Забираем c GitHub (https://github.com/bterwijn/memory_graph), можно потыкать онлайн (https://memory-graph.com/)
@python_be1
📄 LIMI: Less Is More for Agency
Исследование показывает, что агентным ИИ важнее качество данных, а не их количество.
Ключевые факты:
- 78 тщательно подобранных демо дали 73,5% на AgencyBench — больше, чем модели, обученные на 10k примеров.
- Результаты выше, чем у SOTA: Kimi-K2 (24,1%), DeepSeek (11,9%), Qwen3 (27,5%), GLM-4.5 (45,1%).
- Формулируется принцип Agency Efficiency: автономность ИИ рождается из стратегической выборки данных, а не из их масштаба.
repo: https://github.com/GAIR-NLP/LIMI
model: https://huggingface.co/GAIR/LIMI
data: https://huggingface.co/datasets/GAIR/LIMI
@python_be1
Исследование показывает, что агентным ИИ важнее качество данных, а не их количество.
Ключевые факты:
- 78 тщательно подобранных демо дали 73,5% на AgencyBench — больше, чем модели, обученные на 10k примеров.
- Результаты выше, чем у SOTA: Kimi-K2 (24,1%), DeepSeek (11,9%), Qwen3 (27,5%), GLM-4.5 (45,1%).
- Формулируется принцип Agency Efficiency: автономность ИИ рождается из стратегической выборки данных, а не из их масштаба.
repo: https://github.com/GAIR-NLP/LIMI
model: https://huggingface.co/GAIR/LIMI
data: https://huggingface.co/datasets/GAIR/LIMI
@python_be1