SQL и Анализ данных

🔥 Полезная подборка каналов только код, практика и самые передовые инструменты, которые используют разработчики прямо сейчас.👇

🖥 ИИ: t.me/ai_machinelearning_big_data

🖥 Python: t.me/pythonl

🖥 Linux: t.me/linuxacademiya

🖥 C++ t.me/cpluspluc

🖥 Docker: t.me/DevopsDocker

🖥 Хакинг: t.me/linuxkalii

🖥 Devops: t.me/DevOPSitsec

👣 Golang: t.me/Golang_google

🖥 Аналитика: t.me/data_analysis_ml

🖥 Javascript: t.me/javascriptv

🖥 C#: t.me/csharp_ci

🖥 Java: t.me/javatg

🖥 Базы данных: t.me/sqlhub

👣 Rust: t.me/rust_code

🤖 Технологии: t.me/vistehno

💰 Экономика и инвестиции в ИИ t.me/financeStable

💼 Актуальные вакансии: t.me/addlist/_zyy_jQ_QUsyM2Vi

🖥 Chatgpt бот в тг: t.me/Chatgpturbobot

📚 Бесплатные ит-книги: https://t.me/addlist/HwywK4fErd8wYzQy

🖥Подборка по Golang: https://t.me/addlist/MUtJEeJSxeY2YTFi

⚡️ Лучшие ИИ ресурсы: https://t.me/addlist/2Ls-snqEeytkMDgy

Самое лучшее в этом: ты учишься даже тогда, когда “нет времени, просто потому что читаешь правильную ленту.

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥2❤1👍1

2.7K views07:33

SQL и Анализ данных

Какой тип индекса MySQL лучше всего подходит для геопространственных данных?

Anonymous Quiz

👍2

495 voters2.69K views08:33

SQL и Анализ данных

🖥

Хотите освоить SQL и PostgreSQL без курсов и подписок? Есть мощный бесплатный репозиторий, который проведёт вас от нуля до уверенного уровня всего за пару месяцев.

Это полноценный учебник + практика в одном месте.

Что внутри:

- База без воды
SELECT, WHERE, ORDER BY, LIMIT, условия и логика запросов

- Продвинутые темы
агрегатные функции, GROUP BY, HAVING, подзапросы, JOIN’ы

- Много практики
упражнения и задачи, чтобы довести работу с БД до автоматизма

- Подробные объяснения
материал подойдёт даже тем, кто никогда не работал с базами данных

Почему это полезно:

SQL — один из самых универсальных навыков в IT.
Он нужен разработчикам, аналитикам, data-инженерам и всем, кто работает с данными.

Этот репозиторий даёт именно то, что нужно для реальной работы:
- понимание, как устроены запросы
- уверенную работу с данными
- базу для перехода к аналитике или backend-разработке

GitHub: https://github.com/dwyl/learn-postgresql

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2❤1

2.98K views12:03

SQL и Анализ данных

🖥

Sql тренажеры для практики

▪sql-academy.org
▪sql-ex.ru
▪schoolsw3.com
▪SQL Fiddle
▪sqltest.online
▪Oracle LiveSQL
▪stratascratch.com
▪stepik.org (Интерактивный тренажер SQL)
▪sql-practice.com
▪pgexercises.com
▪HackerRank
▪sqlzoo.net

Please open Telegram to view this post

VIEW IN TELEGRAM

SQL Academy

Интерактивный тренажер по SQL — SQL Academy

Бесплатный интерактивный онлайн тренажер с упражнениями для оттачивания навыков работы с SQL. Задания по SQL с фильтрацией по сложности и типу. Задачи с реальных собеседований (интервью) в лучшие компании, таких как Сбербанк, VK, Альфа-банк и других. Тренажер…

👍10🔥4

4.44K viewsedited 09:43

SQL и Анализ данных

🖥 Новый курс на Stepik - PostgreSQL для разработчиков: от основ к созданию API

Здесь на пальцах объясняют не только как писать SQL-запросы, а строить настоящие backend-сервисы с базой данных как у профи.

В этом курсе ты шаг за шагом создашь REST API на FastAPI + PostgreSQL:
от установки среды и первых таблиц - до масштабируемого приложения с безопасностью и CRUD-операциями.

🔹 На практике разберете:
• SQL-запросы, фильтры, агрегаты и подзапросы
• Связи между таблицами и нормализацию БД
• Взаимодействие Python и PostgreSQL
• Реализацию REST API и подключение базы
• Оптимизацию и разбор реальных задач с собеседований

⚡ После курса у вас будет свой работающий API-проект и реальные навыки работы с PostgreSQL в продакшене.

🎁 Торопись пока действует скидка в честь нвого года!

🚀 Прокачаю свои знания: https://stepik.org/course/255542/

Please open Telegram to view this post

VIEW IN TELEGRAM

❤5🥱2👍1🔥1

2.9K views12:13

SQL и Анализ данных

Какой тип индекса в MySQL лучше всего подходит для ускорения поиска по диапазону значений?

Anonymous Quiz

518 voters2.87K views14:13

SQL и Анализ данных

sql-basics-cheat-sheet-a4.pdf

120.5 KB

📇

Структурированная SQL шпаргалка

➕Выборка одиночных и множественных значений;
➕Объединение и группировка;
➕Фильтрация данных;
➕Алиасы и джоины.

#sql #doc #cheatsheet

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4❤1🔥1😁1

2.76K views10:06

SQL и Анализ данных

⚡️ Маленькая модель - большие возможности.

Вышла Nanbeige4.1-3B - модель всего на 3B параметров, которая в ряде задач обходит модели в 10 раз больше.

Что внутри:

- Контекст до 256K токенов
- Встроенные агентные возможности Deep Search
- Обучение коду в два этапа:
- сначала правильность
- затем эффективность
- На ключевых бенчмарках обгоняет Qwen3-32B
- Можно запускать локально без мощных серверов
- Сильно ниже стоимость инференса
- Быстрая работа на edge и локальных машинах
- Подходит для локальных AI-агентов и автоматизации

Дешёвый Локальный AI.

Модель:
https://modelscope.cn/models/nanbeige/Nanbeige4.1-3B

❤6👍3🔥2

2.92K views05:57

SQL и Анализ данных

⚡ sqlc — пишешь SQL, получаешь типобезопасный Go-код

Если работаешь с Go и базой данных, есть инструмент, который экономит часы и убирает целый класс ошибок.

Что делает sqlc:

- Пишешь обычные SQL-запросы
- sqlc проверяет их по твоей схеме БД
- Генерирует готовый Go-код:
- структуры
- методы
- типы

Главный плюс:

Ошибки ловятся на этапе компиляции, а не в продакшене.

Например:
- обращение к несуществующей колонке
- несовпадение типов
- нарушение схемы

Без runtime-сюрпризов.

Почему это важно:

- Никакого ручного маппинга
- Полная типобезопасность
- Чистый и предсказуемый код
- Производительность лучше, чем у ORM
- Полный контроль над SQL

sqlc — это баланс между:
удобством ORM
и контролем сырого SQL.

Если пишешь сервисы на Go с PostgreSQL или MySQL —
это один из самых практичных инструментов в продакшене.

GitHub: https://github.com/sqlc-dev/sqlc

👍7🔥2❤1

3.1K views06:14

SQL и Анализ данных

MiniMax-2.5 теперь можно запускать локально 🚀

Модель на 230B параметров - одна из самых мощных среди LLM меньше 700B. Она показывает топовые результаты в агентных задачах, программировании и диалогах.

• Поддерживается динамическая 3/4-битная квантизация
• Можно запустить на Mac с 128 GB RAM
• Скорость - около 20 токенов/сек

Подходит для локальных AI-агентов, кодинга и приватной работы без облака

Это ещё один шаг к тому, что мощные модели постепенно переезжают с дата-центров на локальные машины.

Guide: https://unsloth.ai/docs/models/minimax-2.5
GGUF: https://huggingface.co/unsloth/MiniMax-M2.5-GGUF

❤3🔥2👍1

2.55K views14:00

SQL и Анализ данных

0:35

This media is not supported in your browser

VIEW IN TELEGRAM

🔥 Самая опасная ошибка при миграции в SQL - делать всё сразу.

Большинство разработчиков и аналитиков при изменении структуры таблицы сразу добавляют NOT NULL или удаляют колонку.

Проблема в том, что на продакшене это может:
заблокировать таблицу
положить сервис
или сорвать релиз.

Правильный подход — делать миграцию по шагам.

Сначала добавляешь новую колонку без ограничений.
Потом постепенно заполняешь данные.

И только после этого добавляешь NOT NULL.

Так работают команды, которые не ломают прод.

-- Шаг 1. Добавляем колонку без ограничений
ALTER TABLE users
ADD COLUMN status TEXT;

-- Шаг 2. Заполняем постепенно (можно батчами)
UPDATE users
SET status = 'active'
WHERE status IS NULL;

-- Шаг 3. Добавляем ограничение только после заполнения
ALTER TABLE users
ALTER COLUMN status SET NOT NULL;

👍9🔥4❤3👌1💊1

2.82K views09:25

SQL и Анализ данных

🐘

Бесплатная конференция по PostgreSQL — Москва, 19 марта

PG BootCamp Russia 2026 — комьюнити-конференция российского сообщества PostgreSQL с подтвержденным официальным международным статусом.

Мероприятие бесплатное, онлайн+офлайн, ориентировано на администраторов БД, разработчиков, инженеров, аналитиков, архитекторов.

Эксперты из Tantor, Яндекс, СберТех, Тензор, Хи-квадрат, Luxms BI и других компаний выступят по темам, связанным с разработкой, эксплуатацией и взаимодействием PostgreSQL с другими системами.

В предварительной программе:

📎Решение застарелых архитектурных проблем PostgreSQL для современных нагрузок и масштабирования
📎Временные таблицы для Postgres. Почему это важно для платформы 1С и что можно улучшить?
📎Разделение Compute и Storage: архитектурный прорыв для PostgreSQL в облаке
📎Опыт вынесения OLAP-нагрузки на реплику
📎Highload "из ниоткуда": когда проблема не в СУБД, а в клиентской архитектуре
📎Опыт эксплуатации, проблемы и производительность PostgreSQL на Эльбрус, Baikal-S, Loongson, Repka Pi, x86
📎Поиск проблем планирования запросов до их воздействия на производительность
📎Тестирование, баги и уроки работы с патчем 64-битного счетчика транзакций PostgreSQL
📎Работа с логами PostgreSQL
📎…и другие (всего 25 выступлений)

🗓

19 марта
📍 Москва, офлайн + онлайн

➡️

БЕСПЛАТНАЯ РЕГИСТРАЦИЯ

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3

2.33K views13:52

SQL и Анализ данных

У вас есть таблицы views (посещения) и purchases (покупки). Как найти пользователей, которые просмотрели товары, но ничего не купили?

Anonymous Quiz

A) SELECT user_id FROM views EXCEPT SELECT user_id FROM purchases;

28%

B) SELECT user_id FROM views WHERE user_id NOT IN (SELECT user_id FROM purchases);

21%

C) SELECT user_id FROM views LEFT JOIN purchases USING (user_id) WHERE purchases.user_id IS NULL;

43%

D) Все вышеперечисленные варианты приведут к одному результату.

👍10💊2

533 voters2.63K views15:55

SQL и Анализ данных

😁28❤3🔥3❤‍🔥2

1.83K views18:53

SQL и Анализ данных

Forwarded from Machinelearning

🌟

Как YouTube ускорил проверку валидных рекомендаций в LLM в 948 раз.

YouTube и Google DeepMind опубликовали статью и код фреймворка STATIC.

Проблема, которую он решает, хорошо знакома всем, кто строит рекомендательные системы на базе LLM: модель генерирует идентификаторы позиций, которых нет в каталоге, вышли из продажи или нарушают бизнес-правила. Именно поэтому YouTube выдает старые видео в ленте там, где должны появляться ролики последней недели.

Очевидное решение - префиксное дерево: на каждом шаге декодирования маска блокирует невалидные токены. Работает в целом нормально, но убивает производительность на TPU и GPU. Причины две:

🟠Обход через цепочки указателей создает случайный, несмежный паттерн доступа к памяти, а память ускорителей рассчитана на потоковое чтение блоками, а не на такой режим.

🟠Гугловский XLA-компилятор требует статических вычислительных графов, а префиксное дерево с управлением потоком, зависящим от данных, в это не вписывается.

В итоге префиксное дерево на CPU удваивает время инференса, что для системы с целевой задержкой ≤10 мс на шаг неприемлемо.

STATIC меняет подход принципиально: дерево разворачивается в статическую разреженную матрицу формата Compressed Sparse Row. Обход превращается в векторизованную операцию, которую акселератор умеет выполнять нативно.

Для первых двух уровней дерева, где коэффициент ветвления максимален, используется предвычисленная плотная булева маска: проверка валидности токена сводится к прямому обращению по индексу, без какого-либо перебора.

Для глубоких уровней работает специализированное ядро Vectorized Node Transition Kernel, оно читает фиксированный блок данных вне зависимости от реального числа дочерних узлов, не создавая условных переходов. В этом и есть вся соль: весь граф остается статическим, XLA не перекомпилирует ничего на ходу.

🟡

Тесты и результаты

Замеры проводили на TPU v6e с 3B-моделью и словарем из 20 млн. свежих видео.

STATIC добился задержки 0,033 мс на шаг декодирования (это всего 0,25% от общего времени инференса.

Для сравнения: префиксное дерево на CPU давало +31,3 мс (239% от инференса), лучший из конкурирующих методов непосредственно на акселераторе, PPV Approximate +1,56 мс (11,9%). Итоговый профит:

🟢948x против дерева на CPU;
🟢47x против PPV Approximate;
🟢1033x против точного PPV.

По памяти: ~90 МБ на 1 млн. элементов. Для словаря в 20 млн. верхний предел по HBM примерно 1,5 ГБ, на практике - около 75% от этого значения.

🟡

STATIC развернут на YouTube в продакшне.

A/B-тест с условием «только видео за последние 7 дней» показал +5,1% просмотров свежего контента, +2,9% для трехдневного окна, +0,15% по CTR и 100% соответствие бизнес-правилам.

Дополнительный бонус: метод решает проблему рекомендации новых товаров, не представленных в обучающей выборке. На датасете Amazon Reviews Recall@1 вырос с 0% до 1,2–4,4% в зависимости от категории.

В репозитории лежит ноутбук, на котором без утомительной настройки можно сразу посмотреть, как строится индекс из Semantic ID и как запускается декодирование с ограничениями.

📌Лицензирование: Apache 2.0 License.

🟡

Arxiv

🖥

GitHub

@ai_machinelearning_big_data

#AI #ML #LLM #STATIC #DeepMind

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤2👍2

1.3K views11:48

SQL и Анализ данных

Замкнулись