Кардинальность относится к количеству уникальных значений в столбце по отношению к общему числу строк в таблице 😮
• Высокая кардинальность означает, что столбец имеет много уникальных значений. • Низкая кардинальность означает, что столбец имеет мало уникальных значений.
Когда вы создаёте индекс на столбце с низкой кардинальностью, это часто неэффективно, потому что:
🍩 Низкая кардинальность означает, что каждое проиндексированное значение указывает на много строк, что уменьшает способность индекса сузить область поиска. 🍩 Поддержка индекса требует дополнительное место и время на обновление. Для столбцов с низкой кардинальностью эти затраты могут перевесить выгоду. 🍩 Оптимизаторы запросов баз данных умны; они знают статистику столбцов, включая кардинальность. Когда они обнаруживают индекс с низкой кардинальностью, они часто игнорируют его и выполняют полное сканирование таблицы.
👇 Пример
Предположим таблицу "Employees" с 1 миллионом записей:
Рассмотрим индексацию различных столбцов:
• ID: Высокая кардинальность (1 миллион уникальных значений). Индекс здесь будет очень эффективным.
• Name: Высокая кардинальность (много уникальных имен). Индекс может быть полезен для поиска.
• Department: Средняя кардинальность (10-20 уникальных значений). Индекс иногда может быть полезен, но менее эффективен, чем для EmployeeID или Name.
• Gender: Очень низкая кардинальность (2-3 уникальных значения). Оптимизатор запросов вероятно игнорирует индекс.
Когда стоит рассмотреть индексацию столбца с низкой кардинальностью?🤔
Есть сценарии, когда индексация столбца с низкой кардинальностью может быть полезной.
Например, комбинирование столбцов с низкой и высокой кардинальностью может быть эффективным.
👉 @SQLPortal | #ресурсы | дать буст
• Высокая кардинальность означает, что столбец имеет много уникальных значений. • Низкая кардинальность означает, что столбец имеет мало уникальных значений.
Когда вы создаёте индекс на столбце с низкой кардинальностью, это часто неэффективно, потому что:
Предположим таблицу "Employees" с 1 миллионом записей:
Рассмотрим индексацию различных столбцов:
• ID: Высокая кардинальность (1 миллион уникальных значений). Индекс здесь будет очень эффективным.
• Name: Высокая кардинальность (много уникальных имен). Индекс может быть полезен для поиска.
• Department: Средняя кардинальность (10-20 уникальных значений). Индекс иногда может быть полезен, но менее эффективен, чем для EmployeeID или Name.
• Gender: Очень низкая кардинальность (2-3 уникальных значения). Оптимизатор запросов вероятно игнорирует индекс.
Когда стоит рассмотреть индексацию столбца с низкой кардинальностью?
Есть сценарии, когда индексация столбца с низкой кардинальностью может быть полезной.
Например, комбинирование столбцов с низкой и высокой кардинальностью может быть эффективным.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🔥3
SQL-кальмар: выживут только мастера запросов 😐
Нашёл годноту — SQL Squid Game
9 уровней, растущая сложность, а заодно — отличная прокачка навыков. Не уверены в силах? На сайте есть 33 урока, чтобы подтянуть SQL перед стартом
Готовы принять вызов? Тогда вперёд: https://datalemur.com/sql-game
👉 @SQLPortal | #ресурсы | дать буст
Нашёл годноту — SQL Squid Game
Вы — новоиспечённый дата-сайентист в загадочной организации. Ваш босс, Фронтмен, требует от вас решения бизнес-задач с помощью SQL. Не справитесь —☠️
9 уровней, растущая сложность, а заодно — отличная прокачка навыков. Не уверены в силах? На сайте есть 33 урока, чтобы подтянуть SQL перед стартом
Готовы принять вызов? Тогда вперёд: https://datalemur.com/sql-game
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥10👍3
Давно не было шпаргалок по MongoDB, исправляемся 😅
🟣 Работа с базами данных
🟣 Работа со строками
🟣 Работа с документами
🟣 Запрос данных из документов
🟣 Изменение данных в документах
🟣 Поиск
👉 @SQLPortal | #ресурсы | дать буст
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥4🌚1
Порядок выполнения простого SQL-запроса
График подробно показывает шаги выполнения запроса и разницу между порядком написания (coding order) и порядком выполнения (execution order) SQL-команд.
👉 @SQLPortal | #ресурсы | дать буст
График подробно показывает шаги выполнения запроса и разницу между порядком написания (coding order) и порядком выполнения (execution order) SQL-команд.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍20🔥1
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥1🤯1
Подзапросы – запросы внутри запросов
Подзапросы – это запросы, вложенные в другой запрос. Они особенно полезны для извлечения сложных данных.
Пример:
Этот запрос извлекает имена студентов, возраст которых больше среднего.
Подзапросы помогают разбить сложные задачи на более простые и управляемые части.
😒 Задание для вас:
Как, используя таблицу Employees, найти сотрудников, зарабатывающих больше среднего уровня зарплат?
👉 @SQLPortal | #ресурсы | дать буст
Подзапросы – это запросы, вложенные в другой запрос. Они особенно полезны для извлечения сложных данных.
Пример:
SELECT name
FROM Students
WHERE age > (SELECT AVG(age) FROM Students);
Этот запрос извлекает имена студентов, возраст которых больше среднего.
Подзапросы помогают разбить сложные задачи на более простые и управляемые части.
Как, используя таблицу Employees, найти сотрудников, зарабатывающих больше среднего уровня зарплат?
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
Одна из N причин, почему шардинг — отличный способ масштабировать базу данных:
Скорость резервного копирования.
👉 @SQLPortal | #ресурсы | дать буст
Скорость резервного копирования.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10🔥2🤔1
Media is too big
VIEW IN TELEGRAM
Основы работы в Microsoft Power BI
Николай Павлов, объясняет основные компоненты и возможности Power BI, который является не просто одной программой, а набором инструментов для анализа и визуализации данных. Power BI поддерживает подключение более чем к 170 источникам данных, включая файлы Excel, базы данных, облачные сервисы и веб-платформы.
📹 Cмотреть: тык
👉 @SQLPortal | #курсы
Николай Павлов, объясняет основные компоненты и возможности Power BI, который является не просто одной программой, а набором инструментов для анализа и визуализации данных. Power BI поддерживает подключение более чем к 170 источникам данных, включая файлы Excel, базы данных, облачные сервисы и веб-платформы.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥4🏆2
На изображении представлена визуализация работы SQL-запросов с использованием оператора SELECT.
Оно иллюстрирует, как извлекать данные из базы данных, используя SQL.
👉 @SQLPortal | #ресурсы | дать буст
Оно иллюстрирует, как извлекать данные из базы данных, используя SQL.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍14🔥3
Бесплатный курс по анализу данных
Пошаговый курс, который поможет вам понять все ключевые области работы аналитика данных и развить компетенции.
📹 Cмотреть: тык
👉 @SQLPortal | #курсы
Пошаговый курс, который поможет вам понять все ключевые области работы аналитика данных и развить компетенции.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥2🌚1
Эту шпаргалку нужно сохранить
Здесь представлена таблица с основными SQL-командами, разделёнными по категориям.😍
Data Query Language (DQL) включает команды для запросов данных из базы. Например, SELECT выбирает столбцы из таблицы, WHERE задаёт условия выборки, а GROUP BY группирует результаты.
Data Definition Language (DDL) используется для управления структурой базы данных. Команды CREATE TABLE создают таблицы, ALTER TABLE изменяют их, а DROP TABLE удаляют.
Data Manipulation Language (DML) отвечает за управление данными. Команда INSERT INTO добавляет новые записи, DELETE удаляет, а UPDATE обновляет существующие данные.
Data Control Language (DCL) управляет доступом к базе данных. GRANT предоставляет права пользователям, а REVOKE их отзывает.
Transaction Control Language (TCL) помогает контролировать транзакции. BEGIN начинает транзакцию, COMMIT сохраняет изменения, а ROLLBACK отменяет.
Aggregate Functions используются для вычислений. Например, COUNT подсчитывает записи, AVG вычисляет среднее значение, а MAX и MIN находят максимум и минимум.
👉 @SQLPortal | #ресурсы | дать буст
Здесь представлена таблица с основными SQL-командами, разделёнными по категориям.
Data Query Language (DQL) включает команды для запросов данных из базы. Например, SELECT выбирает столбцы из таблицы, WHERE задаёт условия выборки, а GROUP BY группирует результаты.
Data Definition Language (DDL) используется для управления структурой базы данных. Команды CREATE TABLE создают таблицы, ALTER TABLE изменяют их, а DROP TABLE удаляют.
Data Manipulation Language (DML) отвечает за управление данными. Команда INSERT INTO добавляет новые записи, DELETE удаляет, а UPDATE обновляет существующие данные.
Data Control Language (DCL) управляет доступом к базе данных. GRANT предоставляет права пользователям, а REVOKE их отзывает.
Transaction Control Language (TCL) помогает контролировать транзакции. BEGIN начинает транзакцию, COMMIT сохраняет изменения, а ROLLBACK отменяет.
Aggregate Functions используются для вычислений. Например, COUNT подсчитывает записи, AVG вычисляет среднее значение, а MAX и MIN находят максимум и минимум.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🔥6
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2❤1🔥1
Готовитесь к собеседованию по SQL? Вот основные темы, которые стоит повторить
🤓 Базовые концепции SQL:
Что такое SQL и почему он важен в аналитике данных.
Объясните разницу между INNER JOIN, LEFT JOIN, RIGHT JOIN и FULL OUTER JOIN.
В чем разница между операторами WHERE и HAVING.
Как использовать GROUP BY и HAVING в запросе.
🧔♂️ Средний уровень SQL:
Напишите запрос для поиска дублирующихся записей в таблице.
Как извлечь уникальные значения из таблицы с помощью SQL.
Объясните использование агрегатных функций, таких как COUNT(), SUM(), AVG(), MIN() и MAX().
Какова цель использования ключевого слова DISTINCT в SQL.
Напишите запрос, чтобы найти вторую по величине зарплату в таблице сотрудников.
Что такое подзапросы и как их использовать.
Что такое общее табличное выражение (CTE), приведите пример его использования.
Объясните оконные функции, такие как ROW_NUMBER(), RANK() и DENSE_RANK().
Как объединить результаты двух запросов с помощью UNION и UNION ALL.
Что такое индексы в SQL и как они повышают производительность запросов.
Напишите запрос для расчета общего объема продаж за каждый месяц с использованием GROUP BY.
Как оптимизировать медленный SQL-запрос.
Что такое представления в SQL и когда их следует использовать.
В чем разница между хранимой процедурой и функцией в SQL.
Объясните разницу между командами TRUNCATE, DELETE и DROP.
Что такое оконные функции и как они используются в аналитике.
Как использовать PARTITION BY и ORDER BY в оконных функциях.
Как обрабатывать NULL значения в SQL и какие функции для этого помогают, например, COALESCE и ISNULL.
👉 @SQLPortal | #ресурсы | дать буст
Что такое SQL и почему он важен в аналитике данных.
Объясните разницу между INNER JOIN, LEFT JOIN, RIGHT JOIN и FULL OUTER JOIN.
В чем разница между операторами WHERE и HAVING.
Как использовать GROUP BY и HAVING в запросе.
Напишите запрос для поиска дублирующихся записей в таблице.
Как извлечь уникальные значения из таблицы с помощью SQL.
Объясните использование агрегатных функций, таких как COUNT(), SUM(), AVG(), MIN() и MAX().
Какова цель использования ключевого слова DISTINCT в SQL.
Напишите запрос, чтобы найти вторую по величине зарплату в таблице сотрудников.
Что такое подзапросы и как их использовать.
Что такое общее табличное выражение (CTE), приведите пример его использования.
Объясните оконные функции, такие как ROW_NUMBER(), RANK() и DENSE_RANK().
Как объединить результаты двух запросов с помощью UNION и UNION ALL.
Что такое индексы в SQL и как они повышают производительность запросов.
Напишите запрос для расчета общего объема продаж за каждый месяц с использованием GROUP BY.
Как оптимизировать медленный SQL-запрос.
Что такое представления в SQL и когда их следует использовать.
В чем разница между хранимой процедурой и функцией в SQL.
Объясните разницу между командами TRUNCATE, DELETE и DROP.
Что такое оконные функции и как они используются в аналитике.
Как использовать PARTITION BY и ORDER BY в оконных функциях.
Как обрабатывать NULL значения в SQL и какие функции для этого помогают, например, COALESCE и ISNULL.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17❤5