Data Science. SQL hub

Трюк дня. Агрегирование записей в PostgreSQL. Решение

WITH projects (task_id, start_date, end_date) 
AS (VALUES 
(1, CAST('10-01-20' AS date), CAST('10-02-20' AS date)), 
(2, CAST('10-02-20' AS date), CAST('10-03-20' AS date)), 
(3, CAST('10-03-20' AS date), CAST('10-04-20' AS date)), 
(4, CAST('10-13-20' AS date), CAST('10-14-20' AS date)), 
(5, CAST('10-14-20' AS date), CAST('10-15-20' AS date)), 
(6, CAST('10-28-20' AS date), CAST('10-29-20' AS date)), 
(7, CAST('10-30-20' AS date), CAST('10-31-20' AS date))),

-- получим такие даты начала, которых не существует в колонке даты окончания (это 'настоящие' даты начала проекта) 

t1 AS (
SELECT start_date
FROM projects
WHERE start_date NOT IN (SELECT end_date FROM projects) ),

-- получим такие даты окончания, которые не существуют в колонке дат начала (это 'настоящие' даты окончания проекта) 
t2 AS (
SELECT end_date
FROM projects
WHERE end_date NOT IN (SELECT start_date FROM projects) ),

--отфильтруем допустимые пары начало-окончание (начало < окончание), затем найдем правильную дату окончания для каждой даты начала (минимальная дата окончания, поскольку нет пересекающихся проектов)

t3 AS (
SELECT 
   start_date, 
   MIN(end_date) AS end_date
FROM t1, t2
WHERE start_date < end_date
GROUP BY 1 )
SELECT 
   *, 
   end_date - start_date AS project_duration
FROM t3
ORDER BY 3, 1

#tips

2.3K views07:19

Data Science. SQL hub

Как очищать данные при помощи SQL

Источник

Telegraph

Как очищать данные при помощи SQL

Процесс анализа вкратце Раньше столбцы и значения данных приходилось редактировать вручную. Приходилось извлекать «сырые» данные из CSV-файла или базы данных, а затем изменять их в Python-скрипте. Приходилось ждать, пока машина настроит и очистит данные.…

2.3K views07:20

Data Science. SQL hub

3.1K views10:15

Data Science. SQL hub

Какой оператор нужно вставить вместо [?], чтобы создать временную таблицу?

Anonymous Quiz

ничего из перечисленного

428 voters3.0K views10:15

Data Science. SQL hub

Иерархические структуры данных и Doctrine

Хранение иерархических данных (или попросту — деревьев) в реляционных структурах задача довольно нетривиальная и вызывает некоторые проблемы, когда разработчики сталкиваются с подобной задачей.

В первую очередь, это связано с тем, что реляционные базы не приспособлены к хранению иерархических структур (как, например, XML-файлы), структура реляционных таблиц представляет из себя простые списки. Иерархические же данные имеют связь родитель-наследники, которая не реализована в реляционной структуре.

Тем не менее, задача хранить деревья в базе данных рано или поздно возникает перед любым разработчиком.

Ниже мы подробно рассмотрим, какие существуют подходы в организации хранения деревьев в реляционных БД, а также рассмотрим инструментарий, который нам предоставляет ORM Doctrine для работы с такими структурами.

Читать дальше

@sqlhub

2.2K viewsedited 09:39

Data Science. SQL hub

Интерактивный учебник по SQL

https://sql-academy.org/ru/guide

sql-academy.org

Интерактивный курс по SQL — SQL Academy

Всесторонний интерактивный бесплатный онлайн курс по SQL, спроектированный так, чтобы навсегда изменить твоё отношение к SQL. Мы вместе пройдём путь, чтобы понять как этот язык работает, и получим все необходимые навыки для эффективного применения его на…

2.1K viewsedited 08:03

Data Science. SQL hub

Forwarded from Анализ данных (Data analysis)

Автоматическое масштабирование БД в Kubernetes для MongoDB, MySQL и PostgreSQL

Читать

@data_analysis_ml

Telegraph

Автоматическое масштабирование БД в Kubernetes для MongoDB, MySQL и PostgreSQL

Автор оригинала: Dmitriy Kostiuk и Mykola Marzhan Стремясь к повышению производительности базы данных, вы можете столкнуться с ситуацией, когда оптимизации и настройки уже недостаточно. Если вы не можете заменить движок БД, а для настройки параметры рабочей…

1.8K views11:25

Data Science. SQL hub

Отличаются ли в SQL операторы AND и & (амперсанд)?

Anonymous Quiz

AND имеет более низкий приоритет, чем &

17%

Между ними нет отличий

45%

Оператор & не поддерживается стандартом SQL

AND имеет более высокий приоритет, чем &

23%

Посмотреть ответы

469 voters2.2K views07:44

Data Science. SQL hub

Колоночные базы данных
#nosql

"Колоночные базы данных позволяют эффективно делать сложные выборки на больших таблицах. Изменение структуры больших таблиц происходит мгновенно, а сжатие данных позволяет сэкономить кучу места. Однако не следует использовать колоночные базы для случаев с обычными выборками по ключу и известными структурами запросов. Для этого лучше подойдут обычные (строчные) СУБД."

Читать

@data_study

2.0K viewsedited 08:07

Data Science. SQL hub

Типы баз данных

@sqlhub

2.2K viewsedited 09:36

Data Science. SQL hub

5 полезных запросов для MS SQL

За 2 года работы с MS SQL у меня накопился перечень из 5 запросов: для поиска, отладки, агрегации и обработки множеств и таблиц.

https://tproger.ru/articles/5-poleznyh-zaprosov-dlja-ms-sql/

@sqlhub

Tproger

5 полезных запросов MS SQL на каждый день

За 2 года работы с MS SQL у меня накопился перечень из 5 запросов: для поиска, отладки, агрегации и обработки множеств и таблиц.

2.4K viewsedited 18:48

Data Science. SQL hub

sql-server-cheat-sheet-v1.pdf

937.5 KB

MSSQL server cheat-sheet

@sqlhub

7.7K viewsedited 11:55

Data Science. SQL hub

Поясните разницу между кластерными и некластерными индексами

#вопросы_с_собеседований

Кластерный индекс используется для сортировки данных в строках по их ключевым значениям. Кластерный индекс напоминает телефонный справочник. Мы можем открыть справочник на David (например, в поисках «David, Thompson») и найти информацию обо всех Дэвидах, по порядку. Поскольку данные расположены друг за другом, это помогает выбирать их в запросах с указанием диапазона. Также кластерный индекс имеет отношение к тому, как, собственно, хранятся данные. В таблице может быть только один кластерный индекс.

Некластерный индекс хранит данные в одном месте, а индексы — в другом. Этот индекс имеет указатели на расположение данных. Поскольку индекс не хранится там же, где и данные, для каждой таблицы может существовать много некластерных индексов.

Давайте рассмотрим основные различия между кластерными и некластерными индексами.

@sqlhub

1.5K views09:00

Data Science. SQL hub

Что такое SQL-инъекции и как им противостоять

SQL-инъекции (SQL injections, SQLi) — самый хорошо изученный и простой для понимания тип атаки на веб-сайт или веб-приложение. Тем не менее, он странным образом остается весьма распространенным и в наши дни. Организация OWASP (Open Web Application Security Project) упоминает SQL-инъекции в своем документе OWASP Top 10 2017 как угрозу номер один для безопасности веб-приложений, и вряд ли положение сильно изменилось за четыре года.

Читать

@sqlhub

1.5K views08:09

Data Science. SQL hub

✅ 50 популярных вопросов и ответов на собеседовании по SQL Server

Здесь мы составили список из 50 популярных вопросов для собеседований по SQL. Эти вопросы охватывают все, от основ SQL Server до некоторых его сложных концепций:

Читать

@sqlhub

1.8K views08:07

Data Science. SQL hub

Шпаргалка по оконным функциям в SQL

1.9K views07:19

Data Science. SQL hub

⚡️ Аналитика данных с SQL- блог ведущего Дата саентиста, работющего с данными в Uber, одного из авторов🔥 Machine Learning. Материал канала поможет реально вырасти до профессионала по работе с данными и получить самую высокоплачиваю ит-профессию.

1 канал вместо тысячи учебников и курсов, подписывайтесь: 👇👇👇

@data_analysis_ml

1.4K views09:38

Data Science. SQL hub

🚀 Советы по производительности оператора SQL TOP

Оператор TOP используется для ограничения числа строк, которые извлекаются или обновляются в одной или нескольких таблицах. Это ограничение на число строк можно задать как фиксированным значением, так и процентом строк в таблице. Например, следующий запрос вернет первые 10 случайных строк из таблицы Production.

SELECT TOP 10 Name,ProductNumber,SafetyStockLevel FROM Production.Product

Читать дальше

@sqlhub

1.5K views09:38

Data Science. SQL hub

SQLite: как организовывать таблицы

https://nuancesprog.ru/p/12028/

@sqlhub

NOP::Nuances of programming

SQLite: как организовывать таблицы

Организация данных — все равно, что поддержание порядка на рабочем месте. Хорошо всегда знать, где что находится, и в случае необходимости освобождать больше места для хранения или работы.

1.6K views18:48

Data Science. SQL hub

Какого строкового типа данных нет в SQL:

Anonymous Quiz

578 voters1.5K views09:48

Data Science. SQL hub

Hunner - микро фреймворк для тестирования на проникновение. Сканирует на sql, xss, ddos, bruteforce ftp, ssh и д.р уязвимости.

Установка ⚙️
$ git clone https://github.com/b3-v3r/Hunner
$ cd Hunner

Использование ▶️
$ python hunner.py

💡 GitHub

@sqlhub

4.1K viewsedited 06:54

About

Blog

Apps

Platform