Базы данных | Access, SQL, Big Data
30.5K subscribers
249 photos
100 videos
395 links
Всё о базах данных простым языком.

Сотрудничество: @max_excel

РКН: vk.cc/cHhG5h
Download Telegram
Процедура обнаружения взаимоблокировок в PostgreSQL

РostgreSQL автоматически обнаруживает взаимоблокировки. В этой статье автор рассмотрит процедуру их обнаружения и ее трудоёмкость.

Базы данных
SQL и Python для анализа цен на новостройки в СПб или ценнейший навык для маркетолога

«Зачем мне SQL и Python?» — задают резонный вопрос маркетологи или менеджеры по продукту, особенно в сфере недвижимости, оптовой торговли, услуг для бизнеса: «У нас нет миллионов строк данных, нет логов, мы успешно работаем с несколькими таблицами в Excel». Да, действительно, у вас может не быть корпоративного хранилища данных в компании, и основой автоматизации работы с данными является Power Query, но у вас точно есть данные, которые вы получаете от смежных отделов, из CRM/CDP, MES, АСУ ТП.

Базы данных
Быстрый путь блокирования в PostgreSQL

В представлении pg_locks есть столбец fastpath, который означает, что блокировка получена по быстрому пути. В документации быстрый путь блокирования описан коротко. В этой статье автор рассмотрит быстрый путь блокирования, и чем он лучше обычного.

Базы данных
Media is too big
VIEW IN TELEGRAM
Практика по SQL: удаление дубликатов email

В этом видеоуроке автор разбирает решение задачи по удалению дубликатов записей в таблице при помощи использования подзапросов в команде DELETE.

00:00 Описание задачи
01:28 Создание таблицы для экспериментов
02:31 Разработка подзапроса
03:21 Разработка команды для удаления дубликатов
04:28 Запуск команды на Leetcode
05:15 Учет особенностей MySQL
06:24 Итоги

Смотреть это видео на youtube: youtu.be/nF-l3tZovKY
Дорожная карта для изучения SQL и баз данных

В этом материале автор представляет свой roadmap, который поможет вам научиться работать с SQL. Roadmap предлагает отличный старт для начала изучения SQL, продолжайте обучаться и практиковаться, и вы увидите результаты усилий уже в ближайшее время.

Базы данных
OpenSearch как сервис: обзор и тривиальный пример использования на Python

Проблема традиционных реляционных баз данных в том, что они не всегда справляются с обработкой огромных объемов информации. В этой статье автор расскажет, как описанную проблему решает OpenSearch, как развернуть кластеры этой платформы за несколько минут и начать с ней работать в Python.

Базы данных
Тестирование БД в легаси-проекте

В этом материале автор поделится своим опытом написания юнит-тестов для базы данных в рамках легаси-проекта.

Базы данных
Анализ сентимента и эмоционального окраса текстов с помощью SQL

С учетом растущего объема данных и важности понимания пользовательских настроений, это навык, который может приносить значительную ценность компаниям и организациям в разных сферах деятельности.

Базы данных
Руководство по SQL: Как лучше писать запросы

В этой статье вы узнаете о антипаттернах, планах выполнения, time complexity, настройке запросов и оптимизации в SQL.

Базы данных
Point-in-time Recovery. Как уменьшить RPO для базы данных

Падение любой информационной системы — это по умолчанию больно и неприятно. В этой статье автор на примере PostgreSQL разберет принципы работы баз данных и расскажет о том, как минимизировать последствия инцидентов с помощью оптимизации RPO (Recovery point objective).

Базы данных
NULL в SQL: что это такое и почему его знание необходимо каждому разработчику

NULL - это специальное значение, которое используется в SQL для обозначения отсутствия данных. Оно отличается от пустой строки или нулевого значения, так как NULL означает отсутствие какого-либо значения в ячейке таблицы. Подробнее о NULL читайте в этой статье.

Базы данных
Media is too big
VIEW IN TELEGRAM
Основы SQL: реляционная модель, базовые запросы

В этом видео автор подробно говорит про реляционную модель и язык SQL. Вы узнаете, что такое SQL Server, какие он имеет версии редакции и почему это важно, а также разберете базовые запросы SQL.

Смотреть это видео на youtube: youtu.be/3PXPpU0kncM
Меньше кода, больше результата: применяем sqlc для работы с БД

Инструмент, который генерирует производительный и безопасный код для работы с базой данных — миф или реальность? В этой статье автор обсудит, что такое sqlc, откуда он появился и какие идеи в него заложены. Вы разберёте его возможности и ограничения, а также кейсы, когда он подходит лучше всего.

Базы данных
Когда говорим про Big Data, часто представляем набор разрозненных инструментов — отдельно хранилище, отдельно обработка, отдельно ML. Но индустрия постепенно движется в сторону более интегрированных платформ, которые покрывают весь цикл работы с данными. YTsaurus — это одна из таких платформ, и по тому, как она развивается, видно, что её последовательно расширяют в сторону более универсального решения.

За последний год вышло много обновлений, видно фокус на задачах ML. Внутри Яндекса YTsaurus используется для обучения моделей и batch-инференса.

Отдельное внимание уделяется эксплуатационной стороне: развиваются мониторинг, сервисы для интроспекции и административные инструменты. Параллельно расширяются и возможности хранилища данных — в частности, за счет поддержки constraints и row-level security.

Разработку YTsaurus возглавляет Максим Бабенко — руководитель отдела технологий распределенных вычислений в Яндексе, который также преподает и участвует в образовательных программах.
Базы данных: большой обзор типов и подходов.

В этом материале вы узнаете, какие бывают базы данных, какие их особенности важно помнить, как в работе с данными учитывать характеристики системы и планы масштабирования, в какую из тем нужно углубиться для решения конкретной задачи. А также как при возникновении багов определить, является ли работа с БД источником проблемы (и если да, то в какую сторону копать).

Базы данных
Работа с SQLite в Python (для чайников)

В этом руководстве автор покрывает все основные аспекты использования SQLite, начиная с установки и создания базы данных, и заканчивая выполнением сложных запросов и управлением транзакциями.

Базы данных
Media is too big
VIEW IN TELEGRAM
JOIN в SQL

В этом видеоуроке автор подробно и наглядно разбирает запросы данных из нескольких таблиц с использованием оператора JOIN.

00:00 Пример базы данных
01:53 JOIN в SQL
04:06 Псевдонимы таблиц и столбцов в JOIN
05:23 Фильтрация данных
06:59 Сортировка данных
07:32 Итоги

Смотреть это видео на youtube: youtu.be/SYJ1B2KrDCQ
Отказоустойчивость в MinIO

В этой статье автор поделится своим опытом использования MinIO, сделав акцент на отказоустойчивости и сохранности данных в случае инцидентов разной степени — от выпадения диска до пожара в цоде.

Базы данных
Media is too big
VIEW IN TELEGRAM
Базы данных: SQL уроки для начинающих

В этом видеоуроке автор кратко проходится по теории реляционных баз данных и рассматривает язык запросов SQL на примере СУБД MySQL. Вы разберете основные конструкции языка и научитесь создавать и изменять таблицы и получать с них данные.

00:00 Введение
02:53 О реляционных БД
03:15 1 и 2 нормальные формы
04:50 Связи между таблицами
06:12 Начало работы с MySQL
06:47 SHOW, CREATE, DROP DATABASE
07:40 SHOW, CREATE TABLES
10:10 INSERT INTO
10:45 SELECT
11:40 DISTINCT
12:10 WHERE
13:07 AS
13:30 ORDER BY
14:40 UPDATE, SET
15:30 LIKE
18:10 Multiple INSERT
19:10 Объединение таблиц (JOINS)
22:04 Агрегатные функции
23:10 GROUP BY

Смотреть это видео на youtube: youtu.be/IK6e1SFCdow
Enterprise Data Warehouse: компоненты, основные концепции и типы архитектур

В этой статье автор разберет, что такое EDW, каких типов они бывают и какие функции имеют, а также как они используются в обработке данных. Вы узнаете, чем корпоративные хранилища отличаются от обычных, какие типы хранилищ данных существуют и как они работают. В первую очередь автор дает информацию о ценности для бизнеса каждого архитектурного и концептуального подхода к построению хранилища.

Базы данных
Лучшие практики при работе с мастер-данными

Основная цель управления мастер‑данными — сформировать единое представление об объектах, над которыми компания осуществляет свою деятельность. В этой статье автор поделится лучшими практиками в этом направлении. При этом призывает вас оценивать влияние и принимать собственное решение о применимости практики в вашем кейсе.

Базы данных