Базы данных | Access, SQL, Big Data
30.6K subscribers
253 photos
97 videos
394 links
Всё о базах данных простым языком.

Сотрудничество: @max_excel

РКН: vk.cc/cHhG5h
Download Telegram
Media is too big
VIEW IN TELEGRAM
Куда устроиться со знанием SQL?

В этом ролике автор подробно разбирает должности и специальности, для которых требуются навыки работы с базами данных и знания языка SQL. Вы узнаете, куда можно устроиться, где больше платят и что еще требуется знать помимо самого языка SQL.

Смотреть это видео на youtube: youtu.be/z6iJ3lwQyZI
О векторных базах данных простым языком

Векторная база данных — это простая база данных, оптимизированная под хранение и поиск векторов, даже таких, которые состоят из сотен и тысяч измерений. Когда вы запрашиваете вектор, вместо поиска точных совпадений, он находит элементы на основе их приближённости к запросу.

Базы данных
Как надёжно стереть секретную информацию из базы данных

Зачем вообще "надёжно" стирать данные? Главное же, чтобы пользователь через интерфейс СУБД не мог их достать. Мало ли, что там за остатки данных в файлах болтаются, это же не проблема. Или нет?

Базы данных
ZIP-бомба в формате Apache Parquet

Исторически ZIP-бомба представляла собой архивный файл, при распаковке которого можно вызвать зависание операционной системы или рабочего приложения путём заполнения всего свободного места на носителе или оперативной/рабочей памяти. В этом смысле её можно считать разновидностью DoS-атаки.

Базы данных
Media is too big
VIEW IN TELEGRAM
Практика по SQL: объединение таблицы с самой собой (SELF JOIN)

В этом видеоуроке автор подробно рассматривает пример работы с SELF JOIN - объединения таблицы с самой собой.

0:00 Условия задачи
2:35 Создание таблицы для экспериментов в PostgreSQL
3:33 Объединение таблицы с самой собой (SELF JOIN)
6:27 Условие фильтрации
7:17 Проверка решения
8:31 Итоги

Смотреть это видео на youtube: youtu.be/G50eazjD3o0
Кэшируем поток данных из Kafka в Tarantool: подробный пример реализации с кодом и результатами

В этой статье автор расскажет о том, как можно наладить взаимодействие Kafka и Tarantool, зачем может понадобиться кэширование потока из Kafka в Tarantool, и даст подробную пошаговую инструкцию, с которой каждый сможет применить эти наработки в собственной системе.

Базы данных
Как мы сократили потребление ресурсов без потери производительности благодаря exactly-once

В этой статье автор расскажет, как в его компании решили задачу объединения двух топиков с соотношением один ко многим и почему не устроило решение на Kafka-streams и RocksDB. А также о том, как, опираясь на гарантии доставки exactly-once, смогли снизить требования к ресурсам в несколько раз.

Базы данных
Аналитики с диапазонами дат в MS SQL

Развернув разработчику обратно очередной Pull Request с поиском по аналитике, принимающей разные значения в разные промежутки времени, автор решил обсудить этот вопрос на планерке. И был удивлен, что подавляющее большинство разработчиков не понимают, как эффективно искать на SQL в таких случаях. В итоге автор решил написать эту статью.

Базы данных
Media is too big
VIEW IN TELEGRAM
Установка PostgreSQL и pgAdmin4 на Linux Ubuntu

В этом видеоуроке автор подробно и наглядно разбирает процесс установки и настройки PostgreSQL и pgAdmin4 на Linux Ubuntu.

Вы узнаете, как создавать базу данных, пользователя, как выдавать ему права и рассмотрите несколько основных команд.

Смотреть это видео на youtube: youtu.be/kWUW3sMK0Mk
Media is too big
VIEW IN TELEGRAM
Как и где учить SQL для начинающих?

В этом видео автор разберет как лучше учить SQL с нуля для анализа данных. Вы узнаете что учить в первую очередь, где это учить, а также рассмотрите профильные курсы и бесплатные материалы, рекомендованные автором.

00:00 Что такое SQL и СУБД
01:32 Чем плох классический подход к изучению SQL
02:20 SQL запросы
02:49 Где учить теорию? (статьи и курсы)
03:23 Что нужно знать для работы аналитиком?
04:22 Функции агрегирования
05:16 SQL Join
07:00 Подзапросы
08:31 Оконные функции
10:42 Отличные сайты для изучения SQL

Смотреть это видео на youtube: youtu.be/AX-w4fr46RM
Как обновить PostgreSQL и не потерять данные: метод минимизации простоя

Недавно автору этой статьи потребовалось обновить кластер PostgreSQL, который обрабатывает более 20 000 транзакций в секунду и состоит из мастера и реплики, с версии 13 до 16 с минимальным простоем. Помимо перехода на более актуальную версию, это решало и ряд существующих проблем, связанных с производительностью и поддержкой.

Базы данных
Media is too big
VIEW IN TELEGRAM
Блокировки в SQL

В этом видеоуроке автор подробно и наглядно разбирает процесс работы с механизмом блокировок и взаимоблокировок в SQL.

Смотреть это видео на youtube: youtu.be/TJ55HOaA4oU
DataHub: веб-песочница для тех, кто изучает SQL

В этой статье автор разберет на что способен веб-редактор MySQL хранилища и почему это отличный инструмент для работы тем, кто изучает SQL.

Базы данных
Интернационализация баз данных с доступом через ORM

IT-сообщество использует различные способы хранения многоязычных данных. Способы эти кардинально различаются эффективностью запросов, устойчивостью к добавлению новых локализаций, объемом данных, удобством для приложения-потребителя. Однако в индустрии все еще нет решения Database Internationalization for Dummies. В этой статье автор попробует немного заполнить этот пробел: опишет возможные способы, оценит их преимущества и недостатки и выберет эффективные.

Базы данных
Большой гайд по миграциям в Django: полезные советы и обход типичных подводных камней

В этой статье автор разберет фиктивное применение, data-миграции, «сухую проверку» и основные проблемы, которые возникают у начинающих. А также поделится полезными советами и подсветит тонкости работы.

Базы данных
Партиционированный Postgres: немного о проблемах с лимитами

В то время как пользователи видят позитивные стороны технологий, разработчики обычно сталкиваются с ограничениями/недоработками/багами и видят продукт с совсем другой стороны. Вот и в этот раз: после публикации результатов сравнительного тестирования, где прогонялись запросы теста Join-Order-Benchmark на базе с партициями и без, автора не отпускало ощущение, что при наличии партиций постгрес должен строить план хуже, чем без них. И это должен быть не просто баг, а технологическое ограничение.

Базы данных
Знакомство со слоем абстракции Netflix для хранения временных рядов

Netflix продолжает расширять бизнес и диверсифицироваться в различных направлениях, вроде доставки видео по запросу и гейминга. В результате всё важнее становятся технологии, обеспечивающие загрузку временных (темпоральных) данных в системы компании и их хранение.

Базы данных
Авторизация в PostgreSQL через доменные группы

Красивой схемы раздачи прав через группы без написания расширений у автора не получилось, но даже реализованное решение сильно упростило жизнь.

Базы данных
PostgreSQL — особенности работы с памятью для 1С-систем (часть 2)

Продолжаем исследовать и настраивать память в PostgreSQL. В первой части автор рассмотрел параметры shared_buffers, maintenance_work_mem, autovacuum_work_mem. А сегодня на повестке параметры temp_buffers и work_mem.

Базы данных
Всегда ли хорош Index Only Scan?

Среди применяемых в PostgreSQL методов доступа к данным Index Only Scan стоит особняком, считаясь у многих разработчиков "волшебной пилюлей" для ускорения работы запроса. Об этом поговорим в статье.

Базы данных
This media is not supported in your browser
VIEW IN TELEGRAM
Реляционные и булевы операторы в SQL

В этом видеоуроке автор подробно разбирает работу с реляционными и булевыми операторами в базах данных.

0:00 Вступление
0:07 Реляционные операторы
1:44 Булевы операторы
2:25 Пример
2:48 Пример в запросах
3:47 Итог

Смотреть это видео на youtube: youtu.be/-e_Nduyi3uQ