Школа Больших Данных
566 subscribers
117 photos
711 links
Канал Школы Больших Данных https://www.bigdataschool.ru/ - обучение технологиям Big Data: разработка приложений и администрирование кластеров Hadoop, Kafka, Spark, NoSQL, Python, ML и DS.
Тел: +7 (495) 41-41-121
Контакты: @Bigdataschool_msk @olga_burykh
Download Telegram
#python #тест @BigDataSchool_ru
Тест по основам Python.
Какой оператор отвечает за прерывание работы цикла в Python?
Anonymous Quiz
0%
stop
5%
try-except
90%
break
5%
continue
#python #тест @BigDataSchool_ru
Тест по основам Python.
Какие из видов функций являются уникальными?
Anonymous Quiz
6%
генераторы
75%
именные
13%
анонимные
6%
итераторы
#python @BigDataSchool_ru Тест по основам Python.
Чем являются функции в Python?
Anonymous Quiz
4%
экземплярами
47%
объектами
44%
методами
4%
классами
#python @BigDataSchool_ru
Тест по основам Python.
Какая конструкция служит для создания анонимной функции?
Anonymous Quiz
19%
lambda func
8%
anonymous
73%
lambda
0%
omega
#python @BigDataSchool_ru
Тест по основам Python.
Какой метод отвечает за добавление элемента в конец списка?
Anonymous Quiz
0%
include()
6%
add()
6%
extend()
87%
append()
#Python #видео

Новое видео на нашем ютуб канале.

Демонстрируем написание собственного telegram бота на языке программирования Python. Бот отвечает на ваши сообщения с помощью обращения к ChatGPT. К тому же, в проекте реализован механизм запоминания контекста.
Для удобного деплоя используется технология Docker.

@BigDataSchool_ru
https://youtu.be/vrhpzPNV69o?si=i4al2CoYcy76HutA
#python @BigDataSchool_ru
Тест по основам Python.
С чем напрямую связан метод?
Anonymous Quiz
0%
с интерфейсом
82%
с классом
0%
с процедурой
18%
с функцией
#python @BigDataSchool_ru
Тест по основам Python.
С каким оператором обычно используется конструкция else?
Anonymous Quiz
39%
break
8%
except
21%
continue
32%
try
#Python #статьи
Еще раз о том, что такое реестр схем Kafka и чем он полезен

Реестр схем (Schema Registry) – это модуль Confluent для Apache Kafka, который позволяет централизовано управлять схемами данных полезной нагрузки сообщений в топиках.

Приложения-продюсеры и потребители Kafka могут использовать эти схемы для обеспечения согласованности и совместимости данных по мере их эволюционного развития.
Можно сказать, что реестр схем — это ключевой компонент управления данными в потоковой системе, помогающий обеспечить их качество, соблюдение стандартов и прозрачность происхождения с поддержкой аудита и совместной работы между разными командами.
Определив схемы данных для полезной нагрузки и зарегистрировав ее в реестре, ее можно переиспользовать, частично освобождая приложение-потребитель от валидации структуры данных. Когда  продюсер отправляет события в Kafka, схема данных включается в заголовок сообщения, а Schema Registry гарантирует валидность структуры данных для конкретного топика.

Таким образом, реестр схем позволяет продюсерам и потребителям взаимодействовать в рамках четко определенного контракта данных, контролируя эволюционное развитие схемы с помощью четких и явных правил совместимости.
Также это оптимизирует полезную нагрузку по сети, передавая идентификатор схемы вместо всего определения схемы. Фактически реестр схемы состоит из REST-сервиса для проверки, хранения и получения схем в форматах AVRO, JSON Schema и Protobuf. Сериализаторы и десериализаторы этих 3-х форматов данных подключаются к клиентам Apache Kafka, т.е. приложениям-продюсерам и потребителям для хранения и извлечения схем полезной нагрузки.

Реестр схем на платформе Upstash, где развернут мой экземпляр Apache Kafka, полностью совместим с реестром схем Confluent. Поэтому его можно использовать с сериализаторами и десериализаторами io.confluent.kafka.serializers.KafkaAvroSerializer/Deserializer и io.confluent.connect.avro.AvroConverter, а также другими UI-инструментами, поддерживающими реестр схем Confluent.

Чтобы показать, как это работает, написали небольшое Python-приложение, которое рассмотрим далее.

@BigDataSchool_ru
https://bigdataschool.ru/blog/news/kafka/kafka-python-producer-example-with-schema-registry-on-upstash.html
#python @BigDataSchool_ru
Тест по основам Python.
Какой из предложенных является оператором среза?
Anonymous Quiz
2%
[X:Y]*
0%
[Y]
98%
[X:Y]
0%
[X]
#python @BigDataSchool_ru
Тест по основам Python.
Что представляют собой словари в Python?
Anonymous Quiz
17%
массивы
29%
json-объекты
43%
неупорядоченные коллекции
11%
отсортированные списки
#python @BigDataSchool_ru
Тест по основам Python.
За создание какой функции отвечает конструкция def?
Anonymous Quiz
3%
рекурсивной функции
3%
функции-итератора
94%
именной функции
0%
анонимной функции
#Python #Kafka #confluentkafka
Что выбрать Python-разработчику для работы с Kafka: confluent-kafka vs kafka-python

Почему производительность confluent-kafka выше, чем у kafka-python, чем еще отличаются эти Python-библиотеки для разработки клиентов Apache Kafka, и что выбирать.

Сравнение
Python-библиотек для разработки клиентов Kafka
Хотя Java считается более подходящей для создания высоконагруженных приложений, многие разработчики используют Python, который намного проще. Этот язык программирования подходит даже для написания продюсеров и потребителей Apache Kafka. Но в этом случае перед разработчиком встает выбор: какую библиотеку использовать. Например, раньше я обычно пользовалась библиотекой kafka-python. Однако, у нее есть альтернатива — confluent-kafka.
Статья
Курсы: DEVKI KAFKA ADS-KAFKA
Наш сайт
Копирование, размножение, распространение, перепечатка (целиком или частично), или иное использование материала допускается только с письменного разрешения правообладателя ООО "УЦ Коммерсант"
#Потоковыесоединения #Kafka #Python #JSONсхема
Потоковые соединения из Kafka на Python: практический пример

Сегодня я покажу простую демонстрацию потоковой агрегации данных из разных топиков Apache Kafka на примере Python-приложений для соединения событий пользовательского поведения с информацией о самом пользователе.

Постановка задачи
Рассмотрим примере кликстрима, т.е. потокового поступления данных о событиях пользовательского поведения на страницах сайта. Предположим, данные о самом пользователе: его идентификаторе, электронном адресе и имени попадают в топик под названием CorpAppsTopic. JSON-схема полезной нагрузки выглядит так:
Статья
Курсы: DEVKI KAFKA ADS-KAFKA
Наш сайт
Копирование, размножение, распространение, перепечатка (целиком или частично), или иное использование материала допускается только с письменного разрешения правообладателя ООО "УЦ Коммерсант"