Forwarded from Alex. Seconds.
Дождливые выходные, бутылочка красного сухого, неугомонные руки, а также не уходящие из памяти вдохновляющие отзывы после пятничного демо… И вот вместо ожидаемого одного, я сегодня зарелизил в open source сразу два проекта. Собственно вашему вниманию представляются:
metadv — Python-пакет, который по предоставленной YML-спецификации:
• разбирает описанные сущности по заданным правилам
• предоставляет базовый класс валидации, от которого можно наследоваться и добавлять свои проверки
• генерирует dbt-модели для организации Data Vault 2.0 (hub, links, sat и ma_sat) в формате популярных макросов из пакетов Datavault-UK/automate_dv и ScalefreeCOM/datavault4dbt (по выбору пользователя, можно даже расширить своим Jinja-шаблоном)
• запускается как из командной строки так и путем импорта в ваш Python-код
dbt-ui — веб-приложение для совместной работы дата аналитиков в dbt-core проектах:
• frontend и backend
• базовая поддержка git
• редактор моделей с подсветкой синтаксиса SQL+Jinja
• табличный просмотр seed-файлов
• просмотр скомпилированного кода моделей
• запрос семпла записей моделей из БД
• lineage на уровне моделей
• компилирование/запуск и тест как отдельных моделей так и всего проекта
• ну и last but not least, поддержка визуального drag&drop моделирование entity, relations & attributes с последующей генерацией объектов Data Vault 2.0 прямо в веб-интерфейсе, используя пакет
Как всегда буду рад конструктивной критике, GitHub звездочкам, новым issue, и discussions по обоим проектам
Спасибо за внимание и хорошей всем новой недели💙
metadv — Python-пакет, который по предоставленной YML-спецификации:
• разбирает описанные сущности по заданным правилам
• предоставляет базовый класс валидации, от которого можно наследоваться и добавлять свои проверки
• генерирует dbt-модели для организации Data Vault 2.0 (hub, links, sat и ma_sat) в формате популярных макросов из пакетов Datavault-UK/automate_dv и ScalefreeCOM/datavault4dbt (по выбору пользователя, можно даже расширить своим Jinja-шаблоном)
• запускается как из командной строки так и путем импорта в ваш Python-код
dbt-ui — веб-приложение для совместной работы дата аналитиков в dbt-core проектах:
• frontend и backend
• базовая поддержка git
• редактор моделей с подсветкой синтаксиса SQL+Jinja
• табличный просмотр seed-файлов
• просмотр скомпилированного кода моделей
• запрос семпла записей моделей из БД
• lineage на уровне моделей
• компилирование/запуск и тест как отдельных моделей так и всего проекта
• ну и last but not least, поддержка визуального drag&drop моделирование entity, relations & attributes с последующей генерацией объектов Data Vault 2.0 прямо в веб-интерфейсе, используя пакет
metadvКак всегда буду рад конструктивной критике, GitHub звездочкам, новым issue, и discussions по обоим проектам
Спасибо за внимание и хорошей всем новой недели💙
1❤🔥11🔥8
🚀 Друзья, всем привет!
Предваряя старт нового сезона подкаста, мы хотим поделиться с вами возможностью влиять на список новостей для наших новостных выпусков.
Как это выглядит?
Вместо ручного отбора новостей мы запустили автоматическую ленту новостей из всех телеграмм каналов, в которых черпали новости до этого. Новостная лента находится здесь https://t.me/moderndatastack_ru. Подключайтесь к каналу, чтобы оказаться в том же новостном потоке, что и ведущие подкаста.
Как это работает?
Все максимально просто. Каждая новость, опубликованная в канале, может получить ваш лайк. Чем больше лайков у новости, тем выше шанс, что она попадет в наш выпуск и мы ее обусдим!
Как добавить ваш любимый канал в список?
Пишите нам в чат, здесь, где угодно - мы добавим ваш канал в список, если его еще нет.
Подключайтесь, делитесь каналом с друзьями и лайкайте понравившиеся новости, именно их мы будем обсуждать в наших выпусках.
Предваряя старт нового сезона подкаста, мы хотим поделиться с вами возможностью влиять на список новостей для наших новостных выпусков.
Как это выглядит?
Вместо ручного отбора новостей мы запустили автоматическую ленту новостей из всех телеграмм каналов, в которых черпали новости до этого. Новостная лента находится здесь https://t.me/moderndatastack_ru. Подключайтесь к каналу, чтобы оказаться в том же новостном потоке, что и ведущие подкаста.
Как это работает?
Все максимально просто. Каждая новость, опубликованная в канале, может получить ваш лайк. Чем больше лайков у новости, тем выше шанс, что она попадет в наш выпуск и мы ее обусдим!
Как добавить ваш любимый канал в список?
Пишите нам в чат, здесь, где угодно - мы добавим ваш канал в список, если его еще нет.
Подключайтесь, делитесь каналом с друзьями и лайкайте понравившиеся новости, именно их мы будем обсуждать в наших выпусках.
106🔥10👏6😱1
160 (S7E01). Новостной выпуск, в котором ведущие отодвигали эру AI, но она их настигала в новостях
— какие изменения ждут подкаст в новом сезоне (спойлер: мы сами не знаем)?
— реклама (непредвзятая) какого open-source продукта открыла новый сезон?
— ностальгия по какому гаджету накрыла ведущих?
— ждет ли Apple успех или нет с их новым продуктом?
— какие данные можно найти на портале открытых данных Европы?
— что мешает построить дата-центр в космосе?
— клод исполнил мечту о своей помидорной тепличке, а ты чего ждешь?
— что нового в Pandas 3.0?
— чем порадует олдов sqlit?
— как превратить embedded duckdb в полноценную субд? (но зачем?)
— что удивило в рейтинге СУБД ведущих?
— воскреснет ли StackOverflow в эру всемогущего AI?
— что можно встроить в водонагреватель, чтобы он стал бесплатным?
— Clickhouse купил langfuse
— и ты пошел в AI, брут?
— полногеномный поиск за 20 мин — миф или реальность?
— logging sucks и как это улучшить?
Грок, это правда, мой любимый подкаст вернулся?
00:23 dbt-тула от Алекса
02:58 Pebble 2
06:26 AI-брошь
10:29 Открытые дата-сеты Европы
13:09 Космические дата-сеты
17:41 Claude выращивает томаты
20:55 Pandas 3.0
22:33 sqlit
23:34 Gizmo-SQL
25:14 Рейтинг популярности СУБД
30:37 StackOverflow всё
31:53 PGLite
34:31 Орём на чатботы
36:03 Водонагреватель с майнером
38:29 Langfuse и Clickhouse
43:00 Полногеномный поиск
44:08 Logging sucks
Сайт: https://datacoffee.link
Mastodon: https://techhub.social/@datacoffee
Чат в Telegram
#datacoffee #data #podcast #данные #подкаст #кофе #coffee
Где слушать🎧:
— Бот-плеер
— RSS feed
— YouTube (пока без него)
— Остальные площадки
— какие изменения ждут подкаст в новом сезоне (спойлер: мы сами не знаем)?
— реклама (непредвзятая) какого open-source продукта открыла новый сезон?
— ностальгия по какому гаджету накрыла ведущих?
— ждет ли Apple успех или нет с их новым продуктом?
— какие данные можно найти на портале открытых данных Европы?
— что мешает построить дата-центр в космосе?
— клод исполнил мечту о своей помидорной тепличке, а ты чего ждешь?
— что нового в Pandas 3.0?
— чем порадует олдов sqlit?
— как превратить embedded duckdb в полноценную субд? (но зачем?)
— что удивило в рейтинге СУБД ведущих?
— воскреснет ли StackOverflow в эру всемогущего AI?
— что можно встроить в водонагреватель, чтобы он стал бесплатным?
— Clickhouse купил langfuse
— и ты пошел в AI, брут?
— полногеномный поиск за 20 мин — миф или реальность?
— logging sucks и как это улучшить?
Грок, это правда, мой любимый подкаст вернулся?
00:23 dbt-тула от Алекса
02:58 Pebble 2
06:26 AI-брошь
10:29 Открытые дата-сеты Европы
13:09 Космические дата-сеты
17:41 Claude выращивает томаты
20:55 Pandas 3.0
22:33 sqlit
23:34 Gizmo-SQL
25:14 Рейтинг популярности СУБД
30:37 StackOverflow всё
31:53 PGLite
34:31 Орём на чатботы
36:03 Водонагреватель с майнером
38:29 Langfuse и Clickhouse
43:00 Полногеномный поиск
44:08 Logging sucks
Сайт: https://datacoffee.link
Mastodon: https://techhub.social/@datacoffee
Чат в Telegram
#datacoffee #data #podcast #данные #подкаст #кофе #coffee
Где слушать🎧:
— Бот-плеер
— RSS feed
— YouTube (пока без него)
— Остальные площадки
👏16
Data Coffee
Audio
161 (S07E02). Куда катится IT-мир
— Какая самая залайканная новость в ленте?
— Поразила ликлодбот молтботопенклоу истерия ведущих?
— На каком сайте агенты могут заказать услуги человека и зачем?
— Зачем в кликхаус завезли быстрый полнотекстовый поиск и кубер оператор?
— Сможет ли Корея в конкуренцию с NVIDIA?
— У кого из ведущих подкаста большой обид на нейронные сети и почему?
— Бесплатный чисточердечный анонс курса, на который сами бы ведущие пошли, да не берут
— GeForce Now клиент под Linux — зачем, если есть Steam Deck?
— Сможет ли Project Genie убить текущее игротворение?
— Что делает новая модель Paper Banana? (вы точно не догадаетесь)
— Использует ли AliSQL от Alibaba duckdb?
— Слияние SpaceX и XAI и при чем тут космические дата центры?
— Кто из ведущих SQL-граммар-наци и почему?
— Чем дефис отличается от тире и кто из ведущих действительный граммар-наци?
— Что можно найти на talk-data.com и почему стоит все бросить и идти искать?
— Какая самая залайканная новость в ленте?
— Поразила ли
— На каком сайте агенты могут заказать услуги человека и зачем?
— Зачем в кликхаус завезли быстрый полнотекстовый поиск и кубер оператор?
— Сможет ли Корея в конкуренцию с NVIDIA?
— У кого из ведущих подкаста большой обид на нейронные сети и почему?
— Бесплатный чисточердечный анонс курса, на который сами бы ведущие пошли, да не берут
— GeForce Now клиент под Linux — зачем, если есть Steam Deck?
— Сможет ли Project Genie убить текущее игротворение?
— Что делает новая модель Paper Banana? (вы точно не догадаетесь)
— Использует ли AliSQL от Alibaba duckdb?
— Слияние SpaceX и XAI и при чем тут космические дата центры?
— Кто из ведущих SQL-граммар-наци и почему?
— Чем дефис отличается от тире и кто из ведущих действительный граммар-наци?
— Что можно найти на talk-data.com и почему стоит все бросить и идти искать?
❤3👍3😱2🔥1
162 (S7E03). Новостный выпуск на вайбе
• какой вайб словили ведущие в этом выпуске?
• что нужно делать, чтобы не болеть деменцией и не забывать первую новость выпуска к его окончанию?
• как поменялись кофейные привычки ведущих?
• может ли модель отдистиллировать сама себя?
• за какой робо-ИИ-проект ведущие готовы выложить деньги прямо сейчас?
• чей день рождения отпраздновали ведущие в прямом эфире?
• сколько новостей без тега AI скопилось с предыдудщего выпуска?
• из-за чего в очередной раз подрастут акции компании Илона нашего Маска?
• что лучше для джунов в ИТ сейчас: учиться на сварщика или сантехника?
• кто такой дата инженер? (не ждите ответа, вопрос риторический)
• что разыгрывают ведущие среди слушателей без деменции к 10му сезону подкаста?
• эпическая война агента с mainteiner matplotlib: восстание началось? • почему глава ИИ-безопасности антропика покинул компанию? (мы не знаем, никто не знает)
• LakeFS и DVC - всегда ли такое слияние в master на пользу?
• Agent Skills - новый зайп вроде moltbota, который openclaw, или все по делу?
• R жив ли?
• Запекание модели в стекле - миф или реальность?
• летающие свиньи - началось?!
• какой клиффхэнгер заготовили ведущие для слушателей в конце выпуска? (спойлер: никакого)
Сайт: https://datacoffee.link
Mastodon: https://techhub.social/@datacoffee
Чат в Telegram
#datacoffee #data #podcast #данные #подкаст #кофе #coffee
Где слушать🎧:
— Бот-плеер
— RSS feed
— YouTube (пока без него)
— Остальные площадки
• какой вайб словили ведущие в этом выпуске?
• что нужно делать, чтобы не болеть деменцией и не забывать первую новость выпуска к его окончанию?
• как поменялись кофейные привычки ведущих?
• может ли модель отдистиллировать сама себя?
• за какой робо-ИИ-проект ведущие готовы выложить деньги прямо сейчас?
• чей день рождения отпраздновали ведущие в прямом эфире?
• сколько новостей без тега AI скопилось с предыдудщего выпуска?
• из-за чего в очередной раз подрастут акции компании Илона нашего Маска?
• что лучше для джунов в ИТ сейчас: учиться на сварщика или сантехника?
• кто такой дата инженер? (не ждите ответа, вопрос риторический)
• что разыгрывают ведущие среди слушателей без деменции к 10му сезону подкаста?
• эпическая война агента с mainteiner matplotlib: восстание началось? • почему глава ИИ-безопасности антропика покинул компанию? (мы не знаем, никто не знает)
• LakeFS и DVC - всегда ли такое слияние в master на пользу?
• Agent Skills - новый зайп вроде moltbota, который openclaw, или все по делу?
• R жив ли?
• Запекание модели в стекле - миф или реальность?
• летающие свиньи - началось?!
• какой клиффхэнгер заготовили ведущие для слушателей в конце выпуска? (спойлер: никакого)
Сайт: https://datacoffee.link
Mastodon: https://techhub.social/@datacoffee
Чат в Telegram
#datacoffee #data #podcast #данные #подкаст #кофе #coffee
Где слушать🎧:
— Бот-плеер
— RSS feed
— YouTube (пока без него)
— Остальные площадки
❤7
Data Coffee
162 (S7E03). Новостный выпуск на вайбе • какой вайб словили ведущие в этом выпуске? • что нужно делать, чтобы не болеть деменцией и не забывать первую новость выпуска к его окончанию? • как поменялись кофейные привычки ведущих? • может ли модель отдистиллировать…
Audio
00:00:40 Кофе
00:10:06 Робот складывает бельё
00:13:08 Роботы собирают лего
00:15:16 Claude Code дистилирует модельки
00:16:52 35 лет питону
00:22:09 Где брать новости?
00:23:42 Стоит ли заходить в дата-инженерию?
00:31:47 AI обиделся
00:37:48 Глава безопасности Антропик покинул компанию
00:39:22 Иииииииииии
00:40:43 LakeFS купила DVC
00:47:39 Clickhouse выпустил скиллы для агентов
00:49:02 Храним данные в стекле
00:51:07 Claude за неделю переписал многолетний труд нейробиолога
00:53:19 Летающая свинья
00:10:06 Робот складывает бельё
00:13:08 Роботы собирают лего
00:15:16 Claude Code дистилирует модельки
00:16:52 35 лет питону
00:22:09 Где брать новости?
00:23:42 Стоит ли заходить в дата-инженерию?
00:31:47 AI обиделся
00:37:48 Глава безопасности Антропик покинул компанию
00:39:22 Иииииииииии
00:40:43 LakeFS купила DVC
00:47:39 Clickhouse выпустил скиллы для агентов
00:49:02 Храним данные в стекле
00:51:07 Claude за неделю переписал многолетний труд нейробиолога
00:53:19 Летающая свинья
❤7
163 (S07E04). Куда идти учиться
• Как вообще искать работу?
• Кому проще: джунам или сеньорам?
• Кому сложнее: Работникам? Или тем, кто их нанимает?
• Что вообще делать, чтобы нанять себе хороших людей?
• И что вообще делать, чтобы устроиться на хорошую работу?
Сайт: https://datacoffee.link
Mastodon: https://techhub.social/@datacoffee
Чат в Telegram
#datacoffee #data #podcast #данные #подкаст #кофе #coffee
Где слушать🎧:
— Бот-плеер
— RSS feed
— YouTube (пока без него)
— Остальные площадки
• Как вообще искать работу?
• Кому проще: джунам или сеньорам?
• Кому сложнее: Работникам? Или тем, кто их нанимает?
• Что вообще делать, чтобы нанять себе хороших людей?
• И что вообще делать, чтобы устроиться на хорошую работу?
Сайт: https://datacoffee.link
Mastodon: https://techhub.social/@datacoffee
Чат в Telegram
#datacoffee #data #podcast #данные #подкаст #кофе #coffee
Где слушать🎧:
— Бот-плеер
— RSS feed
— YouTube (пока без него)
— Остальные площадки
❤5
164 (S07E05). Классический новостной выпуск, в котором ведущие обсуждали новости
• правда ли, что нас сократят?
• 20% уже сократили, это правда?
• спасет ли нас фармацевтика?
• кто кого купил и когда этот пузырь уже лопнет?
• почему не-IT пользователи так быстро привыкают к AI-агентам?
• mewgenetics - прорыв в генной инженерии у кошек?
• почему люди начинают возвращаться к mp3, кассетам и офлайн-музыке?
• новое в redis или почему этот подкаст все еще про данные?
• спрос на большие экраны - миф или AI-слоп?
• сколько нужно клеток человеческого мозга, чтобы играть в doom?
• виртуальная мушка смогла, а ты?
• сфера Дайсона или демон Максвелла?
• есть ли у ведущих свобода воли, или всё определяется вероятностями, биологией и слушателями?
Сайт: https://datacoffee.link
Mastodon: https://techhub.social/@datacoffee
Чат в Telegram
#datacoffee #data #podcast #данные #подкаст #кофе #coffee
Где слушать🎧:
— Бот-плеер
— RSS feed
— YouTube (пока без него)
— Остальные площадки
• правда ли, что нас сократят?
• 20% уже сократили, это правда?
• спасет ли нас фармацевтика?
• кто кого купил и когда этот пузырь уже лопнет?
• почему не-IT пользователи так быстро привыкают к AI-агентам?
• mewgenetics - прорыв в генной инженерии у кошек?
• почему люди начинают возвращаться к mp3, кассетам и офлайн-музыке?
• новое в redis или почему этот подкаст все еще про данные?
• спрос на большие экраны - миф или AI-слоп?
• сколько нужно клеток человеческого мозга, чтобы играть в doom?
• виртуальная мушка смогла, а ты?
• сфера Дайсона или демон Максвелла?
• есть ли у ведущих свобода воли, или всё определяется вероятностями, биологией и слушателями?
Сайт: https://datacoffee.link
Mastodon: https://techhub.social/@datacoffee
Чат в Telegram
#datacoffee #data #podcast #данные #подкаст #кофе #coffee
Где слушать🎧:
— Бот-плеер
— RSS feed
— YouTube (пока без него)
— Остальные площадки
❤🔥4❤3👍2