Sberloga
2.54K subscribers
133 photos
11 videos
5 files
209 links
Data Сообщество
По всем вопросам обращаться @SberlogaHelperBot
Чат - @sberlogadataclub
Download Telegram
Ребята,

В прошлый понедельник мы подробно разбирали нюансы хранения графов знаний и рассмотрели такие базовые для хранения больших объемов информации структуры как B+дерево и LSM деревья.
Посмотреть обсуждение

А сегодня вечером приступим к разбору четвертой лекции из курса Knowledge Graphs.
В этот раз мы подступимся к процессу реификации, который заключается в описании высказываний внутри графов знаний с помощью других высказываний из этиих же графов. Реификацию можно выполнять разными способами в зависимости от внутреннего устройства графа знаний.

Вторая тема разбора - внутреннее устройство wikidata. Посмотрим на то, как организован граф, на основе которого работает значительная часть wikipedia - типы сущностей и связи между ними.

Ссылка на zoom появится в чате курса (@kg_course) и канале в ODS непосредственно перед стартом в 19:00 МСК.
🚀 Онлайн семинар по ML/DS от "SBERLOGA"
⌚️ Четверг 4 марта, 19.00 по Москве
👨‍🔬 Антон Цицулин "Расстояние между графами"

Как сравнить структуру двух графов? Я расскажу про то, какие подходы существуют к сравнению графов и разберу подходы из разных семейств – графовые ядра, спектральные подходы и современные deep learning методы.

Доклад будет основан на следующих работах:
Statistics: https://arxiv.org/abs/1209.2684
Graph kernels: https://arxiv.org/abs/1903.11835
Spectral methods: https://arxiv.org/abs/1805.10712 https://arxiv.org/abs/2003.01282
Deep learning: https://arxiv.org/abs/1904.09671 https://arxiv.org/abs/1908.01000

Reviews: https://arxiv.org/abs/2008.02415 https://arxiv.org/abs/1904.07414

Ссылка на зум будет доступна ближе к началу доклада в чате @sberlogawithgraphs
Записи докладов смотрите на ютубе канале SBERLOGA
https://www.youtube.com/c/SBERLOGA
Ребята,

К нам тут набежали рекрутеры из Сбера и Яндекса и оставили много вкусных вакансий от Middle до Lead позиции на разные направления ML
Переходи по ссылке и попробуй себя в новой роли
@sberlogajobs
Ребята,

Позавчера случилось знаменательное событие - открытой библиотеке для обработки естественного языка DeepPavlov, 5 февраля исполнилось 3 года!
Было много интересных докладов https://deeppavlov.ai/events/3year
Трансляцию можно посмотреть тут https://youtu.be/LkvioWrgo5E
Ребята обещали в течении недели всю ее нарезать и выложить на свой канал 👍
Но а я, как человек который в очередной раз все пропустил, начну смотреть в "режиссерской" версии 😅

@sberloga
♥️ Дорогие девушки, с прекраснным весенним праздником 8 марта !Действительно круто что все больше представительниц прекрасного пола в сфере IT и Data Science! ♥️

Мы долго пытались придумать оригинальное поздравление, и привлекли на помощь всю мощь нейронных сетей GPT3🤖
Много ждать не стоит, но повеселят они вас точно 🤣

Попытать удачу можно тут: https://yandex.ru/lab/postcard

@sberloga
🚀 Онлайн семинар по ML/DS от @sberloga
⌚️ Четверг 11 марта, 19.00 по Москве
👨‍🔬 "Нейронные сети для оценки атмосферных искажений в астрофизических наблюдениях" Ирина Князева.

Мы хотим попробовать новый формат семинара, на котором можно поделиться совсем еще сырыми результатами работы над чем-то и попросить совета по возникающим вопросам.
Попробуем этот формат на астрофизической задачке вместе с Ириной Князевой и ее ребятами.
В настоящее время в Крымской астрофизической обсерватории (КрАО) ведутся работы по созданию нового солнечного спектрополяриметра на базе спектрографа Башенного солнечного телескопа (БСТ-1). Согласно поставленной цели, новый инструмент должен давать возможность проводить спектрополяриметрические наблюдения участков солнечной поверхности с пространственным разрешением порядка 1 угловой секунды и с перекрытием спектра в оптическом диапазоне в полосе 15-20 ангстрем.. Такие данные позволят определять параметры солнечной атмосферы (в т.ч. внешнее магнитное поле и продольную доплеровскую скорость плазмы) на разных высотах, которые определяются выбранными для наблюдений спектральными линиями. Задачу восстановления параметров атмосферы по этим спектральным линиям собственно мы и решаем. Форма спектральных линий может быть получена с помощью модели атмосферы (11 параметрической), в этом случае задача сводится к восстановлению параметров (в идеале всех 11) по форме профилей. Параметры не являются независимыми, поэтому для семплирования параметров подаваемых на вход модели атмосферы мы использовали уже наблюдающиеся на другом инструменте наборы. Стандартным подходом тут является метод Левенберга-Марквардта, но восстанавливать им вычислительно дорого и нужно решать вопрос с выбором начального приближения. Мы реализуем это на нейронных сетях, работа в статусе work in progress, хотелось бы получить фидбек по выбранным архитектурам, а особенно по вариантам аппроксимации плотности распределения параметров, из которой можно сэмплировать.

Ссылка на зум будет доступна через тг чат @sberlogadataclub
Записи докладов смотрите на ютубе канале https://www.youtube.com/c/SBERLOGA
Ребята,
Залили для вас видео с прошедшего семинара Ирины ☝️
"Нейронные сети для оценки атмосферных искажений в астрофизических наблюдениях"
Получили много хороших отзывов, за что вам большое спасибо 🤗

Youtube
Слайды

Приятного просмотра!
@sberloga
Доклад Антона Цицулина (@xgfsru) не состоявшийся 4 марта будет 18 марта.
https://t.me/sberloga/35
🚀 Обсуждение курса "Графы знаний"
⌚️ Понедельник 22 марта, 19.00 по Москве
👨‍🔬Просмотр и обсуждение второй половины лекции 4 - валидация графов знаний. Мы посмотрим на механизмы того, как проверять качество графов знаний. Также обсудим домашние задания с предыдущих лекций.

В предыдущий раз у нас было знакомство сразу с несколькими реализациями механизма реификации в графах знаний. Реификация - превращение предиката в объект - позволяет избегать противоречий в графе знаний, облегчает работу механизмов поиска и логического вывода на графе знаний. Также мы подробно рассмотрели модель данных Wikidata - особенности реализации и соглашения о наименованиях вершин в графе.

Ссылка на зум будет доступна через чат тг чат https://t.me/kg_course ближе к началу доклада
Ребята,

Выложили новое видео с докладом Антона Цицулина - "Расстояния между графами"

Посмотрев видео можно узнать о том, какие подходы сравнения графов существуют и увидеть разбор подходов оценки из разных семейств – графовые ядра, спектральные подходы и современные deep learning методы.

Youtube
Слайды

Приятного просмотра!
@sberloga
🚀 Обсуждение курса "Графы знаний"
⌚️ Понедельник 29 марта, 19.00 по Москве
👨‍🔬Просмотр и обсуждение лекции 5.

Это последняя лекция первой части курса (работа с символьным представлением графов знаний). Мы начнем знакомство с методами сбора графов из различных источников данных. Эти методы также известны как интеграция данных и мы сосредоточимся на сборке графов из структурированных и полуструктурированных источников. Методики, с которыми мы познакомимся, часто используются в составе ETL-пайплайнов для обработки данных с использованием алгоритмов машинного обучения на графах.

Мы возьмем первые 2/3 лекции.
20:52 - заканчиваем семантическую интеграцию данных
40:47 - заканчиваем с физической интеграцией ETL

Предыдущее обсуждение и разбор домашних заданий, доступны на youtube
Курс Knowledge Graphs - Обсуждение Лекции 4 часть 2
https://youtu.be/BJe8TwDjGgE

Ссылка на зум будет доступна через чат тг чат https://t.me/kg_course ближе к началу доклада
🚀 "SBERLOGA" открывает серию докладов по теме фреймворков для Data Science проектов
👨‍🔬 Доклад Андрея Лукьяненко : "Использование Hydra для работы с конфигами в Python"
Четверг 1 апреля, 19.00 по Москве

Установка константных значений и управление изменяемыми параметрами - неотъемлемая часть многих проектов, особенно связанных с машинным обучением. Один из самых популярных вариантов для изменения значения параметров - стандартная библиотека argparse; однако, в последнее время все больше проектов используют конфигурационные файлы для хранения значений переменных.
Hydra (в основе которой лежит OmegaConf) - фреймворк для управления конфигами. Он позволяет динамически комбинировать иерархические конфиги, и менять любые значения с помощью командной строки.
В этом докладе Андрей расскажет о возможностях Hydra и покажет несколько примеров использования этого фреймворка.

Ссылка на зум будет доступна ближе к началу доклада через чат @sberlogadataclub
Записи докладов на ютубе https://www.youtube.com/c/SBERLOGA

На следующих докладах планируются доклады об использовании фрейворков sacred и mlflow
Следите за объявлениями в
@sberloga

Looking for speakers - Мы постоянно проводим небольшие семинары, где можно поделиться своими знаниями по теме Data Science/Data Engineering. Чтобы обсудить тему вашего доклада нужно написать - @boyadzhi или @Alexander_V_C
https://youtu.be/T_UyGSUUDKc
Ребята, в прошедший четверг прошёл отличный семинар, по использованию фреймворка hydra
Андрей Лукьяненко (@Erlemar) рассказал о его возможностях, поделился своим опытом использования и различными кейсами применения
Так же по ссылке можно найти шаблон hydra для DL моделей
https://slides.com/andreylukyanenko/deck-5cbd53
https://github.com/Erlemar/sberloga_hydra_demo

@sberloga
🚀 Обсуждение курса "Графы знаний"
⌚️ Вторник 6 апреля, 19.00 по Москве
👨‍🔬Просмотр и обсуждение лекции 5, разбор заданий.

В прошлый вторник мы начали разбор 5-ой лекции KG Course. Лекция посвящена построению графов по данным и подготовке графов для дальнейшего использования алгоритмов машинного обучения.
Сегодня, 6.04 мы планируем завершить 5-ую лекцию Semantic Data Integration и разобрать накопившиеся домашние работы за 4-ую и 5-ую лекции.

Предыдущее обсуждение и разбор домашних заданий, доступны на youtube.
Видео с обсуждением первой части 5й лекции можно посмотреть тут https://youtu.be/bziL9a9wyhA

Ссылка на зум будет доступна через чат тг чат https://t.me/kg_course ближе к началу доклада.