🚀 Онлайн семинар по ML/DS от "SBERLOGA"
⌚️ 21 января четверг, 19ч по Москве
👨🔬 Анвар Курмуков : "GNN & GCN for complete beginners"
Будет объяснено, что такое графовые нейронные сети, в частности разберем 3 популярные статьи посвященные графовым сеткам:
1. Kipf GCN https://arxiv.org/pdf/1609.02907.pdf
2. Graph SAGE https://arxiv.org/pdf/1706.02216.pdf
3. https://www.cse.wustl.edu/~ychen/public/DGCNN.pdf An End-to-End Deep Learning Architecture for Graph Classification
Зум : https://us02web.zoom.us/j/81647783013?pwd=cWNoWk0vSlR2bFdpTlhzSXJNY0RlQT09
📝 Не пропускайте анонсы событий: @sberloga присоединяйтесь!
Ссылку на зум можно получить в чате: @sberlogawithgraphs
Записи предыдущих докладов - https://www.youtube.com/c/SBERLOGA/videos
⌚️ 21 января четверг, 19ч по Москве
👨🔬 Анвар Курмуков : "GNN & GCN for complete beginners"
Будет объяснено, что такое графовые нейронные сети, в частности разберем 3 популярные статьи посвященные графовым сеткам:
1. Kipf GCN https://arxiv.org/pdf/1609.02907.pdf
2. Graph SAGE https://arxiv.org/pdf/1706.02216.pdf
3. https://www.cse.wustl.edu/~ychen/public/DGCNN.pdf An End-to-End Deep Learning Architecture for Graph Classification
Зум : https://us02web.zoom.us/j/81647783013?pwd=cWNoWk0vSlR2bFdpTlhzSXJNY0RlQT09
📝 Не пропускайте анонсы событий: @sberloga присоединяйтесь!
Ссылку на зум можно получить в чате: @sberlogawithgraphs
Записи предыдущих докладов - https://www.youtube.com/c/SBERLOGA/videos
Добро пожаловать в SBERLOG'у 🧑🔬
Мы являемся сообществом Data Science энтузиастов из разных компаний, организуем различные онлайн мероприятия и обсуждения на темы связанные с анализом данных.
Обязательно стоит подписаться на YouTube канал SBERLOGA, чтобы смотреть наши мероприятия.
Ознакомиться с вакансиями наших друзей можно на канале: Sberloga Jobs
Если вы хотите разместить свою вакансию, то желательно заполнить следующую форму или написать @Zabis13
Если вам интересно познакомиться с участниками сообщества, то приглашаем вас в наши чаты:
🤖 Sberloga Data Club - Сообщество D-people от аналитиков до инженеров и просто начинающих энтузиастов, людые темы связанные с данными приветствуются.
🧑🔬 Sberloga BioInformatics Club - Чат общения биоинформатиков и дата-сайентистов. Присоединяйтесь - у нас есть чем поделиться или обсудить
🤓 Sberloga with Graphs - Чат для обсуждения граф-мл, knowledge graphs, обсуждения курса cs224w Machine Learning with Graphs, курса kgcourse и других тем связанных с графами
🗨 Sberloga Talk Club - Чат неформального общения не связанного с данными или аналитикой
🏃♂️ Sberloga Sports Club - Чат для обсуждения спорта - смело заходите сюда. Делимся лайфхаками, мероприятиями, вместе ходим на разные тренировки и забеги
📢 Остались вопросы?
@boyadzhi
@Alexander_V_C
Мы являемся сообществом Data Science энтузиастов из разных компаний, организуем различные онлайн мероприятия и обсуждения на темы связанные с анализом данных.
Обязательно стоит подписаться на YouTube канал SBERLOGA, чтобы смотреть наши мероприятия.
Ознакомиться с вакансиями наших друзей можно на канале: Sberloga Jobs
Если вы хотите разместить свою вакансию, то желательно заполнить следующую форму или написать @Zabis13
Если вам интересно познакомиться с участниками сообщества, то приглашаем вас в наши чаты:
🤖 Sberloga Data Club - Сообщество D-people от аналитиков до инженеров и просто начинающих энтузиастов, людые темы связанные с данными приветствуются.
🧑🔬 Sberloga BioInformatics Club - Чат общения биоинформатиков и дата-сайентистов. Присоединяйтесь - у нас есть чем поделиться или обсудить
🤓 Sberloga with Graphs - Чат для обсуждения граф-мл, knowledge graphs, обсуждения курса cs224w Machine Learning with Graphs, курса kgcourse и других тем связанных с графами
🗨 Sberloga Talk Club - Чат неформального общения не связанного с данными или аналитикой
🏃♂️ Sberloga Sports Club - Чат для обсуждения спорта - смело заходите сюда. Делимся лайфхаками, мероприятиями, вместе ходим на разные тренировки и забеги
📢 Остались вопросы?
@boyadzhi
@Alexander_V_C
👇 Ниже новый канал с вакансиями
Иногда сюда будут прилетать самые интересные на наш взгляд и мы будем стараться не надоедать спамом 🙃
Подпишись на канал сейчас и будь в курсе рынка DS в целом 👍
Иногда сюда будут прилетать самые интересные на наш взгляд и мы будем стараться не надоедать спамом 🙃
Подпишись на канал сейчас и будь в курсе рынка DS в целом 👍
Forwarded from Sberloga Jobs
Senior MLResearcher
Ищем: Исследователя с опытом CV от 2 лет в индустриальных проектах
Вилка ЗП: 180 000₽ - 300 000₽
Локация: Москва
Нам важен опыт в коммерческих продуктах;
Подойдет опыт с face recognition или scanning;
Есть возможность публикаций после выхода релиза продукта;
Экспертам готовы предложить оклад 300К+, есть соцпакет и максимально гибкий график работы
Познакомимся с кандидатами из регионов, поддержку в переезде гарантируем
Детальное описание
Ищем: Исследователя с опытом CV от 2 лет в индустриальных проектах
Вилка ЗП: 180 000₽ - 300 000₽
Локация: Москва
Нам важен опыт в коммерческих продуктах;
Подойдет опыт с face recognition или scanning;
Есть возможность публикаций после выхода релиза продукта;
Экспертам готовы предложить оклад 300К+, есть соцпакет и максимально гибкий график работы
Познакомимся с кандидатами из регионов, поддержку в переезде гарантируем
Детальное описание
Друзья,
В нашем чате больше 50 участников откликнулось, чтобы совместно проходить курс ODS Knowledge Graphs https://ods.ai/tracks/kgcourse2021 от Михаила Галкина (@gimmeblues) и К.
Об этом курсе можно посмотреть на видео c анонсом курса на нашем канале Youtube и слайды ниже
Координатора у нас нет, поэтому будем делать совместные активности по просмотру и обсуждению лекций + выполнять домашки.
К концу прохождения курса должно сформироваться понимание о Knowledge graphs, попробуем различные инструменты и способы анализа.
Что делать?
Зайти в чат @kg_course - там будет все обсуждение и можно задавать вопросы создателям курса
Когда?
Начинаем в четверг 28 января в 19.00 по Москве
Как?
В Zoom cовместно смотрим лекцию или обсуждаем ДЗ, знакомимся, задаем вопросы по непонятным частям лекции/ДЗ и помогаем друг другу понять их
А Материалы?
Если будут появляться новые материалы, которых нет в курсе, мы предлагаем дополнять краудсорсингом страничку в Notion (открыта всем на редактирование) - он позволяет делать коллективные заметки, хранить материалы
Подписывайтесь на наш канал в Youtube
В нашем чате больше 50 участников откликнулось, чтобы совместно проходить курс ODS Knowledge Graphs https://ods.ai/tracks/kgcourse2021 от Михаила Галкина (@gimmeblues) и К.
Об этом курсе можно посмотреть на видео c анонсом курса на нашем канале Youtube и слайды ниже
Координатора у нас нет, поэтому будем делать совместные активности по просмотру и обсуждению лекций + выполнять домашки.
К концу прохождения курса должно сформироваться понимание о Knowledge graphs, попробуем различные инструменты и способы анализа.
Что делать?
Зайти в чат @kg_course - там будет все обсуждение и можно задавать вопросы создателям курса
Когда?
Начинаем в четверг 28 января в 19.00 по Москве
Как?
В Zoom cовместно смотрим лекцию или обсуждаем ДЗ, знакомимся, задаем вопросы по непонятным частям лекции/ДЗ и помогаем друг другу понять их
А Материалы?
Если будут появляться новые материалы, которых нет в курсе, мы предлагаем дополнять краудсорсингом страничку в Notion (открыта всем на редактирование) - он позволяет делать коллективные заметки, хранить материалы
Подписывайтесь на наш канал в Youtube
Open Data Science (ODS.ai)
KG Course 2021
Курс по графам знаний (Knowledge Graphs) и как их готовить в 2021 году
Курс "Графы знаний" (Knowledge Graphs) от ODS.
Михаил Галкин и его коллеги, создали первый русскоязычный курс по графам знаний. Этот раздел машинного обучения активно развивается последнее время как в академии, так и в индустрии (используется Гугл в поиске).
Курс бесплатный, расчитанный на самостоятельное изучение. Если вам интересно проходить его вместе с другими энтузиастами - присоединяйтесь к телеграм чату @kg_course , мы стартуем в четверг 28 января в 19.00 по Москве с просмотра и обсуждения первой лекции.
Анонс курса : https://youtu.be/L5LPxpM1srA
https://ods.ai/tracks/kgcourse2021
Михаил Галкин и его коллеги, создали первый русскоязычный курс по графам знаний. Этот раздел машинного обучения активно развивается последнее время как в академии, так и в индустрии (используется Гугл в поиске).
Курс бесплатный, расчитанный на самостоятельное изучение. Если вам интересно проходить его вместе с другими энтузиастами - присоединяйтесь к телеграм чату @kg_course , мы стартуем в четверг 28 января в 19.00 по Москве с просмотра и обсуждения первой лекции.
Анонс курса : https://youtu.be/L5LPxpM1srA
https://ods.ai/tracks/kgcourse2021
YouTube
Михаил Галкин - Анонс курса Knowledge Graphs
Михаил и его коллеги подготовили курс по графам знаний ( Knowledge Graphs ) https://ods.ai/tracks/kgcourse2021
Будет дан краткий анонс курса и ответы на вопросы участников семинара.
Graph Representation Learning (GRL) - одна из самых быстро растущих тем…
Будет дан краткий анонс курса и ответы на вопросы участников семинара.
Graph Representation Learning (GRL) - одна из самых быстро растущих тем…
От Ирины Князевой ( @Isknyazeva ):
Всех приветствую. Моя студентка занимается социальным проектом, цитирую: "Я сейчас занимаюсь социальным проектом для подбора наставников подросткам из небольших городов России, и к нам пришло несколько ребят, которые хотят развиваться в аналитике данных, ИИ и в больших данных. Загруженность там маленькая, онлайн-созвоны по часу в неделю, но их опыт очень помог бы детям 🙂" Если вдруг у кого появится желание поучаствовать или привлечь студентов - напишите мне, буду очень благодарна.
PS
Кстати, лишний повод вспомнить о замечательном докладе Ирины:
https://youtu.be/7X4gS56MMxM
Всех приветствую. Моя студентка занимается социальным проектом, цитирую: "Я сейчас занимаюсь социальным проектом для подбора наставников подросткам из небольших городов России, и к нам пришло несколько ребят, которые хотят развиваться в аналитике данных, ИИ и в больших данных. Загруженность там маленькая, онлайн-созвоны по часу в неделю, но их опыт очень помог бы детям 🙂" Если вдруг у кого появится желание поучаствовать или привлечь студентов - напишите мне, буду очень благодарна.
PS
Кстати, лишний повод вспомнить о замечательном докладе Ирины:
https://youtu.be/7X4gS56MMxM
YouTube
Ирина Князева - Топологический анализ данных глазами не тополога, геометра, и даже не математика
https://t.me/Isknyazeva
📝 Материалы:
https://drive.google.com/file/d/1c_WsEyYzCdoT0lLF-xHnKok_DyudlBdJ/view
📢 Подписывайся на наше сообщество в telegram, чтобы быть в курсе мероприятий: https://t.me/sberloga
🗨 Обсудить доклады можно в нашем чатике htt…
📝 Материалы:
https://drive.google.com/file/d/1c_WsEyYzCdoT0lLF-xHnKok_DyudlBdJ/view
📢 Подписывайся на наше сообщество в telegram, чтобы быть в курсе мероприятий: https://t.me/sberloga
🗨 Обсудить доклады можно в нашем чатике htt…
🚀 Онлайн event по ML/DS от "SBERLOGA"
⌚ Понельник 1 февраля, 19.00 по Москве
👨🔬 Совместное обсуждение ODS
курса : "Графы знаний" (Knowledge Graphs) от Михаила Галкина и К
Смотрим лекцию 2 "RDF & RDFS & OWL" https://youtu.be/s7zpHzVp8Ik
Вначале собираемся в зуме, смотрим первый фргамент лекции, останваливаем просмотр, обсуждаем 5-7 минут, смотрим следующий фрагмент и так далее.
Присоединяйтесь к тг чату @kg_course для дополнительноной информации и получения ссылки на зум. Анонс курса : https://youtu.be/L5LPxpM1srA
Сайт курса:
https://ods.ai/tracks/kgcourse2021
⌚ Понельник 1 февраля, 19.00 по Москве
👨🔬 Совместное обсуждение ODS
курса : "Графы знаний" (Knowledge Graphs) от Михаила Галкина и К
Смотрим лекцию 2 "RDF & RDFS & OWL" https://youtu.be/s7zpHzVp8Ik
Вначале собираемся в зуме, смотрим первый фргамент лекции, останваливаем просмотр, обсуждаем 5-7 минут, смотрим следующий фрагмент и так далее.
Присоединяйтесь к тг чату @kg_course для дополнительноной информации и получения ссылки на зум. Анонс курса : https://youtu.be/L5LPxpM1srA
Сайт курса:
https://ods.ai/tracks/kgcourse2021
YouTube
Графы знаний | Лекция 2 - RDF, RDFS, OWL
Вторая лекция курса по графам знаний с описанием стандартов RDF, RDFS, OWL.
Полный курс доступен на платформе ODS: https://ods.ai/tracks/kgcourse2021
Дополнительные материалы (слайды, конспекты, домашние задания) доступны на платформе
Полный курс доступен на платформе ODS: https://ods.ai/tracks/kgcourse2021
Дополнительные материалы (слайды, конспекты, домашние задания) доступны на платформе
🚀 Онлайн семинар по ML/DS от "SBERLOGA"
⌚ Четверг 4 февраля, 19.00 по Москве
👨🔬 Доклад Сергей Иванов (Париж, Критео) : "Boost then Convolve: Gradient Boosting Meets Graph Neural Networks" . Cергей один из лидеров графового комьюнити в ОДС и автор лучшего канала в тг по граф-мл @graphML - подписывайтесь.
Абстракт.
Graph neural networks (GNNs) are powerful models that have been successful in various graph representation learning tasks. Whereas gradient boosted decision trees (GBDT) often outperform other machine learning methods when faced with heterogeneous tabular data. But what approach should be used for graphs with tabular node features? Previous GNN models have mostly focused on networks with homogeneous sparse features and, as we show, are suboptimal in the heterogeneous setting. In this work, we propose a novel architecture that trains GBDT and GNN jointly to get the best of both worlds: the GBDT model deals with heterogeneous features, while GNN accounts for the graph structure. Our model benefits from end-to-end optimization by allowing new trees to fit the gradient updates of GNN. With an extensive experimental comparison to the leading GBDT and GNN models, we demonstrate a significant increase in performance on a variety of graphs with tabular features.
Доклад основан на работе:
https://openreview.net/forum?id=ebS5NUfoMKL
Ссылка на зум будет доступна ближе к началу доклада через чат @sberlogawithgraphs - присоединяйтесь.
Записи докладов на ютубе:
https://www.youtube.com/c/SBERLOGA - подписывайтесь.
⌚ Четверг 4 февраля, 19.00 по Москве
👨🔬 Доклад Сергей Иванов (Париж, Критео) : "Boost then Convolve: Gradient Boosting Meets Graph Neural Networks" . Cергей один из лидеров графового комьюнити в ОДС и автор лучшего канала в тг по граф-мл @graphML - подписывайтесь.
Абстракт.
Graph neural networks (GNNs) are powerful models that have been successful in various graph representation learning tasks. Whereas gradient boosted decision trees (GBDT) often outperform other machine learning methods when faced with heterogeneous tabular data. But what approach should be used for graphs with tabular node features? Previous GNN models have mostly focused on networks with homogeneous sparse features and, as we show, are suboptimal in the heterogeneous setting. In this work, we propose a novel architecture that trains GBDT and GNN jointly to get the best of both worlds: the GBDT model deals with heterogeneous features, while GNN accounts for the graph structure. Our model benefits from end-to-end optimization by allowing new trees to fit the gradient updates of GNN. With an extensive experimental comparison to the leading GBDT and GNN models, we demonstrate a significant increase in performance on a variety of graphs with tabular features.
Доклад основан на работе:
https://openreview.net/forum?id=ebS5NUfoMKL
Ссылка на зум будет доступна ближе к началу доклада через чат @sberlogawithgraphs - присоединяйтесь.
Записи докладов на ютубе:
https://www.youtube.com/c/SBERLOGA - подписывайтесь.
OpenReview
Boost then Convolve: Gradient Boosting Meets Graph Neural Networks
Graph neural networks (GNNs) are powerful models that have been successful in various graph representation learning tasks. Whereas gradient boosted decision trees (GBDT) often outperform other...
Друзья!
Каналы по датасайнс от участников @sberloga, присоединяйтесь, будет интересно:
@datainthecity Инесса (@intra23) ведёт уникальный канал - анализ данных в городах
@start_ds Роман (@RAVasiliev) делится полезными материалами для подготовки к собеседованиям в ДС
@dataviznews Никита (@nikitarokotyan) рассказывает о визуализации данных
@botka_chronics Алексей (@shpacman) о математике в ДС
@moir_x Мария ( @izomeraz4 ) дата инжениринг , математика , ДС
@data_events Николай (@NikolayKrupiy) держит в курсе ДС (и других data-тематических) событий в Москве и онлайне
@sv9t_channel Святослав ( @IggiSv9t) лучший канал в тг по ДС, графам , визуализациям
Присоединяйтесь @sberlogawithgraphs, @sberlogadataclub расскажите о ваших ДС каналах, проектах, интересах, мы рады всем хорошим ДС-людям. Взгляните в @sberlogajobs - отборные вакансии в ДС
Каналы по датасайнс от участников @sberloga, присоединяйтесь, будет интересно:
@datainthecity Инесса (@intra23) ведёт уникальный канал - анализ данных в городах
@start_ds Роман (@RAVasiliev) делится полезными материалами для подготовки к собеседованиям в ДС
@dataviznews Никита (@nikitarokotyan) рассказывает о визуализации данных
@botka_chronics Алексей (@shpacman) о математике в ДС
@moir_x Мария ( @izomeraz4 ) дата инжениринг , математика , ДС
@data_events Николай (@NikolayKrupiy) держит в курсе ДС (и других data-тематических) событий в Москве и онлайне
@sv9t_channel Святослав ( @IggiSv9t) лучший канал в тг по ДС, графам , визуализациям
Присоединяйтесь @sberlogawithgraphs, @sberlogadataclub расскажите о ваших ДС каналах, проектах, интересах, мы рады всем хорошим ДС-людям. Взгляните в @sberlogajobs - отборные вакансии в ДС
Ребята, совместное прохождение курса по Knowledge Graphs в самом разгаре.
Уже сейчас были разобраны первые 2 лекции этого курса, обсуждение можно посмотреть на нашем youtube канале SBERLOGA:
Обсуждение Лекции 1
Обсуждение Лекции 2 (В обсуждении Лекции 2 на вопросы отвечает автор курса - Михаил Галкин)
Курс можно проходить в режиме self paced (в комфортной для вас скоростью)
Но если у вас появятся вопросы или захотите присоединиться к обсуждениям то у нас есть отдельный чатик по Knowledge graphs
В понедельник будет обсуждение дз и прошедших лекций по курсу
Приятного просмотра!
@sberloga
Уже сейчас были разобраны первые 2 лекции этого курса, обсуждение можно посмотреть на нашем youtube канале SBERLOGA:
Обсуждение Лекции 1
Обсуждение Лекции 2 (В обсуждении Лекции 2 на вопросы отвечает автор курса - Михаил Галкин)
Курс можно проходить в режиме self paced (в комфортной для вас скоростью)
Но если у вас появятся вопросы или захотите присоединиться к обсуждениям то у нас есть отдельный чатик по Knowledge graphs
В понедельник будет обсуждение дз и прошедших лекций по курсу
Приятного просмотра!
@sberloga
YouTube
Курс Knowledge Graphs - Обсуждение Лекции 1 - Введение
Лекция 1 "Введение"
https://youtu.be/y8OmCRNQoWU
Слайды: https://drive.google.com/file/d/1KMmMeQjKWsL7sBSKEdBMXEYXf9SD-zzw/view?usp=sharing
Конспект с ДЗ: https://migalkin.github.io/kgcourse2021/lectures/lecture1
Вводная лекция курса по графам знаний.
Полный…
https://youtu.be/y8OmCRNQoWU
Слайды: https://drive.google.com/file/d/1KMmMeQjKWsL7sBSKEdBMXEYXf9SD-zzw/view?usp=sharing
Конспект с ДЗ: https://migalkin.github.io/kgcourse2021/lectures/lecture1
Вводная лекция курса по графам знаний.
Полный…
Ребята, 4 дня назад у нас прошла лекция Сергея Иванова (Париж, Критео) "Boost then Convolve: Gradient Boosting Meets Graph Neural Networks"
Cергей один из лидеров графового комьюнити в ODS и автор лучшего канала в тг по граф-мл @graphML
Видео можно посмотреть на нашем youtube канале SBERLOGA
https://youtu.be/rMNA68wLAxk
Доклад основан на работе https://openreview.net/forum?id=ebS5NUfoMKL
Графовые нейронные сети (GNN) - это мощные модели, успешно решающие различные задачи обучения графического представления. В тоже время градиентный бустинг на деревьях (GBDT) часто превосходит другие методы машинного обучения при работе с табличными данными. Но какой подход следует использовать для графов с табличными характеристиками узлов? Предыдущие модели GNN в основном фокусировались на сетях с однородными разреженными фичами и, как мы покажем, неоптимальны в гетерогенном пространстве. В этой работе мы предлагаем новую архитектуру, которая обучает GBDT и GNN совместно, чтобы получить лучшее из обоих миров: модель GBDT имеет дело с гетерогенными фичами, а GNN учитывает структуру графа. Наша модель выигрывает от сквозной оптимизации, позволяя новым деревьям соответствовать обновлениям градиента GNN. Проведя обширное экспериментальное сравнение с ведущими моделями GBDT и GNN, мы демонстрируем значительное улучшение производительности на различных графах с табличными фичами.
Приятного просмотра!
@sberloga
Cергей один из лидеров графового комьюнити в ODS и автор лучшего канала в тг по граф-мл @graphML
Видео можно посмотреть на нашем youtube канале SBERLOGA
https://youtu.be/rMNA68wLAxk
Доклад основан на работе https://openreview.net/forum?id=ebS5NUfoMKL
Графовые нейронные сети (GNN) - это мощные модели, успешно решающие различные задачи обучения графического представления. В тоже время градиентный бустинг на деревьях (GBDT) часто превосходит другие методы машинного обучения при работе с табличными данными. Но какой подход следует использовать для графов с табличными характеристиками узлов? Предыдущие модели GNN в основном фокусировались на сетях с однородными разреженными фичами и, как мы покажем, неоптимальны в гетерогенном пространстве. В этой работе мы предлагаем новую архитектуру, которая обучает GBDT и GNN совместно, чтобы получить лучшее из обоих миров: модель GBDT имеет дело с гетерогенными фичами, а GNN учитывает структуру графа. Наша модель выигрывает от сквозной оптимизации, позволяя новым деревьям соответствовать обновлениям градиента GNN. Проведя обширное экспериментальное сравнение с ведущими моделями GBDT и GNN, мы демонстрируем значительное улучшение производительности на различных графах с табличными фичами.
Приятного просмотра!
@sberloga
YouTube
Сергей Иванов (Париж, Критео) - Boost then Convolve: Gradient Boosting Meets Graph Neural Networks
Графовые нейронные сети (GNN) - это мощные модели, успешно решающие различные задачи обучения графического представления. В тоже время градиентный бустинг на деревьях (GBDT) часто превосходит другие методы машинного обучения при работе с табличными данными.…
🚀 Онлайн семинар по ML/DS от "SBERLOGA"
⌚ Четверг 11 февраля, 19.00 по Москве
👨🔬 Доклад Людмила Прохоренкова (Yandex Research)
“Графовые методы поиска ближайших соседей”
Абстракт.
Среди методов поиска ближайших соседей в последнее время стали популярны алгоритмы, основанные на графах близости. Оказалось, что в практических задачах такие методы работают лучше, чем многие давно известные и хорошо изученные подходы. Я расскажу про то, как устроен поиск на графах, как построить подходящий граф, как масштабировать поиск на очень большие датасеты, какие есть теоретические гарантии для графовых методов и еще про некоторые интересные работы в этой области.
Ссылка на зум будет доступна ближе к началу доклада через чат @sberlogawithgraphs - присоединяйтесь.
Записи докладов на ютубе:
https://www.youtube.com/c/SBERLOGA - подписывайтесь.
PS
Будут обсуждаться в том числе следующие работы:
Graph-based nearest neighbor search: From practice to theory http://proceedings.mlr.press/v119/prokhorenkova20a/prokhorenkova20a.pdf
Efficient and robust approximate nearest neighbor search using hierarchical navigable small world graphs https://arxiv.org/ftp/arxiv/papers/1603/1603.09320.pdf
ANN-Benchmarks: A Benchmarking Tool for Approximate Nearest Neighbor Algorithms https://arxiv.org/pdf/1807.05614.pdf
Disorder Inequality: A Combinatorial Approach to Nearest Neighbor Search http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.116.2680&rep=rep1&type=pdf
Improving Approximate Nearest Neighbor Search through Learned Adaptive Early Termination https://conglongli.github.io/paper/ann-sigmod2020.pdf
⌚ Четверг 11 февраля, 19.00 по Москве
👨🔬 Доклад Людмила Прохоренкова (Yandex Research)
“Графовые методы поиска ближайших соседей”
Абстракт.
Среди методов поиска ближайших соседей в последнее время стали популярны алгоритмы, основанные на графах близости. Оказалось, что в практических задачах такие методы работают лучше, чем многие давно известные и хорошо изученные подходы. Я расскажу про то, как устроен поиск на графах, как построить подходящий граф, как масштабировать поиск на очень большие датасеты, какие есть теоретические гарантии для графовых методов и еще про некоторые интересные работы в этой области.
Ссылка на зум будет доступна ближе к началу доклада через чат @sberlogawithgraphs - присоединяйтесь.
Записи докладов на ютубе:
https://www.youtube.com/c/SBERLOGA - подписывайтесь.
PS
Будут обсуждаться в том числе следующие работы:
Graph-based nearest neighbor search: From practice to theory http://proceedings.mlr.press/v119/prokhorenkova20a/prokhorenkova20a.pdf
Efficient and robust approximate nearest neighbor search using hierarchical navigable small world graphs https://arxiv.org/ftp/arxiv/papers/1603/1603.09320.pdf
ANN-Benchmarks: A Benchmarking Tool for Approximate Nearest Neighbor Algorithms https://arxiv.org/pdf/1807.05614.pdf
Disorder Inequality: A Combinatorial Approach to Nearest Neighbor Search http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.116.2680&rep=rep1&type=pdf
Improving Approximate Nearest Neighbor Search through Learned Adaptive Early Termination https://conglongli.github.io/paper/ann-sigmod2020.pdf
Ребята,
Выложили видео с прошедшего семинара 11 февраля “Графовые методы поиска ближайших соседей” от Людмила Прохоренкова (Yandex Research)
Материалы
Приятного просмотра!
@sberloga
Выложили видео с прошедшего семинара 11 февраля “Графовые методы поиска ближайших соседей” от Людмила Прохоренкова (Yandex Research)
Материалы
Приятного просмотра!
@sberloga
YouTube
Людмила Прохоренкова (Yandex Research) - Графовые методы поиска ближайших соседей
Среди методов поиска ближайших соседей в последнее время стали популярны алгоритмы, основанные на графах близости. Оказалось, что в практических задачах такие методы работают лучше, чем многие давно известные и хорошо изученные подходы. Я расскажу про то…
🚀 Онлайн семинар по ML/DS от "SBERLOGA"
⌚️ Четверг 18 февраля, 19.00 по Москве
👨🔬 "Jounral club (Short talk club)" Семинар с несколькими короткими (10-15 минут) докладами.
Богдан Салып
"Удачные и неудачные попытки удержать GPT" LogitProcessors в HuggingFace, форсированная генерация слов, GPT+NER, GPT+USE, настройка датасета под ключевые слова и куда двигаться дальше
Глеб Ерофеев (Lead ML Sbermarket)
"ML Хакатон-страйк"
Поделиться опытом как преуспеть в хакатонах.
Никита Варганов, Юрий Барамыков (Сбер)
Это команда Optimization Guys. Мы расскажем про наш опыт участия в хакатоне от ODS. Наша команда разрабатывала AutoML for dummies - AutoML решение для людей, которые не умеют программировать и вообще не разбираются в анализе данных. Юра расскажет про команду и процесс написания AutoML, а Никита расскажет про фреймворк streamlit - простейшее решение для создания web-приложений для работы с данными.
Ссылка на зум будет доступна ближе к началу доклада в чате @sberlogadataclub
Записи докладов смотрите на ютубе канале SBERLOGA
Приятного просмотра!
@sberloga
⌚️ Четверг 18 февраля, 19.00 по Москве
👨🔬 "Jounral club (Short talk club)" Семинар с несколькими короткими (10-15 минут) докладами.
Богдан Салып
"Удачные и неудачные попытки удержать GPT" LogitProcessors в HuggingFace, форсированная генерация слов, GPT+NER, GPT+USE, настройка датасета под ключевые слова и куда двигаться дальше
Глеб Ерофеев (Lead ML Sbermarket)
"ML Хакатон-страйк"
Поделиться опытом как преуспеть в хакатонах.
Никита Варганов, Юрий Барамыков (Сбер)
Это команда Optimization Guys. Мы расскажем про наш опыт участия в хакатоне от ODS. Наша команда разрабатывала AutoML for dummies - AutoML решение для людей, которые не умеют программировать и вообще не разбираются в анализе данных. Юра расскажет про команду и процесс написания AutoML, а Никита расскажет про фреймворк streamlit - простейшее решение для создания web-приложений для работы с данными.
Ссылка на зум будет доступна ближе к началу доклада в чате @sberlogadataclub
Записи докладов смотрите на ютубе канале SBERLOGA
Приятного просмотра!
@sberloga
Сегодня 22.02.2021 , в 19:00 по Москве продолжаем смотреть и обсуждать Лекцию #3 KnowledgeGraph-курса. Будут обсуждаться - B-tree, B+tree, LSM-tree - для организации хранения графовых бд.
Ссылка на зума, как обычно, будет в чате @kg_course перед началом.
Напомним кратко прошедшую часть лекции. Она была посвящена SPARQL - языку запросов к графовым бд. Это не так сложно - взгляните на примеры:
Наиболее доступный и известный всем граф знаний - Wikidata - уже содержит 12 098 892 788 ребер (="триплетов", = "фактов"). По ссылке https://query.wikidata.org/ вы можете прямо сейчас написать запрос и получить ответ. Обратите внимание на вкладку EXAMPLES - примеры запросов на все случае жизни. Хотите найти лекарства, которые воздействуют на гены связанные с пролиферацией в клетке ? Смотрите в EXAMPLES.
ПС
Видео записей смотрите на нашем Ютуб канале SBERLOGA
Ссылка на зума, как обычно, будет в чате @kg_course перед началом.
Напомним кратко прошедшую часть лекции. Она была посвящена SPARQL - языку запросов к графовым бд. Это не так сложно - взгляните на примеры:
SELECT ?s WHERE { ?s :knows ?Alice .}
# найти всех кто знает Алису
select (count(*) as ?num) where {?s ?p ?o}
# Найти количество триплетов (ребер) в графе знаний
Наиболее доступный и известный всем граф знаний - Wikidata - уже содержит 12 098 892 788 ребер (="триплетов", = "фактов"). По ссылке https://query.wikidata.org/ вы можете прямо сейчас написать запрос и получить ответ. Обратите внимание на вкладку EXAMPLES - примеры запросов на все случае жизни. Хотите найти лекарства, которые воздействуют на гены связанные с пролиферацией в клетке ? Смотрите в EXAMPLES.
ПС
Видео записей смотрите на нашем Ютуб канале SBERLOGA
🚀 Онлайн семинар по ML/DS от "SBERLOGA"
⌚️ Четверг 25 февраля, 19.00 по Москве
👨🔬 "Машинное обучение и анализ мутаций SNP" Валерий Хаменя (@khamenya), Михаил Косарецкий (@cappelchi).
Первая часть обсуждения - Машинное обучение и анализ мутаций SNP
Ребята нам расскажут:
1️⃣ Как подступиться к файлам со снипами
2️⃣ Как из OHE-тензора строить иерархический остов вероятностного графа для снипов — @ostroumovala
3️⃣ Как сделать нечто любопытное ещё до того, как у нас готов граф. Например, нащупать супер-хабы — локус-варианты, которые вероятностно связаны почти с каждым четвёртым локус-вариантом.
❤️ Самое главное: ищем кто хотел бы поучаствовать. У нас не хватает ни рук, ни времени. Мы очень надеемся, что появятся новые участники в этой дискуссии! Вам будут особенно рады если вы спец по оптимизации простых алгебраических тензорных операций для GPU/TPU + PyTorch/Tensorflow.
💌 Если есть какие-то вопросы/пожелания, то можно обращаться в личку к @cappelchi и @khamenya до и после доклада!
Ссылка на зум будет доступна ближе к началу доклада в чате @sberlogabio
Записи докладов смотрите на ютубе канале SBERLOGA
⌚️ Четверг 25 февраля, 19.00 по Москве
👨🔬 "Машинное обучение и анализ мутаций SNP" Валерий Хаменя (@khamenya), Михаил Косарецкий (@cappelchi).
Первая часть обсуждения - Машинное обучение и анализ мутаций SNP
Ребята нам расскажут:
1️⃣ Как подступиться к файлам со снипами
*.vcf
и получать из них тензор. Акцент будет на очень важном one-hot-encoded (OHE) представлении для снипов. Без такого тензора считать условные вероятности будет очень тяжело.2️⃣ Как из OHE-тензора строить иерархический остов вероятностного графа для снипов — @ostroumovala
3️⃣ Как сделать нечто любопытное ещё до того, как у нас готов граф. Например, нащупать супер-хабы — локус-варианты, которые вероятностно связаны почти с каждым четвёртым локус-вариантом.
❤️ Самое главное: ищем кто хотел бы поучаствовать. У нас не хватает ни рук, ни времени. Мы очень надеемся, что появятся новые участники в этой дискуссии! Вам будут особенно рады если вы спец по оптимизации простых алгебраических тензорных операций для GPU/TPU + PyTorch/Tensorflow.
💌 Если есть какие-то вопросы/пожелания, то можно обращаться в личку к @cappelchi и @khamenya до и после доклада!
Ссылка на зум будет доступна ближе к началу доклада в чате @sberlogabio
Записи докладов смотрите на ютубе канале SBERLOGA
🔥Ребята,
Выложили видео с прошедшего семинара 18 февраля
1️⃣ Никита Варганов, Юрий Барамыков (Сбер)
"CraftML - AutoML for dummies"
Это команда Optimization Guys. Мы расскажем про наш опыт участия в хакатоне от ODS. Наша команда разрабатывала AutoML for dummies - AutoML решение для людей, которые не умеют программировать и вообще не разбираются в анализе данных. Юра расскажет про команду и процесс написания AutoML, а Никита расскажет про фреймворк streamlit - простейшее решение для создания web-приложений для работы с данными.
https://youtu.be/U1LU_HzeMd0
2️⃣ Глеб Ерофеев (Lead ML Sbermarket)
"ML Хакатон-страйк"
Поделиться опытом как преуспеть в хакатонах.
https://youtu.be/3ge3LvTR2Eg
3️⃣ Богдан Салып
"Удачные и неудачные попытки удержать GPT" LogitProcessors в HuggingFace, форсированная генерация слов, GPT+NER, GPT+USE, настройка датасета под ключевые слова и куда двигаться дальше
https://youtu.be/lM6a9e1t-mA
Приятного просмотра!
@sberloga
Выложили видео с прошедшего семинара 18 февраля
1️⃣ Никита Варганов, Юрий Барамыков (Сбер)
"CraftML - AutoML for dummies"
Это команда Optimization Guys. Мы расскажем про наш опыт участия в хакатоне от ODS. Наша команда разрабатывала AutoML for dummies - AutoML решение для людей, которые не умеют программировать и вообще не разбираются в анализе данных. Юра расскажет про команду и процесс написания AutoML, а Никита расскажет про фреймворк streamlit - простейшее решение для создания web-приложений для работы с данными.
https://youtu.be/U1LU_HzeMd0
2️⃣ Глеб Ерофеев (Lead ML Sbermarket)
"ML Хакатон-страйк"
Поделиться опытом как преуспеть в хакатонах.
https://youtu.be/3ge3LvTR2Eg
3️⃣ Богдан Салып
"Удачные и неудачные попытки удержать GPT" LogitProcessors в HuggingFace, форсированная генерация слов, GPT+NER, GPT+USE, настройка датасета под ключевые слова и куда двигаться дальше
https://youtu.be/lM6a9e1t-mA
Приятного просмотра!
@sberloga
YouTube
Никита Варганов, Юрий Барамыков (Сбер) - CraftML - AutoML for dummies
Команда "Optimization Guys". Ребята расскажут про их опыт участия в хакатоне от ODS. Команда разрабатывала AutoML for dummies. AutoML решение для людей, которые не умеют программировать и вообще не разбираются в анализе данных.
Юра расскажет про команду…
Юра расскажет про команду…