Data-Diving // Pro Data
2.28K subscribers
195 photos
12 videos
274 links
Канал для начинающих дата-аналитиков.

Академия аналитики данных: https://data-diving.ru/
Download Telegram
🔜 Напоминание

Через 10 минут начинается лекция Константина Воронцова

> Дилеммы развития искусственного интеллекта: чем заниматься – создавать возможности или устранять угрозы?

Очно: 2 корпус ТГУ, ауд. 302 (для студентов/сотрудников ТГУ)
Онлайн: трансляция YouTube

🆕 По ссылке ниже доступна запись трансляции
30 ноября - 2 декабря на площадке Томского государственного университета прошел очный модуль ежегодной Школы прикладного анализа данных, реализуемая Академией Дата-Дайвинг и Томским государственным университетом при поддержке Университетского консорциума исследователей больших данных.

В образовательном мероприятии приняли участие 57 слушателей из 13 университетов и организаций:
- ТГУ
- НовГУ им. Ярослава Мудрого
- НГУАДИ
- ЯрГУ им. П.Г.Демидова
- Самарский университет
- СурГУ
- ОмГТУ
- РАНХиГС
- ЮГУ
- ТПУ
- ПГНИУ
- Законодательная Дума Томской области
- ФАУ “РосКапСтрой”

В этом году в программе Школы было 3 образовательных трека:
1. Образование и общество;
2. Рынок труда;
3. Управление наукой.

Участники Школы прикладного анализа данных 3 дня учились принципам цифровой аналитики, осваивали инструменты анализа текстовой информации и сетевого анализа в рамках своих научных интересов, визуализировали тестовые наборы данных, а также работали над групповыми проектами в смешанных командах.

В Школе приняли участие приглашенные эксперты: Константин Воронцов, д.ф.-м.н.,руководитель лаборатории "МОСА" Института ИИ МГУ, профессор РАН, МГУ и МФТИ.
Дарья Мальцева, заведующая Международной лабораторией прикладного сетевого анализа НИУ ВШЭ.

Результатом трехдневного обучения стали дорожные карты 9 групповых проектов, а также технические задания на выгрузку данных. После того, как команды получат готовые датасеты, они приступят к их обработке и интерпретации в сопровождении экспертов и модераторов. А уже 25 декабря состоится итоговая защита проектов, где команды представят результаты своей проектной деятельности приглашенным экспертам, а также получат зачеты в рамках программы повышения квалификации.

Школы прикладного анализа данных реализуются при поддержке Мегапьютер Интеллидженс - компании, создавшей русскоязычную аналитическую платформу PolyAnalyst. PolyAnalyst является ключевым инструментом Школы в рамках курса, посвященного анализу данных, текстовой аналитике и созданию интерактивных дашбордов.
🔥16👍7
Всем привет!🌸

Рекомендуем к прочтению новую статью на Хабр😉
👉Визуализация: лучшие практики
В статье рассматриваются варианты визуализации результатов работы и их применение в различных областях, включая ИБ. Конкретных примеров визуализации там немного, но рекомендуем заострить внимание на разнообразии и полезности представленных решений. Вдруг и вам пригодится😜
Приятного прочтения!
👍14😱2
​​​​Дорогие друзья!
Наша команда академии Дата-Дайвинг поздравляет всех с Новым годом. За этот год вместе с нами больше тысячи студентов погрузились в мир данных.

И мы хотим сказать вам спасибо за то усердие, с которым вы вгрызались в методологии анализа данных. За то, как храбро боролись с питоном и продирались сквозь дебри статистического анализа. За то, как делали свои дашборды понятными, а sql-запросы быстрыми и оптимизированными.

Желаем новых проектов, отличных задач для анализа и много-много качественных данных. А самое главное – призываем вас не переставать учиться новому. Мы, в свою очередь, обещаем и дальше помогать в этом нелегком деле.

С нетерпением ждем начала года, чтобы продолжать :) До новых встреч, друзья, в новом 2024 году!
40🎄16🎉98👍4👌1
🤔 Давайте решим задачу

Мы тренировались писать SQL-запросы и код на Python. А сегодня предлагаем вспомнить язык регулярных выражений.

Для начала несколько полезных ссылок:
короткий курс с примерами, чтобы изучить регулярные выражения (можно пройти за вечер)
понятная статья о том, как устроен язык (стоит заглянуть ради иллюстраций)
удобный сервис для проверки выражений (подсветка и объяснение на полях здорово помогают разобраться)

➡️ Перейдём к делу: в нашем тексте есть теги, ограниченные угловыми скобками <>. Требуется написать регулярное выражение для поиска этих тегов.

<person name=”Эдуард”>Эдик</person> пришел <span number = ‘3’>учиться</span> на <bold><a href="https://skills.tsu.ru/catalog/povyshenie-kvalifikatsii/sql-dlya-analiza-dannykh/">курс по базам данных</a></bold>, а <person>Слава</person> – нет.

Оставляйте решение в комментариях👇🏻
А мы в понедельник опубликуем свои варианты. Хороших выходных!

@data_analyst_pro
11
📝 Решение задачи

Разберем задачу про поиск тегов при помощи регулярных выражений. Тег ограничен угловыми скобками <>, внутри которых может быть любой символ, но не сами угловые скобки.

1️⃣ <.*?>
На языке регулярных выражений:
точка (.) – любой символ;
звёздочка (*) – квантификатор, указывающий, что предыдущий символ повторяется от 0 до бесконечности раз;
вопросительный знак (?) – в этом случае делает наш квантификатор «ленивым», чтобы захватывалась минимальная совпадающая подстрока.

ℹ️ По умолчанию любой квантификатор (* или .) является «жадным», то есть в строке он будет искать самое длинное совпадение с регулярным выражением.

✍🏻 Проверьте самостоятельно: скопируйте в конструктор наш пример из задания и протестируйте выражение <.*>

ℹ️ Выражение <.+?> тоже может подойти. Напишите в комментариях разницу между этими вариантами👇🏻

2️⃣ <[^<>]*>
При помощи каретки (^) можно задать инвертированный класс: запись [^<>] означает «любой символ, кроме < и >».

Ставьте ❤️, если понравилась рубрика, и 🔥, если хотите продолжения

@data_analyst_pro
10🔥6
🥗 Приглашение на дата-обед

Tomsk Data Science – сообщество энтузиастов, увлеченных наукой о данных. Ребята регулярно проводят встречи и обсуждают самое интересное из мира IT.

В это воскресенье в гости заглянет HR из Тинькофф👩🏻‍💻 Запланирован разбор проблем во время трудоустройства в data science, а также множество полезных советов.

🗓 28 января, 14.00 по томскому времени
📍 очно в Томске (Точка кипения, пр-кт Ленина, д. 26)

🗺 Участники Open Data Science встречаются в разных городах и даже в других странах, посмотреть можно здесь

@data_analyst_pro
👍8
Во вторник (23 января) эксперты Академии Дата-Дайвинг приняли участие в стратегической сессии по вопросам организации и проведения Чемпионата высоких технологий.

Чемпионат проводится второй год в рамках национального проекта «Образование» и Всероссийского чемпионатного движения по профессиональному мастерству. Его цель – создание условий и системы мотивации для повышения значимости и престижа рабочих профессий.

В этом году Академия Дата-Дайвинг стала индустриальным партнером компетенции «Специалист по анализу данных (BI-аналитик)», которую курирует Политехнический колледж ФГБОУ ВО «Новгородского государственного университета им. Ярослава Мудрого». Наши эксперты участвуют в разработке конкурсного задания, а также войдут в экспертную комиссию.

Финал чемпионата пройдёт очно в Великом Новгороде. Нам особенно приятно сообщить, что у победителей будет возможность пройти оплачиваемую стажировку в Академии Дата-Дайвинг. Положение и правила проведения на сайте.

В качестве бонуса прикладываем в комментариях слайд с компетенциями BI-аналитика. Этот анализ проводился с помощью открытого инструмента мониторинга рынка труда РосНавык. Можно потренироваться самостоятельно и собрать компетенции нужной вам профессии🧑🏻‍💻

@data_analyst_pro
🔥4🥰21
🧐 Логическая задача

На
реальном it-собеседовании любят в том числе проверять смекалку кандидатов. Давайте устроим быструю тренировку🦾

➡️ Некоторые аналитики знают язык программирования Python. Каждый аналитик вооружён критическим мышлением.

Определите верное высказывание:
1. Python знают только аналитики
2. Все знатоки Python не вооружены критическим мышлением
3. Аналитики, которые вооружены критическим мышлением, не знают Python
4. Все, кто знают Python, вооружены критическим мышлением
5. Некоторые знатоки Python вооружены критическим мышлением
6. Аналитики, которые знают Python, не вооружены критическим мышлением
7. Только аналитики вооружены критическим мышлением

Проверьте себя👇🏻

@data_analyst_pro
🪧 Вакансия для аналитика в Томске

📍 Информационно-аналитический отдел, ТГУ (очно)
🗓 На период проекта «Содействие занятости»

Что нужно:
• хорошо знать Excel (сводные таблицы, функции, формулы)
• визуализировать отчётность (схемы, графики)
• применять статистические методы анализа данных
• разбираться в бизнес-процессах организации

Какие условия:
• работа пн-пт с 9 до 18 (с перерывом на обед)
• зарплата 45 тыс. (на руки)
• испытательный срок – три месяца

🔗 Подробности по ссылке

Контакт: korobova_pi@ido.tsu.ru
Полина Игоревна Коробова – руководитель подразделения

📇 Если у вас на примете есть человек, которого может заинтересовать работа аналитиком, поделитесь с ним этой вакансией

@data_analyst_pro
🔥6👍32
Media is too big
VIEW IN TELEGRAM
Всем добрый пятничный✌🏻
Новый выпуск рубрики «Уютная беседа с аналитиком» (оставим ссылки на 1 и 2 эпизоды).
Наш гость — Татьяна Дунаева, hr-аналитик и тьютор по дизайну исследования👩🏼‍💻
Приятного просмотра!

@data_analyst_pro
🔥102
🔜 Хакатон ML TalentMatch

Хакатон – это командное соревнование для IT-специалистов, участники которого в сжатые сроки решают технологическую задачу и разрабатывают прототип.

ML TalentMatch организует компания SENSE при поддержке Акселератора Возможностей. Направление кейсов – HR Tech.

Какой кейс можно выбрать:
• алгоритм для структурирования информации в резюме кандидатов
• алгоритм для сопоставления резюме и вакансии

Минимальные требования:
• собрать команду от 3 до 5 человек
• участником может быть любой гражданин РФ старше 18 лет
• подать заявку до 25 февраля (включительно)

🗓 28 февраля – 1 марта
📍 онлайн (если из Москвы – защита может быть очной)

Подробности на сайте

@data_analyst_pro
🔥2
​​​​🔜 Мусор на входе – мусор на выходе, или почему нельзя просто запихнуть данные в модель

С прошлого года в ТГУ открыт Сибирский центр изучения искусственного интеллекта. Мы позвали коллег рассказать о своих проектах, машинном обучении и работе с данными.

🗓 17 февраля (суббота) 13.30 МСК
📍 Вебинар на 1-1.5 часа

О чем поговорим:
• Анализ исторических газет
Как автоматизировать работу с текстом после OCR и избежать исправления ошибок
• Извлечение навыков из вакансий
Как научить модель обнаруживать навыки в текстах вакансий, как разметить данные, какие выбрать метрики
• Предсказание отчисления студента
«Задача-гроб» в данных: чем плох единственный срез данных по времени, если нужно понять, студент сдаст сессию или заработает долг
• Анализ программ ДПО
Как спрогнозировать процент прохождения курса, какие факторы учесть в модели, как аналитически посмотреть на ситуацию

Спикер – Александр Ковалёв, data scientist, сотрудник Сибирского центра изучения искусственного интеллекта

Регистрация👇🏻

@data_analyst_pro
👍8🔥8
🔜 Напоминание

Через час (в 13:30 мск) начнётся вебинар о машинном обучении и работе с данными

> Мусор на входе – мусор на выходе, или почему нельзя просто запихнуть данные в модель

О каких проектах поговорим:
• анализ исторических газет
• предсказание отчисления студентов
• автоматизация обнаружения навыков в текстах вакансий

🆕 Запись и презентация↓
🎧 Начало трансляции

🆕 Запись и презентация: https://youtube.com/live/IMyQXd3aKok?feature=share
Media is too big
VIEW IN TELEGRAM
Начался прием заявок на ежегодную Школу прикладного анализа данных!

Школа реализуется Академией Дата-Дайвинг совместно с Томским государственным университетом и Президентской академией при поддержке Университетского консорциума исследователей больших данных.

Когда: 30 мая – 24 июня 2024 г.
Очный модуль: 30 мая – 1 июня
Онлайн-модуль: 2 – 24 июня.

Где: РАНХиГС, г. Москва.

Стоимость участия: до 40 000 руб.

В рамках Школы участники учатся внедрять технологии анализа больших массивов данных в реализацию собственных исследовательских и прикладных проектов, осваивая: сбор данных из открытых источников, текстовую аналитику, прикладной сетевой анализ, визуализацию результатов исследования. Эксперты Школы продемонстрируют отраслевые кейсы и расскажут, как внедрить полученные навыки в собственную проектную деятельность, а также помогут участникам реализовать первый учебный проект с применением технологий BigData.

Обучение осуществляется на основе Low-code инструментов, которые не требуют навыков программирования, поэтому Школа подойдет для людей не только с техническим образованием, но и представителям гуманитарных и естественно-научных специальностей.

Успейте подать заявку до 17 мая.
Подробности на сайте: https://data-diving.ru/data-school
🔥6👍21
🤖 Приглашение на техтолк

Выдался шанс заглянуть на встречу сообщества Tomsk Data Science и Тинькофф. Зовут всех, кому интересно направление AI.

В программе:
• AI в экосистеме Тинькофф (спойлер: список не будет коротким)
• горячие тренды в мире искусственного интеллекта
• кейсы от экспертов
• знакомство с единомышленниками

🗓 5 марта, 19.00 по томскому времени
📍 очно в Томске (БЦ «The Елань», ул. Советская, д. 78)

Спикер – Илья Туксов, руководитель группы разработки ML-проектов в Тинькофф

@data_analyst_pro
👍4🔥2
Хотите стать волшебником или феей больших данных? 🔮

Научно-исследовательская лаборатория прикладного анализа больших данных ТГУ объявляет новый набор на бесплатную стажировку. Это редкая возможность получить уникальные компетенции и практический опыт в сборе и анализе больших данных.

Регистрация до 14 марта включительно.

Что нужно будет делать:
• Подбирать и собирать данные исходя из целей и задач исследования
• Извлекать из данных полезную информацию
• Анализировать данные разных типов
• Создавать и презентовать аналитические дашборды

Идеальный стажер:
• Уверенный пользователь Microsoft Office и аналитических инструментов (Python, low-code на выбор)
• Умеет обрабатывать большие объемы информации
• Умеет сводить цифры и факты, извлекать реальные закономерности
• Аналитический склад ума, внимательный, усидчивый, ответственный и организованный.

Лучшие стажеры получат приглашение о трудоустройстве.

Подробности

—————————

@tomskuniversity
10🔥7