Parsing Conf
550 subscribers
6 photos
2 videos
14 files
164 links
Data collection conference/meetup

Митап о сборе данных

Тематические объявления и посты бесплатно размещаем


По всем вопросам можно обращаться в чат
https://t.me/joinchat/HvuCPzwpPJHrrDfC
или в личку @NikolayKrupiy @cuda23
Download Telegram
#анонс
Доклад 2. «Еще одна архитектура системы мониторинга цен и место библиотеки ferret в ней»
1) Какой может быть архитектура для ежедневного мониторинга цен на множестве сайтов.
2) Как мы используем библиотеку Ferret в этой архитектуре.
3) Плюсы и минусы архитектуры.
#анонс

Один из докладов по техническим причинам переносится на следующую часть конференции. Дата будет объявлена завтра.

Доклад 2. «Еще одна архитектура системы мониторинга цен и место библиотеки ferret в ней»
#ссылка

В Facebook обнаружили уязвимость, которая может привести к ещё одной масштабной утечке.
Специальный инструмент "Facebook Email Search v1.0" позволяет находить учётные записи соцсети и связанные с ними адреса электронной почты, даже когда у пользователей они скрыты в настройках конфиденциальности.
Видеодоказательство:
https://youtu.be/LB_yPaHSgWs
Пока достоверно не известно, успели ли уже собрать внушительную базу соответствий Facebook id, Full name, Email.
Но было бы приятно к существующим утечкам Facebook добавить новые данные.
Работайте, парсеры 🪆
У нас есть чат в котором Вы можете задать любой вопрос, который вас интересует или просто поболтать.

https://t.me/joinchat/HvuCPzwpPJHrrDfC
#анонс
Под каждый доклад будет пересоздаваться отдельная ссылка, поскольку мы пользуемся бесплатной версией зума.
Если у Вас есть какой-то продукт или Вы хотите что-то прорекламировать, опубликовать вакансию, то можете присылать @cuda23 информацию, будет пост в канале. Важно, чтобы пост был тематический
Какой доклад Вам понравился больше всего?
Anonymous Poll
9%
Кейс от mail.ru. Россети. Контроль качества данных
16%
Парсинг через Tor: Как скачать 1.5 млн патентов за 2 недели, а не за 40 лет
1%
Автоматические регистрации на веб-порталах
1%
Сбор данных о бумажных книгах
4%
Сбор данных с сейсмографов
70%
Не был на митапе / хочу увидеть результаты
#анонс
Контакты докладчиков

@Chessgevara "Кейс от mail.ru. Россети. Контроль качества данных"
@Shorstko "Парсинг через Tor: Как скачать 1.5 млн патентов за 2 недели, а не за 40 лет"
@Yar4eX "Автоматические регистрации на веб-порталах"
@DenisStark77 "Сбор данных о бумажных книгах"
@crimeacs "Сбор данных с сейсмографов"
Какое время митапа наиболее удобное для Вас в будний день (по Москве)? Выберите ближайшее
Anonymous Poll
10%
9-00
8%
10-00
4%
11-00
9%
12-00
19%
18-00
31%
19-00
26%
20-00
16%
21-00
13%
22-00
10%
Хочу посмотреть результаты
#анонс
Parsing Conf

————————————
Дата: 27 апреля
Время: 20-00 по Москве
————————————


1. @ziflex. "Библиотека ferret. Обзор. Рассказ автора"
2. @Bundleman. "Еще одна архитектура системы мониторинга цен и место библиотеки ferret в ней"
3. @roman_kucev. "Как собрать датасет для аутентификации человека по лицу через Толоку."

- Мероприятие бесплатное
- Онлайн
- Ссылка на ZOOM будет опубликована в канале за несколько минут до начала мероприятия
photo_2021-04-22_17-19-08.jpg
126.2 KB
#продукт

Компания LabelMe создает открытую библиотеку бесплатных датасетов.

Если ты давно искал определенный набор данных, но никак не мог найти - просто заполни форму. Специалисты компании изучат все присланные запросы, выберут самые популярные и создадут по ним датасеты. Они будут храниться в открытом доступе у них на сайте.

Заполнить форму
#ссылка
#работа

Если вы ищете работу, возможно, вам поможет этот канал

https://t.me/meta_jobs
Parsing Conf pinned «#анонс Parsing Conf ———————————— Дата: 27 апреля Время: 20-00 по Москве ———————————— Подробности в предыдущем посте: https://t.me/parsing_conf/100»
#работа
"я тут думаю себе найти человека на парт-тайм
есть скрейпер линка, его нужно поддерживать и юзать эластик на данных
платить много не смогу и крайне желательно иметь счёт в банке вне России (я в Украине)
т.к. я нацелен на долгосрочное сотрудничество и возможно переход в фултайм, то крайне желательны разделение ценностей (ответственное отношение к работе и т.д.) и интерес к проекту (рекрутинг в мл сфере, поиск наиболее подходящего места работы/сотрудника, в дальнейшем всякие онтологии проф развития, постоянный анализ рынка, расширение на другие сферы)"

@ufi00