Клуб CDO
3.07K subscribers
379 photos
24 videos
88 files
1.44K links
Сообщество профессионалов в области работы с данными и искуственным интеллектом
Download Telegram
Хорошая таксономия “стоимости качества данных”
Всем добрый день!
Напоминаем, что в ближайший четверг, 30 июля, у нас очередное онлайн мероприятие.

19:00-20:00 Денис Афанасьев, CEO CleverDATA и активный автор данного канала, будет выступать с темой «Внешние данные, кейсы. Методы безопасного обмена данными».

Ссылку для подключения к Zoom направим в четверг. Ставьте ивент в календарь, если раньше этого еще не сделали. Хорошего дня!
До встречи в 19:00 на выступлении Дениса Афанасьева, CEO CleverDATA, с темой «Внешние данные, кейсы. Методы безопасного обмена данными».

Ссылка для подключения https://us02web.zoom.us/j/87880614971
1DMx_Data_market.pdf
18.7 MB
Все привет и спасибо всем, что присоединился к трансляции! Как обещал, публикую презентацию, а записью поделимся чуть позже.
Всем добрый день! По ссылке ниже запись прошедшего на прошлой недели выступления Дениса Афанасьева в рамках Клуба CDO с темой «Внешние данные, кейсы. Методы безопасного обмена данными».
https://www.youtube.com/watch?v=8P0uZLP0CHE
Fueling growth through data monetization

Довольно свежие результаты исследования McKinsey на тему использования данных в задачах роста бизнеса.

Краткие выводы: продажи и маркетинг по использованию данных впереди всех, high tech индустрия использует данные в максимальном количестве кейсов, в оценке результата использования данных доминирует “moderate change” как оценка результата.

В основном компании с помощью данных равивают текущую продуктовую линейку, нежели создают фундаментально новые продукты.

С точки зрения организации структуры аналитического отдела у лидеров рынка доминирует гибридный подход, с единым центром экспертизы, но с выделенными под заказчиков ресурсами. А вот у отстающих вместо гибридной схемы используются либо полностью централизованный или полностью децентрализованный подходы.

Также интересно, что у лидеров рынка за данные отвечает непосредственно CEO (прям в сильно подавляющем количество случаев)

Подробности с красивыми гистограммами тут:
https://www.mckinsey.com/business-functions/mckinsey-analytics/our-insights/fueling-growth-through-data-monetization
Интересный кейс разворачивается вокруг противостояния Wheely и ДТ Москвы о передачи данных. ДТ хочет получать все данные о поездках в реальном времени. Похоже кроме кейса mail/doubledata, появиться новый пример спора о правовой принадлежности данных.

https://wheely.com/ru/debunking-mdots-anti-privacy-argument
За последнее десятилетие ИИ превратился в самую мифологизированную область прогресса, вокруг которой формируется новая техно-религия всезнания больших данных и всемогущества машинного обучения.
С каждым настоящим достижением в области ИИ мы наблюдаем параллельный рост шумихи, мифов, заблуждений и неточностей. Эти недоразумения способствуют непрозрачности систем ИИ, делая их в глазах общественности волшебными, непостижимыми и недоступными.
О новом проекте команды Даниэля Лойфера «Мифы об ИИ», цель которого помочь распутать и развенчать некоторые из этих вводящих в заблуждение идей, - в моем новом посте на 5 мин.
- на Medium http://bit.do/fHxvt
- на Яндекс Дзен https://clck.ru/QK3fS
#ИИ
Forwarded from Ivan Begtin (Ivan Begtin)
С января 2020 стартовал европейский проект TRUSTS [1] по созданию платформы торговли персональными и проприетарными данными с учётом всех правил и ограничений Евросоюза, включая GDPR. В проекте участвует консорциум из 17 организаций, академических, финансовых, стартапов в области данных, а Евросоюз выделил на него чуть менее 6 миллионов евро на 3 года [2].

Этот проект создан в рамках направления "Supporting the emergence of data markets and the data economy" [3] под которым в Евросоюзе создаются такие проекты как:
- Kraken Brokerage [4] платформа по защите персональных данных в облачных средах
- PIMCITY [5] повышение контроля пользователей за их данными собираемыми веб-сайтами
и многие другие проекты.

По моему опыту наблюдения за проектами в рамках Европейской исследовательской программы Horizon 2020 они редко превращаются в практические системы/стартапы/продукты, но очень часто прямо или косвенно влияют на выработку госполитики и регулирование в Евросоюзе.

Ссылки:
[1] https://www.trusts-data.eu/
[2] https://cordis.europa.eu/project/id/871481
[3] https://cordis.europa.eu/programme/id/H2020_ICT-13-2018-2019
[4] https://cordis.europa.eu/project/id/871473
[5] https://cordis.europa.eu/project/id/871370

#privacy #personaldata #eu
Всем добрый день!

Рады анонсировать следующее мероприятие (остаемся пока в онлайне).

2 сентября 19:00-20:30

Михаил Садофьев, Директор, Руководитель направления продвинутой аналитики Accenture в России

Тема: «Стратегия данных»

Особенности и факторы успеха при разработке стратегии данных. Примеры кейсов. Руководство по достижению целевого уровня зрелости организации.

Ставьте себе в календарь, чтобы не забыть. А ссылку пришлем ближе к мероприятию.
Progress…but more work ahead

Очень хороший заголовок для отчета о текущем состоянии AI в бизнесе, имхо максимально точно определяет текущее положение вещей.
Отчет подготовлен компанией KPMG и доступен по ссылке ниже.

Основные выводы по прочтению отчета такие:
⁃ две трети опрошенных считают, что внедрение технологии ИИ движется с соответствующей скоростью в их отрасли, но большинство респондентов все еще желают, чтобы их организации более активно внедряли технологию.
⁃ Менеджеры С-уровня значительно более позитивно оценивают готовность организаций к внедрению, чем менеджер среднего уровня
⁃ Большинство компаний ждут основную отдачу от AI в будущем, но и на текущий момент отмечают существенные выгоды от применения технологий
⁃ Существует большое различие в адаптации технологии между разными индустриями, внедрения идут неравномерно
⁃ Основная проблема адаптации технологий - недостаточное понимание возможностей технологии
⁃ Новый термин появился - “data literacy” - что еще раз подчеркивает необходимость массового обучения
⁃ Не такой уж и большой процент сотрудников считают AI угрозой для своих рабочих мест
⁃ Вопросы этики, безопасности и контроля данных и ИИ - первостепенные
⁃ Государственное регулирование ИИ сферы - неизбежно

https://advisory.kpmg.us/content/dam/advisory/en/pdfs/2020/living-in-ai-world.pdf
Сегодня хочу книгу порекоммендовать. Не так много книг по теме качества данных, ранее я писал про DMBOOK, а сегодня хочу отметить “Handbook of Data Quality” - очень полное руководство по методам обеспечения качества данных. Обзор походов, проблематики, вопросов организации и реализации.

Если кому нужна версия в электронном виде - обращайтесь.

https://www.goodreads.com/book/show/17301405-handbook-of-data-quality
Друзья, почему то не могу в комментариях поделиться ссылкой, поэтому, поскольку есть запросы на книгу, публикую ссылку тут: https://www.dropbox.com/s/94hgnf62zzsgch9/Sadiq2013-Handbook-of-Data-Quality.pdf?dl=0
Всем добрый вечер!

Напоминание:

2 сентября 19:00-20:30

Михаил Садофьев, Директор, Руководитель направления продвинутой аналитики Accenture в России

Тема: «Стратегия данных»

Особенности и факторы успеха при разработке стратегии данных. Примеры кейсов. Руководство по достижению целевого уровня зрелости организации.

Ссылка на Zoom будет здесь завтра.
Всем добрый день!

Ждем сегодня в 19:00 на мероприятии Клуба CDO.

Выступает Михаил Садофьев, Директор, Руководитель направления продвинутой аналитики Accenture в России

Тема: Стратегия данных
Время: 19:00-20:30 по Москве

Подключиться к конференции Zoom
https://us02web.zoom.us/j/89481111531
Всем добрый день!

Newprolab открывает осенний учебный сезон. Направляйте своих коллег, будем рады их обучить!
Ближайшие программы:
"Специалист по большим данным 13.0" (обучение 12 недель) - 90 000 руб., старт 29 сентября.
"Data Engineer 7.0" (обучение 7 недель) - 60 000 руб., старт 5 октября.
"Deep Learning 6.0" (обучение 4 недели) - 50 000 руб., старт 9 ноября.
Все программы в этом сезоне в онлайне.

Вся информация на сайте newprolab.com

Заявки можно оставлять на сайте. Если есть вопросы, то можете писать прям здесь @elenanewprolab
OpenRefine 3.4

Обратил внимание, что только что инструмент для предобработки и очистки датасетов получил обновление - вышла версия 3.4

И, кстати, если кто-то не знает про этот продукт - рекомендую обратить внимание. Он довольно удобен, бесплатен, полностью кросс-платформенный и предназначен для следующих задач:

Быстро получить представление о табличном датасете.
Перерабатывать данные в нужный формат, делать базовые расчеты.
Фильтровать и объединять данные.
Находить ошибки и неожиданности — например, слишком большие цифры, слова вместо чисел, пустые значения.
Автоматически находить потенциальные опечатки и несоответствия в названиях, позволяя приводить записи к единому виду (кластеризация текстовых записей).

Живет тут:
https://github.com/OpenRefine/OpenRefine/releases
Всем привет!

Решили, что вам может быть интересно данное бесплатное мероприятие, там будут выступать CDO разных компаний.

Онлайн-форум “INFADAY 2020. Как обеспечить готовность цифровых организаций“

Когда:
24 сентября 2020 года, с 10:00 до 17:30 по Москве.
Где: онлайн.
Стоимость: бесплатно

На форуме вас ждет 6 эмоциональных дискуссий о данных:

Создание корпоративной модели бизнес-глоссария. В ходе дискуссии вы узнаете, с чего начать внедрение бизнес-глоссария, на какие примеры ориентироваться, как понять, готова ли компания к внедрению Data Governance и многое другое.

Мастер-данные - кристаллическая решетка цифровой компании. В ходе дискуссии вы узнаете, какие процессы завязаны на мастер-данных, их место с точки зрения организационной структуры и ИТ-архитектуры и другие вопросы.

Есть ли альтернатива озеру данных? Тренды цифровой архитектуры. В ходе дискуссии вы узнаете, что вкладывается в понятие «озеро данных», какие архитектуры могут быть альтернативными.

Как получить данные без обращения в ИТ.
В ходе дискуссии вы узнаете, можно ли полностью передать работу с данными пользователям, как действуют крупнейшие компании.

Как построить корпоративную функцию качества данных. Право на качество.
В ходе дискуссии вы узнаете, как оптимально выстроить процессы проверки качества для ключевых данных, почему важно унифицировать проверку качества данных и правил для нее.

Цифровая автономия и ИТ-сервисы.
В ходе дискуссии вы узнаете, что представляет из себя автономная цифровая организация и на какие пять критически важных областей необходимо обратить внимание руководителям компаний, чтобы стать такой организацией.

Среди участников дискуссий:
Алексей Бондаренко, CDO, Газпромбанк;
Анна Мешкова, Директор программы ЦХД ПАО Уралсиб банк;
Алексей Луковников, CDO блока финансы ПАО Сбербанк;
Павел Шорохов, Руководитель направления аналитики и отчётности, Онлайн-кинотеатр ivi.
Виктор Булгаков, Руководитель службы развития систем управления данными, Банк ВТБ;
Георгий Лондаридзе, Руководитель центра анализа данных, Медси;
Нурлан Кусаинов, CIO, АО НК "КазМунайГаз"
Леонид Чёрный, CDO, Мегафон;
Сергей Золотарев, Управляющий партнер, ArenaData;
Иван Черницын, Руководитель Центра аналитических решений Дирекции региональных продаж «Газпром нефть»;
Михаил Петров, Директор департамента Цифровой трансформации, Счётная палата РФ.
Ольга Гнездилова CDO, Tele2;
Юрий Сирота, Chief Analitycs Officer, ПАО Уралсиб банк;
Виктория Краснова, CDO, Сибур;
Борис Рабинович, Старший управляющий директор департамента управления данными ПАО Сбербанк.
Наталья Третьякова, CDO, Газпром нефть;
Максат Нуриденулы, Управляющий директор и Chief Data&Operating Officer, Альфа-Банк Казахстан;
Андрей Обухов, СIO, Банк "УБРиР"
Алексей Точилов, Руководитель отдела хранения и обработки данных «Утконос»;
Александр Айваз, СDO Lamoda.

Подробности и регистрация: https://bit.ly/3brDGd6
Всем привет, ссылка на презентацию Михаила Садофьева - выступление по стратегии данных на прошлой неделе.

bit.ly/326zZ9K