Big Data / ИТ и Маркетинг / Образование и бизнес / Бердников 🦾
244 subscribers
269 photos
6 videos
14 files
237 links
Здравствуйте, на связи Илья Бердников 🤝 Преподаватель НИУ ВШЭ и ВШБ; специалист в ИТ для маркетинга, платформах CRM, CDP 🤖

Канал = 📚 авторская колонка + 🧠 заметки про маркетинг, ИТ, BigData и немного новостей 🏛️
Download Telegram
Forwarded from Lawyer| Berdnikova Natalya (Наталья Бердникова)
Данные vs Информация: почему это важно для права и не только

Сегодня хочу поговорить о, казалось бы, простой вещи – разнице между данными и информацией.

Отсутствие чёткого разграничения этих понятий в российском праве создаёт серьёзные головняки, особенно в сфере цифровых технологий, ИИ и защиты персональных данных.

Вот представьте: вы работаете с изобретением, связанное с обработкой больших данных. Что именно является объектом? Алгоритм? Сами данные? Результат их обработки? Если закон не даёт чёткого определения, что такое «данные», возникает куча вопросов. Как описать объект в документах? Как доказать его новизну? Как защитить права?


В науке есть концепция «данные – информация – знание – мудрость». Проще говоря, данные – это сырой материал, набор фактов, цифр, символов. Сами по себе они ничего не значат. Информация – это уже обработанные данные, помещённые в контекст и имеющие смысл.

Так вот, в нашем законодательстве часто путают эти понятия. Например, закон о персональных данных. Что такое персональные данные? Номер паспорта? Дата рождения? Сами по себе – это просто данные.

Но если их объединить, они становятся информацией, которая идентифицирует конкретного человека.

☝️Получается, правильнее было бы говорить о «личной информации», а не о «персональных данных».

И это не просто придирка к словам. От этого зависит, как мы регулируем сбор, обработку и использование данных. Если мы не понимаем, что именно защищаем, то и защита будет дырявой.

Нужно внести ясность в законодательство. Чётко разграничить понятия «данные» и «информация». Это поможет и разработчикам, и юристам, и всем, кто работает с цифровыми технологиями.
1👍1👏1
В общем-то есть разные варианты развития карьеры у Data-специалистов. Всегда говорю об этом.

Но, чтобы такие...
Наш маленький интернет дата-специалистов сейчас взорвался этой новостью (некоторые его части), а Lamoda удаляет все упоминания о том, что у них работал такой сотрудник.

В целом - компанию понять можно. Это правильный шаг.

А также понятно, что её новая профессия от лукавого и это совсем не православно и вне традиционных ценностей.

Но! Все эти моральные устои - это конечно хорошо. Но ОСУЖДАТЬ удовольствие, хорошо-оплачиваемую работу и стиль жизни при котором ты НЕ ВРЕДИШЬ ОКРУЖАЮЩИМ (а доставляешь им удовольствие) - это инфантильно.

Хорошая новость.
Ни о чём в принципе не говорит.
Но мне она нравится...

Люди (Data-эксперты в т.ч.) имеют право быть счастливыми! 💪
5😁3👍1🔥1
Несмотря на моё полное понимание и принятие того, что происходит в нашей стране, я считаю недопустимым потреблять только ту информацию, которая исходит от одного источника.

Тем более, если речь идёт о профессиональной сфере, а не о сфере политической.

И, не соглашаясь с политическим взглядом автора, не могу не снабдить вас информацией от него на нашу профессиональную тему:

https://youtu.be/JfYaxRucBDM?si=h_Stp3iatoyqcH4c

Данный видеоролик посвящён утечке данных, млрд строк.

После 14.30 начинается политика - это уже нам не интересно.

Нам интересны агрегированные новости о данных!

Ключевые выводы, которые необходимо сделать:
1) личных данных у нас нет, всё они публичны
2) вести себя, в этой связи, следует правильно и практично
3) при крайней необходимости, у каждого из нас есть возможность использовать данные о любом человеке или группе людей (такая возможность является незаконной, поэтому, воспользоваться ей можно только на свой страх и риск)

Держитесь в курсе относительно событий из мира данных - и будете в безопасности.
👀31👏1
august_2024_ethc.png
94.2 KB
Вот так происходит движение по Хайп-Циклу Гартнера: https://www.bbc.com/russian/articles/cx2mjm27gl3o

Мы на пути в яму разочарования в технологиях ИИ...
Или ещё не достигли пика? 🤔
🤔2
С праздником...

28 января отмечается Международный день защиты персональных данных, в ряде стран он называется Днем конфиденциальности. В России отмечается с 2006 года, когда был принят федеральный закон "О персональных данных".

По данным Роскомнадзора, в 2024 году произошло 110 случаев распространения в интернете информации о россиянах, содержащих 600 млн записей. https://tass-ru.turbopages.org/turbo/tass.ru/s/obschestvo/22985601

---

Международный день защиты персональных данных отмечается с 28 января 2007 года. Такое решение было принято 26 апреля 2006 года комитетом министров Совета Европы. Дата соответствует годовщине подписания Конвенции Совета Европы от 28 января 1981 года «О защите лиц в связи с автоматизированной обработкой персональных данных» – первого международного инструмента в сфере защиты ПДн. В России же в 2006 году был принят федеральный закон, регулирующий деятельность по обработке (использованию) персональных данных: Федеральный закон от 27 июля 2006 года № 152-ФЗ «О персональных данных». https://habr.com/ru/companies/searchinform/articles/877208/
🎉2😎1
Иногда айтишники слишком уходят в креатив. Им оно не надо...
👀1
Термины, с которыми вы можете встретиться, которые сейчас в тренде. Лучше узнать об этих понятиях заранее, даже если вы не айтишники.

Если примерно понимать суть понятия, то легче будет ориентироваться во многом.

Данные - это растущий рынок. Держитесь в курсе.

***
Data Mesh — это подход к управлению данными, который делает данные более доступными и удобными для использования. Основная идея в том, чтобы децентрализовать данные, то есть распределить ответственность за них между командами, которые эти данные создают и используют.

Вместо того чтобы хранить все данные в одном централизованном хранилище (как в традиционных подходах), каждая команда отвечает за свои данные, как за продукт. Это значит, что данные должны быть качественными, хорошо документированными и доступными для других команд.

Data Mesh строится на четырёх принципах:
1. Домен-ориентированность — данные принадлежат командам, которые их создают.
2. Данные как продукт — данные должны быть полезными и удобными для использования.
3. Самообслуживание — инфраструктура должна быть простой, чтобы команды могли легко работать с данными.
4. Федеративное управление — общие стандарты и правила, но с гибкостью для каждой команды.

Простыми словами: Data Mesh — это способ сделать данные более полезными и доступными, передавая ответственность за них тем, кто их лучше всего знает.
2
Ещё немного о терминах, в контексте работы с данными. Да, это айти-тема. Но, призываю вас, мои дорогие гуманитарные друзья - держитесь в курсе!

***
Виртуализация данных — технология, обеспечивающая доступ к данным из различных источников (базы данных, облака, файлы) без необходимости их физического копирования или перемещения. Она создаёт виртуальный слой, который объединяет данные, позволяя анализировать и использовать их, как если бы они находились в одном месте, сохраняя при этом их исходное расположение.

Коротко: это единый интерфейс для работы с распределёнными данными без их физической интеграции.
👍3
Тем временем Евросоюз ввел санкции в отношении РАНХиГС.

А ведь там в т.ч. сейчас взращивают будущих специалистов по маркетингу и ИТ в области работы с большими данными.
👎2
Пожалуй, в РФ не так много компаний на острие ИТ-трендов в большом и очень большом объеме.

О чём я?
МТС, Яндекс, ВК (боже спаси и сохрани), Т1 (ВТБ) и, конечно же, СБЕР. Знающие - знают.

Несведущих (и себя) хочу просветить, зафиксировать информацию здесь (не забываем, что вы подписаны на мои личные заметки по ИТ, маркетингу, работе с данными) - СБЕР Платформу: https://platformv.sbertech.ru/

Очень широкий спектр ИТ-решений. Покрывают практически всё. Очень амбициозны и, что самое главное, коммуникабельны с т.з. работы с партнёрами.

Структурировать и рассказывать об этом не буду (можно спросить об этом ГигаЧат и он ответит криво), но фиксануть их ГигаПлатформу хочется тут. Пригодится.
Минцифры разработало подзаконные акты по обезличенным геоданным. Мы их изучили. Вот главное.

▪️Наборы геоданных Минцифры может запросить в нескольких ситуациях. Среди них — чрезвычайные ситуации, террористическая угроза, введение карантина. Также датасеты могут понадобиться, чтобы сформировать политику в сфере туризма, миграции и обеспечить санитарно-эпидемиологическое благополучие и др.

▪️Набор данных во всех ситуациях один и тот же:
– обезличенный идентификатор абонента,
– год рождения с возможностью выбора определенного временного интервала,
– пол,
– гражданство абонента,
– местоположение абонента. Сюда относятся данные об изменении местоположения с определенной периодичностью, передвижении в метрополитене и определении страны абонента, если в РФ он находится в международном роуминге.

▪️По факту такой набор данных означает, что получать их государство собирается у телеком-операторов.

«Вся суть обезличивания в том, чтобы не передавать идентифицирующие человека сведения. Но пока это выглядит спорным: информации о геоточках в определенных случаях уже вполне достаточно для идентификации персоны, а в комбинации с годом рождения эта задача еще более упрощается, — комментирует Никита Назаров, технический директор HFLabs. — Необходимости внесения в данные дрифта (смещения года рождения на случайную величину или размытия для геопозиций) из текста документов не вытекает».

Как все это будет выглядеть на практике, если законопроекты примут?

▪️ Запрос на предоставление датасета Минцифры будет отправлять через СМЭВ или личный кабинет организации на Госуслугах.

▪️Минцифры может предоставить операторам программу, которая обезличит данные под их же требования. Что это за программа и как она работает, пока неизвестно.

▪️ Если оператор персональных данных не подключен к ЕИП НСУД (платформе для хранения и сбора обезлички), на это ему дадут не менее 15 дней. Затем в течение трех дней он должен сформировать и отгрузить в НСУД запрошенный датасет.

▪️ Минцифры полученные данные провалидирует. Если качество не устроит, на переделку дадут еще 10 дней.

HFLabs — о клиентских данных
🔢 Экономика данных: технологический суверенитет и цифровизация

Вице-премьер Дмитрий Григоренко презентовал в Национальном центре «Россия» новый нацпроект. «Экономика данных и цифровая трансформация государства» повысит доступность современных телеком-сервисов, поможет подготовить ИТ-кадры и развить цифровое госуправление, расширит внедрение отечественного ПО.

Ключевые направления до 2030 года
⚫️ запуск отечественной группировки спутников связи
⚫️ обеспечение всех школ и колледжей современными ИТ-решениями
⚫️ предоставление всех госуслуг через цифровые платформы, а документов — в электронном виде
⚫️ производство 100% оборудования сотовых сетей и ПО в России
⚫️ проактивное предоставление не менее 100 госуслуг
⚫️ оценка защищённости 100% ключевых ГИС
⚫️ подготовка свыше 250 тыс. ИТ-специалистов, число работников в отрасли достигнет 1,4 млн
⚫️ развитие квантовых технологий
⚫️ создание цифровой аналитической платформы

Какие федпроекты вошли в «Экономику данных»
🔹 Инфраструктура доступа к информационно-телекоммуникационной сети «Интернет»
🔹 Цифровые платформы в отраслях социальной сферы
🔹 Искусственный интеллект
🔹 Цифровое государственное управление
🔹 Отечественные решения
🔹 Прикладные исследования и перспективные разработки
🔹 Инфраструктура кибербезопасности
🔹 Кадры для цифровой трансформации
🔹 Государственная статистика

«Экономика данных» станет важным этапом для цифрового развития страны. Цель нацпроекта — дальнейшая цифровизация государства, укрепление технологической независимости и улучшение качества жизни наших граждан.

@mintsifry
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
Ustanovki_IT.pdf
1.4 MB
28 февраля - день ИТ-специалиста.

Именно в этот день в 1956 году был запатентован сетевой кабель в форме витого кабеля, что изменило мир электротехнических коммуникаций.

До появления изобретения процесс передачи данных между несколькими компьютерами представлял собой большую проблему: благодаря разработке появилась возможность объединения нескольких компьютеров в локальную сеть.

Сегодня вышло любопытное исследование про айтишников: https://d-economy.ru/news/ano-cje-vypustila-analiticheskij-otchet-o-cennostnyh-ustanovkah-it-specialistov/
2
Получил сертификат о прохождении курса продаж продуктов ArenaData. Теперь могу консультировать официально 😎

В общем тут важно отметить интересное именно нам, людям связанным с маркетингом, что все наши прекрасные отчёты, исследования, статистики рекламных кампаний, маркетинговых промо - всё это - где-то лежит, как-то хранится, обрабатывается, может служить кормом для ИИ... И - в этом следует разбираться хотя бы поверхностно. Вы, как маркетолог, можете погружаться в Data-инструменты т.к. для вас это скорость и удобство 💚

Это может нести в себе и другие ценности. ArenaData торгуется на бирже. Лучше знать то, во что инвестируешь 🧐

Для ИТ-спецов объяснять ценность ArenaData даже не собираюсь :) вы всё и сами знаете :)
👏31🍾1
Готовлюсь к завтрашней лекции в РАНХиГС. Буду читать и общаться со студентами про аналитику в маркетинге.

Лекцию обозначил: "Современные подходы к аналитике в маркетинге и рекламе. Большие и классические данные для аналитики."

И подготовил для студентов (И ДЛЯ ВАС) крайне конкретную выдержку из моего большого обзора исследований BI-рынка РФ. Прикладываю.

Буквально несколько слайдов, в которых я отразил основные мысли из больших исследований.

Это пригодится кому?

ГЕН.ДИРЕКТОРАМ, ДИРЕКТОРАМ ПО МАРКЕТИНГУ, ИТ, HR...

Дело в том, что:
1) Нельзя говорить об аналитике без разговора про BI.
2) Про BI не следует говорить вне глобального контекста.
3) Следует учитывать функциональный контекст BI-систем.

Направления в бизнесе не существуют в вакууме. Всё связано. Давайте получать преимущество, видя картину целиком 🧠
🔥1