Future Crew
7.33K subscribers
449 photos
67 videos
328 links
Future Crew — центр инноваций МТС

Создаём решения на базе AI для приватности клиентов, кибербезопасности компаний и защиты инфраструктуры онлайн и офлайн.

Здесь рассказываем о разработке продуктов, делимся исследованиями и кейсами.

futurecrew.ru
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Тест скорости интернета на ЦИПРе. Справа Membrana.

Здесь рассказывали о скорости и о фичах подробнее. Благодаря приоритету в сети клиенты Membrana подключаются первыми, и у них самая высокая скорость. На больших мероприятиях актуально 🙂

#ЦИПР #ЦИПР2023
С 1 июня в России действует не только лето, но и новые правила обработки биометрии. Компаниям необходимо заново выстроить процессы работы с данными, а граждане получат возможность управлять доступом к своим биометрическим данным через Госуслуги. Рассказываем, что изменилось и почему это важно.

Нововведения для бизнеса

Согласно Федеральному закону № 572, государственные и коммерческие компании должны до 30 сентября 2023 года передать все собранные биометрические данные в Единую биометрическую систему (ЕБС). Затем аутентификация людей с помощью биометрических персональных данных будет возможна только с задействованием данных из этой системы. Доступ к ЕБС будет только у аккредитованных организаций.

Если к 1 июня 2023 года в организации уже действуют информационные системы, обеспечивающие аутентификацию с использованием биометрии, то они могут продолжить работать в течение 180 дней, в течение которых уполномоченный орган примет решение об их аккредитации.

В Единой биометрической системе будут размещаться и обрабатываться:
1. изображение лица человека, полученное с помощью фотовидеоустройств;
2. запись голоса человека, полученная с помощью звукозаписывающих устройств.

После 1 сентября 2024 года действие закона будет распространяться на виды биометрических персональных данных, определенные Правительством РФ.

Теперь единый государственный регулятор будет отвечать за хранение всех биометрических данных граждан и контролировать их использование компаниями.

Управление своей биометрией

В будущем можно будет управлять доступом к своим биометрическим персональным данным через Госуслуги, а сейчас подать отзыв согласия на обработку персональных данных можно в МФЦ и через банки. При действующем согласии своей биометрией можно пользоваться для оплаты проезда в метро, доступа в офис, оформления электронной подписи, получения финансовых и других услуг.

Как вы считаете, как закон повлияет на развитие сервисов на базе биометрии? Пользуетесь ли вы такими сервисами?
Как устроен Firewall в Membrana?

CTO Membrana Пётр Левшин – о том, как мы фильтруем трафик

Пожалуй, самая востребованная функциональность Membrana – это Firewall, который защищает от рекламы, трекеров и других вредоносных сущностей интернета.

Ключевая особенность – это реализация на сети. Мы никак не влияем на смартфон клиента, не изменяем его настройки и не сажаем батарею. Мы реализовали это за счёт сложных сервисов коммутации четырёх сетевых контуров:
• внешней общей сотовой сети,
• сети внутри нашей инфраструктуры, которая управляется сервисами Membrana,
• транспортной сети,
• внешней коммутации до серверов, расположенных в разных странах.

Под сервисами Membrana скрывается целый ансамбль микросервисов, Kafka и сетевых модулей. Мы попробовали 11 реализаций механизма блокировок паразитного трафика и трекеров, и в итоге развиваем свой движок на Rust, он оптимален по скорости и безопасности. За этим скрывается тонкая настройка планов маршрутизации и интеграции сервисов. Чуть позже мы планируем провести митап и рассматриваем возможность сделать технологию оупенсорсной. На митап пригласим 😊

О сборе статистики заблокированного трафика и трекеров

Возможно, вы интересовались, какой объём интернет-трафика проходит через ваш браузер и приложения, и проверяли с помощью специальных сервисов. Обычно можно увидеть примерную генерацию. Искусный мастер делает красиво не только витрину, но и всё, что скрыто, поэтому мы разработали более точный механизм подсчёта статистики. При обращении к узлу мы запоминаем, какие части мы заблокировали. Далее специальный робот (на нашей стороне, трафик абонента не расходуется) проходит по сохранённым адресам и оценивает, сколько трафика ушло бы на их открытие. Мы накапливаем базу знаний о рекламе, трекерах и прочих вредоносах, чтобы лучше их блокировать и оценивать потенциальное потребление ими трафика без повторной проверки.

На скриншоте – данные о том, сколько трафика мы заблокировали за пару дней на тестовом смартфоне.

А предзаказы на Membrana мы собираем тут.
CTO Cicada 8 Алексей Кузнецов в интервью CNews рассказал о проактивной защите от кибератак, о том, что стоит нанять хорошего тренера, если хочешь научиться драться, и о разнице между Red Team и Purple Team. А ещё – о платформе Cicada 8.

Это облачная платформа, уникальность которой — в комплексном подходе. Она объединяет в себе не только управление внешними угрозами, менеджмент внешнего периметра, но и анализ информации о взломах или утечках данных. Например, платформа отслеживает появление в СМИ, Telegram и даркнете публикаций об инцидентах кибербезопасности у заказчика.

В текущей конфигурации платформа ориентирована на enterprise компании. Мы пока не готовы делать её полностью автоматизированной, все рекомендации проходят экспертную валидацию и верификацию. Но в будущем она может стать доступной и для middle сегмента — когда качество автоматизации будет обеспечивать стабильно высокий результат для заказчика. Это будет более доступная версия в виде облачного решения, которое можно будет загрузить себе, оплатив подписку в личном кабинете.

Кстати, оставить предзаказ на Cicada 8 или задать вопросы о продукте можно здесь.
This media is not supported in your browser
VIEW IN TELEGRAM
Мы регулярно рассказываем про наши продукты и команды, которые их создают, но кое о чём мы ещё ни разу не говорили подробно: данные и искусственный интеллект.

На самом деле этим у нас занимается целый департамент по управлению данными — это серые кардиналы всех наших продуктов, которые реализуют вместе с командами всё: от виртуальных секретарей и блокировщиков трекеров до больших высоконагруженных и отказоустойчивых платформ для работы с данными.

Подробнее о том, чем занимается команда, мы расскажем чуть позже, но если ты:
- Крутой эксперт в AI, аналитике или Big Data.
- Хочешь работать плечом к плечу с командой таких же экспертов. Про «плечом к плечу» не шутка — в команде абсолютно все участвуют в разработке и пишут код.
- Не боишься работы в режиме стартапа, когда все нацелены на результат и результат нужно получать здесь и сейчас.
- Не боишься нового стека :)
Тогда тебе точно к нам!

Сейчас открыты следующие позиции:
Data Engineer
Data Analyst
DevOps
Старший архитектор

Если для тебя вакансии не нашлось, то не стесняйся писать на почту futurecrew@mts.ru, мы обязательно что-нибудь придумаем.
Что делает нас людьми? Умение выбирать все светофоры на картинке, конечно 😁

А как определить, что звонит бот или мошенник? Есть более 1000 параметров. Мы анализируем их все в совокупности с помощью AI и постоянно пополняем базу спам-номеров.

Сегодня сыграем в спам-бинго и расскажем о 9 базовых признаках подозрительных звонков.

1. Короткий разговор: средняя длительность ниже нормы.
2. Короткие перерывы: от одного звонка до другого пара секунд.
3. Много сбросов: никто не хочет говорить со спамером.
4. Минимум входящих: спамеру никто не перезванивает.
5. Минимум повторов: спамер тоже не всегда перезванивает. Но встречаются и агрессивные спамеры, которые в короткий промежуток времени звонят одному и тому же человеку. Их не так много.
6. Максимум исходящих: спамер готов пообщаться 24/7.
7. Много новых контактов: спамер пытается расширить круг друзей.
8. Всплески активности: спам по работе, обед по расписанию.
9. Плохая репутация: есть жалобы на источник? You shall not pass.
В команде Future Crew Даша Губанова занимается секретным проектом про умную приватность. Об этом проекте мы сможем рассказать позже, а сегодня поговорим с Дашей о международных рынках и о том, как девушке построить карьеру в IT.

- Даша, ты запускала продукты не только в России, но и в Индии, Китае, Кении. Где сложнее и где интереснее?
- Интересно везде, потому что все рынки разные, как и пользователи, и начинать надо всегда с начала, много нюансов: неочевидные паттерны поведения пользователей, мировоззрение и культура.
В Индии пользователи избалованы огромным количеством продуктов из-за венчурного рынка. В EdTech распространена продажа подписки через «подарок» устройства – то есть тебе «дарят» планшет, но без оплаченной подписки у тебя просто кусок металла.
Если говорить про сложности операционного характера, то это Китай. Так как это закрытый рынок, который максимально не приветствует компании и продукты извне – есть механизмы, которые мешают локализации: юридические, технические, платежные и т.д. И ещё в Китае нейминг компании может стать для клиента решающим фактором, необходимо учитывать национальные особенности.

- Как возникла идея вдохновлять других девушек на карьеру в IT?
- Символично, что это случилось в Международный женский день в 2020 году. На First Women in Tech Hackathon in Latvia, который в Риге проводит сообщество Riga Tech Girls, я познакомилась с организаторами, которые на протяжении многих лет популяризируют сферу IT & digital для девушек. Поэтому я решила реализовать такую идею в Москве. Набравшись смелости и найдя единомышленниц, мы создали сообщество Girls do IT.
Мы помогаем на самых разных этапах построения карьеры в IT: если вы учитесь в вузе, вышли после декрета или хотите сменить профессию, то мы всегда поддержим и подскажем варианты. Для этого мы проводим вебинары, митапы, тренинги и организуем программы менторства.

- Почему ты сейчас во Future Crew?
- Вместо того, чтобы бояться изменений, их нужно возглавить 😀
Future Crew неполным, но очень красивым составом 😊

Если хочешь быть в команде – откликайся на вакансии или пиши на почту futurecrew@mts.ru.

Направлений для исследований и разработки много: IoT, Big Data, Threat Intelligence, Red Team, AI, Machine Learning, Blockchain, MFA, криптография и пентесты. Но не только.
This media is not supported in your browser
VIEW IN TELEGRAM
Мы готовим к релизу продукт, который даст возможность управлять своим цифровым следом и сохранять анонимность в сети. Если вы хотите получить ранний доступ к нему, оставьте заявку здесь.

Что включает в себя цифровой след?

• Файлы cookie – это фрагменты информации, которые сайты хранят в вашем браузере. Это данные о вашей учётной записи или о товарах, которые вы добавили в корзину, но пока не купили. А ещё с помощью этой информации можно связать вашу историю посещений, поиска и другие действия на сайте вместе.

• Цифровой отпечаток пальца или fingerprinting – это список характеристик, которые уникальны для одного пользователя, его браузера и устройства. Он включает в себя множество незначительных на первый взгляд данных, например, о разрешении экрана и установленных шрифтах.

• Данные, которыми мы сами делимся в социальных сетях и других сервисах: интересы, фото, видео, музыка, встречи с друзьями, география пробежек, поездки в другие города.

Как используются эти данные?

Информация о вашем устройстве и местоположении передаётся на сайт для того, чтобы отобразить страницу в удобном для вас виде. При этом большая часть данных о запросах в вашем браузере также извлекается сторонними рекламными сетями с механизмами отслеживания.

Каждый сайт считывает только часть информации о ваших действиях. Сайты отслеживания могут сшить все разрозненные фрагменты вместе, чтобы сформировать ваш поведенческий профиль, определить уровень образования, дохода и политические взгляды. Чем больше ваших действий онлайн зарегистрировано, тем точнее будет этот портрет и тем больше будет поводов для рекламодателя, чтобы навязать вам товары и услуги.

Цифровой профиль даст возможность сёрфить в сети свободно, не оставляя следов.
19,4 МБ трафика с информацией о вас исходит с устройства в месяц, и это текстовые данные. Для сравнения, текст романа Чернышевского «Что делать?» весит чуть меньше 1 МБ.

Что с этим делать? Оставить заявку на Membrana, конечно.

Как мы блокируем паразитный трафик

Почти все игроки в интернете пытаются заработать как непосредственно на рекламе, так и на профилировании и таргетировании пользователя: интересы, пол, шаблоны поведения, бывает ли он за границей или нет, есть ли у него дети, нет ли проблем со здоровьем, есть ли домашнее животное и т.д. В некоторых реальных профилирующих витринах данных более 400 полей-признаков по каждому пользователю. И рекламный контент может даже превышать по объёму полезный.

Каждый раз, когда абонент Мембраны при включённом файрволе заходит на сайт, движок блокировки определяет сигнатуры паразитного трафика и оценивает, можно ли его вырезать/заблокировать, не сломает ли это итоговую страницу. При этом файрвол шлёт всю телеметрию по подозрительным блокам в Сервис Оценки Угроз (СОУ). СОУ содержит оценочные политики и также может выдать решение по трафику для управления движком, но основная его задача — накопить статистику для последующей оценки таких сигнатур и оценить объём и вид блокируемого трафика: это простой рекламный баннер, код подгрузки скрипта профилирования или часть паразитного JavaScript-кода. При получении необычного блока СОУ может параллельно прогрузить в себя подозрительный код для накопления знаний.

Важно: для абонентов Мембраны это происходит не на устройстве, а на сети. Ничего. Не надо. Устанавливать. Достаточно один раз включить файрвол в приложении.

Это не влияет на батарею устройства, нет дополнительного стороннего приложения AdBlock или файрвола у вас на телефоне – значит, меньше данных о нём получит кто-то в сети. Это важно. Показываем на простой схеме, как это работает.
Мы приглашаем опытных девопсов для работы с тремя направлениями во Future Crew: это Data Platforms, приватная связь и защита от уязвимостей периметра.

Если темы вам интересны – откликайтесь по ссылкам.

DevOps в Data Platforms

Задачи: K8s, VMWare, Linux, изоляция ресурсов (GPU, CPU, RAM), LDAP, мониторинг, участие в создании архитектуры, развитие CI/CD для ML и не только.

О команде Big Data можно мы немного рассказывали здесь.

DevOps в Membrana

К8 – одна из ключевых составляющих нашей инфраструктуры. Девопс будет работать с контейнерами, сетями, маршрутами и Kafka.

Здесь можно прочитать о технологиях и о команде.

DevOps в Cicada8

Задачи: Построение и доработка кластера K8s, настройка системы мониторинга с нуля, автоматизация развертывания и скейлинга Cicada8. Опыт работы с облачными провайдерами и понимание процессов ИБ будет плюсом.

А здесь есть ещё три вакансии в команде Cicada8.
Недавние находки ChatGPT показали, что эта модель ещё может удивить: ключи активации для Windows, коды от ядерных боеголовок.

Есть и другие интересные секреты, которые прошли через нейроны модели – приватные ключи от активных Bitcoin-кошельков. Запросив пары приватного и публичного ключа с активными транзакциями, автор канала Monkey see, monkey do (и наш друг 🙂) получил набор значений. А проверив баланс первого же публичного ключа – нашёл там почти $5000.

Казалось бы, золотое дно для тех, кто готов залезть в чужой кошелёк? Не совсем: публичные ключи не соответствуют приватным, что в очередной раз подтверждает, что GPT3+ модели стремятся максимально удовлетворить желания вопрошающего, даже если им не хватает данных.

P.S. Но найти кошельки с деньгами через ChatGPT всё же возможно, об этом скоро расскажем.

P.P.S. Чтобы кошелёк был вне зоны риска, нужно не публиковать его нигде и не использовать предсказуемые приватные ключи для генерации.

Откуда ChatGPT берёт информацию для своих ответов – рассказывает Кирилл Малков, директор по управлению данными центра инноваций Future Crew.

На самом деле доподлинно неизвестно, на чём обучался GTP-3/GPT-4 — эти модели лежат в основе ChatGPT — так как это коммерческие продукты с закрытым исходным кодом/весами. В случае новой версии неизвестно почти ничего, а в случае старой разработчики декларируют, что использовали данные из книг, Википедии и всего интернета в целом.

Под всем интернетом подразумеваются два публичных датасета, которые каждый сам может посмотреть:
WebText2 — это индекс по ссылкам, найденным в Reddit.
Сommon Сrawl — это индекс всего интернета.

И если первый — это не более 17 миллионов веб-страниц общим размером 65 ГБ, то в последнем только за 2022 год (а история сохранена с 2008 года) собрано 18 миллиардов веб-страниц общим размером в 2.3 петабайта.

Представляя масштабы всего этого объёма, кажется, уже можно не удивляться, откуда у ChatGPT такие познания.
Посчитали спам-звонки с января по май в этом году, получилось в 2,4 раза раза меньше, чем за такой же период в 2022-м и в 2021-м. Но всё ещё очень много: 123 млн.

Как отмечает аналитик Future Crew Павел Евтухович, руководивший исследованием, обычно спам-звонки длятся до 33 секунд, причём дольше всего со спамерами общаются люди старше 50 лет.

«Могут быть разные причины, которые в совокупности удлиняют диалог: это темп общения, желание дослушать аргументы собеседника и дать развёрнутый ответ. А иногда у людей просто есть свободное время и желание пообщаться», – объясняет Денис Коротяев, руководитель группы анализа данных во Future Crew.

А вы троллите спамеров? Или, может, пытаетесь наставить их на истинный путь?

Подробнее о результатах исследования.

#BigData #аналитика #спамзвонки #данные2023 #FutureCrew
Media is too big
VIEW IN TELEGRAM
Каждый раз, когда кто-то звонит нам и предлагает купить квартиру на этапе котлована, хочется, чтобы это не повторялось больше никогда. Но это повторится. Мы подготовились к любым звонкам в самое неудачное время и добавили в Membrana виртуального секретаря, который эмоционально пообщается со спамером за вас отфильтрует лишние звонки и сохранит расшифровку полезных.

Наш секретарь анализирует входящий вызов и принимает решение: отклонить сразу, поговорить самому и сохранить разговор или соединить с вами. Его задача – не только отсеять или принять на себя спам, но и передать вам всю существенную информацию. Для этого мы обучаем его на смоделированных и реальных диалогах.

Как секретарь анализирует входящий вызов:
• Понимает, есть ли звонящий в контактах, а если нет, то самостоятельно анализирует, может ли владелец этого номера быть вашим знакомым.
• Проверяет, есть ли номер в базе известных доверенных организаций или в базе спамеров и мошенников.
Определяет спамеров и мошенников с помощью искусственного интеллекта.
• Анализирует контекст разговора, чтобы понять цель звонка.
Если действительно важно ответить сейчас – вы видите вызов, если нет, то секретарь общается сам и всё записывает.

Вы увидите уведомление с превью о новом разговоре и сможете прочитать расшифровку в удобное время. Диалог похож на обычную переписку в мессенджере.

Все эти настройки гибкие: если вы захотите, чтобы близкие и коллеги всегда дозванивались до вас немедленно – так и будет.

Вот как это выглядит.

#FutureCrew #Membrana #виртуальныйсекретарь #блокируемспам
На прошлых выходных Google обновил политику конфиденциальности и теперь будет использовать все общедоступные данные для обучения моделей ИИ.

«Мы можем собирать информацию, находящуюся в публичном доступе, чтобы применять ее при обучении моделей искусственного интеллекта от Google и развивать такие сервисы и функции, как Google Переводчик, Bard и возможности Google Cloud, связанные с использованием AI», – пишет компания в новом документе.

Есть ли риски, что теперь Google узнает и сделает публичным то, что не должен был бы знать?

Спросили, что думает на этот счёт Кирилл Малков, директор по управлению данными во Future Crew.

Пока что «использовать общедоступную информацию» звучит достаточно безобидно. Мало что изменится по сравнению с тем, на чём обучаются текущие модели, поэтому серьёзных рисков нет. Разве что объём данных, на основе которых Google будет развивать свои сервисы, станет кратно больше.

Уже сейчас все большие языковые модели, такие как Bard, GPT4, GPT3, обучаются в целом на индексе интернета, поэтому знают, например, о комментариях в публичных сообществах и могут так или иначе пользоваться этими знаниями.

На данном этапе нет речи о том, что искусственный интеллект Google будет обучаться и на «деперсонифицированных» приватных данных, но, возможно, это будет следующий этап.

Если Google начнёт использовать для обучения нейросетей, например, личную переписку, то в результате какой-нибудь прикольный prompt сможет вытащить уникальные артефакты из вашей личной жизни. А это проблема. В массиве этих данных могут быть пароли и другие секреты.

Сейчас в обучающие выборки модели может попасть и что-то псевдоприватное. Думаю, что Google сам будет пытаться маскировать и скрывать из обучающих данных личную информацию, чтобы нивелировать риски.

#FutureCrew #AI #BigData
Media is too big
VIEW IN TELEGRAM
Мы начинаем тестирование новой системы физической безопасности собственной разработки – Urbanpredator. Теперь для входа в БЦ «Декарт» в Москве мы начали использовать наше мобильное приложение.

Urbanpredator – это новое слово в области систем контроля и управления доступом. Биометрические данные посетителя не используются, чтобы его узнать. Магнитные карточки тоже больше не нужны. Urbanpredator поддерживает мультифакторную аутентификацию и при этом не хранит персональные данные пользователей на локальных серверах. Все проверки осуществляются прямо на смартфоне посетителя.

Мы начинаем с малого и обкатываем новые технологии в интеграции с существующими системами контроля доступа БЦ «Декарт». Сейчас приложение будет генерировать QR-код, который можно будет использовать в качестве ключа для входа. Скоро не понадобится и он 😎
13 студенческих команд, 65 участников из Москвы, Санкт-Петербурга, Самары и Пензы собрались в лесу под Самарой и бурились к центру Земли с 3 по 9 июля, параллельно создавая защищённую IT-инфраструктуру в борьбе за шаманский бубен – выглядит как сценарий сериала, сгенерированный нейросетью, но нет, всё это VSFI!

VSFI – уникальные соревнования по системному администрированию и информационной безопасности. Мастер-классы, воркшопы и лекции об ИБ проходят в лесах Самарской области каждое лето с 2012 года.

CPO Cicada8 Алексей Гришин придумал эти соревнования 13 лет назад и поделился фотографиями и видео, не все из которых мы сможем опубликовать здесь. Но мы выбрали вот эти и записали впечатления Алексея от этого года:

Изначально на VSFI создавали симуляцию плохого сисадмина или ситуации, когда он ушел из компании со скандалом (поругавшись со всеми и оставив за собой разруху и неразбериху). Позже соревнования эволюционировали в подход к подготовке начинающих DevOps-инженеров и молодых ИБ-специалистов.

В начале недели мы даем базовые знания – про Linux, Ethernet-сети, DNS и DHCP – рассказываем, как работают, зачем нужны, за какую функциональность отвечают. После базовых лекций переходим к темам посложнее: учим мониторить инфраструктуру, разворачивать приложения в Docker-контейнерах, рассказываем, как автоматизировать свою работу при помощи Ansible, даем домашние задания и оперативно их проверяем. Вишенкой на торте является командное соревнование, где участники могут продемонстрировать всё, чему они научились.

Подробнее о VSFI можно узнать в группе ребят, там же будут анонсированы отборочные в 2024 году.

Сейчас мы во Future Crew начинаем работать с комьюнити и обучением. Этим летом хотим собрать топовых инженеров, чтобы поговорить и о наших продуктах, и о том, что можно и нельзя хакнуть. Если вам интересны подобные активности, ставьте 👍

#VSFI #FutureCrew #Cicada8