UNICORN NEWS
107 subscribers
126 photos
3 videos
3 files
13 links
С заботой о вашем психическом здоровье

Канал цтф-команды из вуза, имя которого нельзя называть

Мероприятия:
Сириус 2019
Kuban CTF 2019
Urban.Tech Moscow
Зимняя школа ИТМО
VKA CTF`2020
Летняя Школа

Тэги:
#UnicornDevUTM - Urban.Tech Moscow
Download Telegram
Внутреннее убранство. Приезжих заселились в отель Веденский
Анпак мерча, первая часть. Футболка, две пары программерских чул... носков. Чёрный бейдж - символ иб-трека
Вышла ошибка. Там не две пары носков, а три единицы. Три... носка...
Кстати, книги выдают разные
Что находится в сумке. Блокнот, ручка, печально знаменитый камень-банка на 8к, black hat, маска, книга) Хороший старт)
Начинаю цикл конспектов:

«Интеллект в роботах: что, как, зачем?»
Сергей Колюбин, д.т.н., профессор факультета систем управления и робототехники,
Университет ИТМО

---

Ключевые моменты:

Гипотеза воплощения - ИИ не может раскрыть свой потенциал (AGI) без физического воплощения вследствие необходимости взаимодействия с внешней средой.

Волны и фронтиры ИИ. Собранные вручную знания (описание) - Статистическое обучение (категоризация) - Контекстная адаптация (объяснение).

Барьеры в современном ML:
- Слабое понимание семантики и контекста
- Жадные алгоритмы
- Не робастность
- Проблемы переноса в физический мир

Концепции одним взглядом:
Мысль 1 - Вместе, а не вместо. Человекоцентрированная робототехника. Современные парадигмы: работа в неизвестном изменяющемся окружении, адаптивность.
Мысль 2 - Win-win робототехники и ИИ. Они взаимосвязаны, решение задач одной области не должно идти отдельно от решения задач другой. Задачи манипулирования, кардикальный гомункул.
Мысль 3 - Интеллект должен воплощаться диффузно. ИИ можно разделить на подключенный (облачный) и воплощенный ИИ (многоуровневые динамические архитектуры).

Sense - Plan - Act - Interact - похоже на цикл Демминга, кстати)

Мысль 4 - Время - критический фактор (нужно его экономить). Натуральные испытания - это дорого, долго, может быть даже опасно. Актуальность использования синтетических данных.

Мысль 5 - Уважайте физику. Почти любую задачу можно сформулировать и решить как оптимизационную, но нужно правильно выбрать правильно и тщательно целевые функи, ограничения, свободные параметры, алгориты. Mops or muffins.

Генеративный дизайн адаптивных механизмов.
Классификация и детектирование с дообучением. Проблема катастрофического забывания.
Точная и робастная VIO локализация.
Семантический SLAM. Семантическая сегментация MSeg. Восстановление глубины: MiDaS. Картиование: Kimera.

Решение сбера по предотвращению memory burn: MIB-RRT.
«Технологическое предпринимательство»
Евгений Кузнецов, CEO в Orbita Capital Partners, экс-генеральный директор АО «РВК»

---

Ключевые сложные слова:

Гибридное нейросетевое комьюнити. Botkin-AI. "Робот учится лучше у людей, чем люди у людей" - у робота лучшая эффективность при достойных учителях.

Уровень плотности роботизированной среды. Робот может заменить десятки людей, повторяет действия с постоянным качеством, стоит только единожды настроить процесс. Работа с чертежами без программирования. Новое качество - теперь вместо развития человеческого ресурса, который будет обслуживать машины, теперь же нужны машинные ресурсы.

[
Ох, на словах о дороговизне человеческой силы рекомендую почитать маленький рассказ Азимова, "Чувство силы", оно на 15 минут: https://librebook.me/the_feeling_of_power/vol1/1
]

Функции взаимодействия человек-с-человеком: тут человека до сих пор сложно заменить роботом: "обезьянкам нужен груминг, нужна поддержка, нужно взаимодействие". Роль человека всё больше сводится к социальным функциям: торговля, образование переходят на большую человекоподобность. Например, тенденция уменьшения учебных групп (классы с одним преподавателем на 30 человек превращаются в с одним п-ем на 5 человек).

Старая концепция: "Лучший пациент - это пациент под наркозом". Новая концепция с добавлением робототехники: общение с человеком, а профессиональные вещи доверить железу, так как важен психологический настрой пациента. Врачи будут больше психоаналитиками, поддержкой, контролем питания.

Эмоциональная и психоэмоциональная сторона взаимодействия с роботами. То, что робот лечит лучше врача, не должно демотивировать врачей, это наоборот помощь в более качественном предоставлении услуги. К сожалению, сейчас чем более роботизированная конструкция приближена к человеку, тем больше отторжения и отвращения она вызывает, поэтому XXI-й век будет посвящен решению вопросу, стоит ли очеловечивать роботов или стоит их превратить в более мультяшных персонажей.

"Будут ли уводить людей с дорог, чтобы не портить жизнь роботам?" - в авиации уже есть такие желания.

Направление медицины. При текущем качестве медицины (в США, правда), люди, которые дожили до 30 лет, смогут спокойно дожить до 120 лет. Влияние генетики на продолжительность жизни - всего лишь 10%, а вот 60% - образ жизни: питание, сон, образ мышления, эффективно организованная работа, что в принципе поддается коррекции, поэтому это можно посвятить ИИ: медитации, контроль здоровья и так далее.

Проблема человека - он игнорирует предвестники тяжелых заболеваний и начинает бороться уже с тяжелыми последствиями, когда припечет. Prevention медицина - диагностика этих предвестников.

Можно доверить цифровым решениям контроль за своим здоровьем, например тот же подсчет калорий. Нужно снижать барьер доступа к такого рода приложениям, делать процессы полуавтоматическими, это путь к самоподдерживающейся массовой аудитории. Автоматизированные советчики.

Генетическая медицина. Редактирование генома. Модификация на уровне генеративных клеток - пока табу. Детальное профилирование онкологической клетки для исследование метаболических путей клетки - и их блокировки в рамках борьбы с онкологией. "Трансплационные свиньи".
«Применение ML технологий в задачах такси, еды и лавки»
Илья Ирхин, руководитель отдела машинного обучения и анализа данных «Яндекс.Такси»


---


Предсказание текущей реальности
Сложность - модель не может работать лучше качества разметки. Возникает потребность в то, как правильно сформулировать описание разметки.

---


Предсказание будущей реальности - предсказание объективного будущего (например, погоды, спроса на такси на завтра, сколько курьеров выйдет на линию).
Поверх предсказаний мы применяем бизнес-логику.

Приятные стороны:
- простая постановка задач, простое обучение
- простые метрики качества предсказания
- хорошо подходит для начального этапа проекта

Сложности:
- иногда нельзя ответить на вопрос, как точность нашего предсказания связана с конечной бизнес-пользой. Например, мы предсказываем потребность в спросе на товар, но бизнесу хочется дополнительно знать о потерях в случае недозаказа или перезаказа.

---

Рекомендательные системы

Приятные стороны:
- Большой простор для алгоритмов и методов
- Результат очень нагляден

Сложности:
- Сложный flow обучения и применения модели
- Бизнес-эффект, как правило, долгосрочный
- Без АБ вообще ничего непонятно

(то есть две последние проблемы - оценки)

---

Uplift таргетирование.
Нужно выдавать промокод тем людям, которые без промокода не воспользуются этим тарифом. Это правильная задача таргетирования.

Четыре типа людей в зависимости в квадранте "Will Convert if Treated" - "Will Convert if Not Treated"

Сложности:
- Нужны предварительные данные.

---

Стадии ML проектов:

Presale
- оценка технических требований, их анализ, постановка задачи

Создание MVP
- сделать то, что будет работать, что будет реализовывать задачу. Какая-нибудь эвристика. Ее техническая интеграция

Внедрение

Поддержка стабильности качества продукта

---

Роли:

Data Engineer
- сбор, хранение данных и доступ к ним

Data Sсientist
- Аналитика данных, постановка ML задачи, обучение моделей

ML Engineer
- Внедрение модели в прод


ML Ops
- Общие инструменты для обучения моделей и настройка окружений для моделей в проде. Нужно знать конкретные технологии, которые можно поставить в прод.


Некоторые роли могут быть объединены.

---

Реальные кейсы

Предсказание спроса Яндекс.Лавки
- RANSAC
- К сожалению, против выбросов неустойчива
- Решение: добавили более чувствительную модель с участием человека.
- Вывод: иногда фича может стать багом

UpSale в Яндекс.Лавке
- Чтобы увеличить средний чек, сделали рекомендательный блок на корзине
- Для оценки использовали AB
- Метод CUPED - дополнительная аналитика

Автоматизация саппорта в Я.Такси
- Вывод: иногда важно переобучать модель

Прогноз изменения цены в Я.Такси

Предсказание популярных локаций
- Для решения задачи холодного старта


---

Проекты-бумеранги - когда мы сделали какое-то хорошее предсказание, а оно нам приятно аукнулось где-то в другом месте
- Предсказание дома/работы.
- Оффлайн посещения организаций. Рекомендации о том, что твой любимый ресторан открылся рано.
- Проактивный саппорт. Можно оптимизировать не саппорт, а причины обращения туда.
- Переход на C++. В какой-то момент решили перейти на плюсы из-за нагрузки, а во время карантина из-за огромной нагрузки этот переход нас спас, ибо старая модель не справилась бы.

Есть замкнутый круг из профита и вложения ресурсов. Искать новые данные всегда полезно, так как они могут случайно полезно где-нибудь выстрелить.


---
Группа метрик Loss, Оффлайн-метрика, Онлайн-метрики (AB-тестирование; когда мы выкатываем разные две версии автомобилей; метрика switch back, когда мы свапаем алгоритмы, например, каждые 15 минут).
«Современные методы работы с данными с временной структурой: транзакции, click-stream и другие»
Дмитрий Виниченко, Research Leader in Risk Modeling and Research, СБЕР

---

Кредитный риск.
Оценка вероятности дефолта клиента.
В качестве данных выступают транзакции.

[Спикер произносит сложные слова, использует матан против слушателей]

Граф вычислений, backprogatation в представлении docoupled layers. Пошел матан. Якобиан. RNN, Elman. Constant Error Carousel. LSTM. Encoder-decoder парадигма, teacher forcing. Bahdanau attention, Q-K-V partition. Dot-product attention, векторизация расчёта.

Лучшие практики исследовательской работы:
- Корректная постановка задачи
- Знание используемых методов
- Контроль сложности эксперимента
- Приоритезация экспериментов
- Устранение most significant bottleneck
- Оценка влажности компонентов модели


Один из участников поведал мне, что это краткий курс по ML от МФТИ. Рассказать его за час - вау!
«Искусственный интеллект в СБЕРе: кейсы, вызовы, тренды»
Дмитрий Бугайченко, Chief Data Scientist блока «Розничный бизнес», СБЕР

---

Интеллект - это способность:
- двигаться к цели
- принимать решения о действии
- решать проблемы
- учиться на опыте

Силикон против углепластика углерода
[C] Скорость принятия решения
[C] Количества решений в единицу времени
[C] Использование больших объектов информации
[Y] Широкий спектор задач
[Y] Высокая обобщающая способность
[Y] Юридическая значимость


Манифест FATES:
- Выработка правил игры, каким должен быть ИИ, чтобы не нарушать наше чувство хорошего
- Fairness, Accountability, Transparency, Ethic, Safety and security

Обучение на истории vs. Обучение с подкреплением.

Алгоритм многоруких бандитов.

Кейс с рекомендательной системой.
Кейс с поиском лесных пожаров. Решение - нейронные сети + градиентные бустинги.
Кейс с непрерывным тестированием POS-терминалов.

Тренды AI в СБЕРе (и не только)
- Демократизация (уменьшается порог вхождения из-за того, что созрели инструменты)
- Платформизация
- Сокращение рутины - всё, что может быть автоматизировано, должно быть автоматизировано
- ESG - экологичность решений и положительное влияние на экологию
- Поддержка государства

Что нужно, чтобы влиться в AI:
1. Индустриальный опыт
2. Практический опыт
3. Методы машинного обучения
3.1. Математика
3.1.1. Линал
3.1.2. Тервер
3.1.3. Матан
4. Методы разработки систем обработки данных
4.1. Технологии
4.1.1. Основы вычисл. техники
4.1.2. ЯП
4.1.1. Паттерны и принципы разработки

Сбоку от таблицы находится стажировка в Сбере)


luden.io/wtl
«Научно-исследовательская деятельность в области ИИ»
Леонид Жуков, старший управляющий лаборатории искусственного интеллекта СБЕРа

---

Daniel Kahnerman, "Thinking, Fast and Slow". У человека есть две системы принятия решения - бессознательная, которая работает 95% времени (она баыстрая, ассоциативная, автопилот) и сисема 2 (требует усилий, медленная, логичная, нерешительная).

На сегодняшний день нет у компьютеров возможности рассуждать, нет здравого смысла, несмотря на обилие различных алгоритм и математических выкладок.

Кейс с классификатором, заболел ли человек короной, по кашлю.

Кейс с диагнозами.

---

Эмбединги транзакционных данных. Дилемма: неэтично использовать полные открытые данные о банковских клиентам, но очень хочется. Приходится делать репрезентации пользовательских данных.

Эмбединги CoLES. Принцип: в нормальных условиях поведение людей не очень сильно меняются на коротких промежутках (пару месяцев, например). Берем паттерны, которыми человек тратит в разные моменты времени, и мы должны тренировать модель так, чтобы она могла давать схожие эмбединги на этих разных моментах времени. Так мы не видим конкретные действия клиента.

---

ИИ в решении инженерных задачах

Предсказание поломки турбины через виртиальные сенсоры. Принцип: глядя на датчики температуры, которые мерят один физический процесс, то мы сможем найти прекурсоры, что происходит что-то не так. Такое моделирование позволило найти разладку за десять дней до аварии.


---

Желание: получать решение физических задач быстро, но не тратить на это много времени. Решение: получить некоторый датасет, обучить ИИ на нем. Но нужно быть экспертом в ML и в той области, которую мы оптимизируем.

Задача о правильном свертывании белка было решено так.


---

Лаборатория ИИ, которой принадлежит спикер, ищет к себе специалистов, в том числе для стажировки на лето.
Влад рассказывает про a/d на иб-треке
Сегодня с %hash_name% были капитанами двух A/D тим( 1 и 3 места ).

Аоаоаоаоаоаоа, первое место не стоит того, чтобы вручную с другим тиммейтом вводить 70 флагов...
Деранков Ярослав Игоревич,
Начальник отдела администрирования средств защиты Департамента кибербезопасности Сбербанка.
Академия кибербезопасности Сбербанка

---

Уязвимое место: люди.

Почти всё можно скомпрометировать. Большинство атак хорошо спланировано, это большой бизнес.

Атакуют всех. По статистике минимум один-два раза в год атакуют 72% компаний (статистика radware, 2019 год).



Часто встречаемые атаки:
- вредоносы и ботнеты (72%)
- социальная инженерия (65%)
- DDoS - распределенная атака типа отказ-в-обслуживании (48%)
- атаки на веб-приложения (46%)
- атака шифровальщиков (39%). В 2017 году был всплесr - атаки аж на 59% компаний.
- майнеры (21%)
- злоупотребления API (17%)
- что-то иное (1%)
[radware ERT report, 2019-2020]

{Оффтоп: У Сбера дорогие игрушки. Смотрим в закупки - средства против DDoS обходятся Сберу в 2 млн. долларов.}

Кто атакует (и с какой целью):
- financial/ransom (59%)
- insider threat (29%)
- political/hacktivism/social (28%)
- cyberwar/geopolitical conflict (27%)
- competition/espionage (25%) - https://vc.ru/tech/237415-kompaniya-cellebrite-obyavila-o-vzlome-zashchishchennogo-messendzhera-signal-v-otvet-komanda-signal-vzlomala-cellebrite
- angry users (20%)
- motive unknown/other (27%)
- have not experienced any cyberattacks (1%)

---

Развитый рынок киберпреступности.

---

Модель killchain от lockheedmartin - https://www.lockheedmartin.com/en-us/capabilities/cyber/cyber-kill-chain.html (fyi: в целом шаги аналогичны mitre att&ck matrix)

Атака magecart на british airlines - https://www.riskiq.com/blog/external-threat-management/magecart-british-airways-breach/

---

DDoS атаки, связанные с уязвимыми ntp-серверами. https://www.cloudflare.com/learning/ddos/ntp-amplification-ddos-attack/

---

Кибербезопасность: 4 точки зрения
- network-centric
- business-centric
- data-centric
- people-centric


---

Домены знаний кибербезопасности
- security engineering
- secure software development
- secops (security operations)
- governance
- risk assessment
- threat intelligence
- physical and environmental security
- human secources awareness and security
Немного запоздавший материал по питчу

———

Ольга Сорокотяга (фамилия вау!)

@career_adviser

Большой опыт работы в различных сферах: карьерный консультант, HRD, бизнес-тренер, консультант по эмоциональным зависимостям. Сейчас преподаватель ИТМО.

Занятие по soft skills


---

Ключевые вещи:


Публичное мастерство и ораторское мастерство. Отличие.

[Публичное мастерство - любая ситуация перед людьми, ораторское мастерство - умение убеждать]

"Каждый может успешно выступать публично в своём индивидуальном стиле". Лидером может стать любой. Нужно найти стиль.

[Страх как ресурс для энергии]

Зачем нужно уметь выступать? - Чтобы иметь возможность влиять на свою жизнь и на других людей.

Зачем НАМ нужно выступать в проекте от Я-Профи?

---

Упражнение "Небо в алмазах"

Нужно впечатлить окружающих, незабываемо представив своего соседа.

Для этого сначала в парах поделитесь друг с другом некоторым набором фактов о себе.

Время 7 минут.

---

Что запомнилось в рамках упражнения? То, что интересно отдельным слушателям, "у кого что болит". Поэтому важно знать свою аудиторию. Одна из задач после публичного выступления - запомниться. Бренды, города, интересы, цифры, гороскопы, мистика, предсказания, темы политики, секса. Мы обращаем внимание на речи тех, кто задел эмоциональные стороны нашей души.

---

Для технарей - задействовать цифры, даты, аналитику.

Критически важно понимать ЦА, так как для начала убедить надо их.

---

Главный вопрос выступления - "Зачем мы это делаем? Зачем выступаем?"


Что должны сделать люди после того, как вы выступите?


Три цели выступления:
1. Цель конечная: что я хочу, чтобы начала делать аудитория после нашего контакта?
2. Цель про атмосферу: в какой атмосфере должно пройти взаимодействие?
3. Цель для себя: что меня порадует, мотивирует, сделает счастливее?



1. Я хочу, чтобы в результате моего выступления слушатели:
- сделали...
- изменили своё мнение о ...
- изменили своё отношение к...
- приняли решение о...


6 важных вопросов
1. Кто ваша ЦА?
2. Какую выгоду получат люди в аудитории?
3. О чем вы хотите рассказать (тема)?
4. Какую выгоду получите вы?
5. Где состоится выступление?
6. Когда и как долго будет длиться выступление?

Формула продажников:
Характеристика - Преимущество - Выгода
Машинка 45 см - меньше стандартной 65 - эргономика.


Изучение аудитории:
1. Количество
2. Гендерный состав
3. Уровень знаний
4. Уровень осведомленности
5. Ценности, интересы
6. Отношение к предмету презентации
7. Ожидания аудитории

Этапы работы в проекте:
1. Определение целей
2. Создание ключевых идей
3. Алгоритм презентации
4. Проработка вопросов и ответов
5. Дизайн выступления
6. Репетиция
7. Проведение
8. Анализ и оценка

---

Видео на ютубе: "Система Станиславского для ораторов"

---

Три стадии мастерства: Неосознанная некомпетентность, осознанная некомпетентность, осознанная компетентность.

---

Структура выступления:
1. Привлечь внимание
2. Зацепить аудиторию
3. Основная идея
4. Почему идея верна?
5. Как и чем объяснить верность идеи? Подкрепление аргументов
6. Оставить "дверь открытой": выводы, призыв.

Выступление + Тезис -> Аргументы 1, 2, 3, сопряженные с фактами, графиками, историями, иллюстрациями -> Заключение.

---

Варианты вступления
- риторический вопрос
- регламент выступления
- серия вопросов аудитории
- цитата
- "пока я ехал к вам сюда" - релевантная история случилась прям недавно, поэтому она актуальна
- притча
- ошеломляющая цифра
- использование предмета
- парадоксальное начало
- комплимент
- раскрытие своих чувств
- стихи
- вовлечение в обустройство помещения
- удивительный факт

---

Аргументы vs Тезисы

Аргументы подкрепляют тезисы


Аргумент
ПОДДЕРЖКА: то, о чем идет речь (чем ниже знание аудитории, тем больше поддержки)

ПРИМЕР: конкретный факт из жизни

РАЦИО: цифры, данные
ЭМОЦИО: конкретная эмоция, максимум конкретных деталей


--

Виды аргументов (влияния)

Логика:
- цифры, статистика
- Факты, примеры
- аксиомы
- законы (природы, юридические)
- опыт
- выводы
Эмоции:
- принцип результата (если сделаете, получите)
- картина будущего (представьте)
- цитаты, афоризмы, пословицы
- объединение интересов
- визуализация (визуалы, кинестетики, аудиалы)
- метафоры, сравнения
- метод контраста (бьем на жалость и сменяем ее на жесткость)
- эффект ореола (участие знаменитостей)

---

Положение тела в пространстве
- Не вжимаемся в стену, но и не лезем на первый ряд
- Не смыкаем ноги, но и не ставим их слишком широко - это признаки неуверенности


---

Интонации
1. только что пробежали марафон
2. просите милостыню в электричке
3. самый сексуальный человек на планете
4. признаетесь жене в измене
5. рассказываете страшную историю детям
6. вот-вот чихнете
7. испытываете внезапные вспышки гнева
8. скандалите на рынке
9. скандалите в библиотеке
10. грузин, который говорит тост
11. старый мафиози, сообщающий свою последнюю волю
12. очень сильное похмелье
13. работница провинциального ЗАГСа
14. полководец, воодушевляющий войско перед боем
15. ведьма и произносите страшное заклинание
16. постоянно делаете селфи
17. разговариваете с малым пушистым котёнком
18. итальянская темпераментная женщина
Роботономика: новая форма человек-машинного взаимодействия
robonomics.network
Александр Капитонов

---

Проблема:
Рост населения и усложнение цепочек поставок требует полномасштабного внедрения киберфизических систем в человеческую экономику.
НО
Злоупотребления, утечки данных


https://www.cnews.ru/news/top/2021-04-26_krivoj_soft_krupnoj_pochtovoj

Нужна максимально независимая система или распределенная между максимальным количеством вендоров. Также решение, кому доверять информацию.

---


Решение:
Необходима децентрализация в этих вопросах.

Пример: mesh-сеть в Каталонии


Ассиметричное шифрование дало возможность существования решения, таких как цифровая подпись.


Функционал криптовалюты в виде умных контрактов. Контракты с роботами, например для сквозных цепочек поставок и автономных логистических сервисов.

---

Предпосылки появления экономики роботов
Пионер новой институциональной экономики
Рональд Коуз. "The Nature of the Firm", 1937

Виктор Глушков, один из соавторов проекта "ОГАС" по автоматизации плановой экономики, 1962

---

Спикер использует стек NixOS + IPFS + ROS + etherium

---

Примеры контрактов:
- поставки
- оплата заводов

---

Сенсорика, планирование, движение

---

NFT-токен - незаменимый токен, который уникален и не может быть изменен. Нужен для подтверждения владения чем-либо, например квартирой. ERC721

NFT аукционы
За третье место в цтф дали вот что!
Футболка, флешка на 8 гигабайт, ручка, стикосы, провод microusb+typec+microusb to usb динамической длины (макс. 1 метр)
Подъехал мерч за второе место. Примечателен защитный чехол для карт) А ещё у них тканевые сумки

Это за первое место. Нет флешки, но есть защитный чехол для карт + тканевая сумка, а также ручка металлическая. Вместо майки - свитшот