Клуб CDO
3.1K subscribers
380 photos
24 videos
88 files
1.44K links
Сообщество профессионалов в области работы с данными и искуственным интеллектом
Download Telegram
Абсолютно фееричный доклад Константина Анохина с конференции OpenTalk 2021 про недостающие элементы доминирующего сейчас нейросетевого подхода к моделированию ИИ. Must see, очень интересно и доступно даже не профессионалам.

PS запись пиратская, пока официальную не выложили.

https://www.youtube.com/watch?v=LH-_NnFZIE8&list=WL&index=6&t=1s
nlpin2020-210204134144.pdf
1.5 MB
Презентация Григория Сапунова “NLP in 2020”

Презентация с доклада на OpenTalk.AI 2021 про основные вехи 2020 года в области NLP.
Собственно основные вехи:
⁃ Появление супер больших языковых моделей и, в частности, GPT-3
⁃ Тенденция к тому, что увеличение размера модели ведет к уменьшению количества данных, необходимых для обучения
⁃ Обучать большие модели не только дорого для людей, но и для природы, в силу выделения CO2 дата-центрами
⁃ Большинство языковых моделей являются мульта-языковыми
⁃ Языковые модели преодолели очередной барьер в сравнении с человеком в “понимании” общих и открытых вопросов (benchmarks типа SuperGLUE и тп)
⁃ Архитектуры языковых моделей продолжают развиваться: внедрение трансформеров, памяти и тп
⁃ Демократизацию использования языковых моделей дрейвят облака и доступное в них API, которое делают крупные компании

Полная презентация во вложении
вдруг кому то пригодится
Разработка_ИТ_стратегии_в_крупных_компаниях_t_me_it_ace_geronimus.pdf
8.7 MB
Как делать классическую ИТ-стратегию с примерами - лучший учебный материал в русскоязычном интернет (по моему мнению)

Посмотрел все источники по тому как создавать ИТ-стратегию на русском языке.

Считаю этот лучшим с точки зрения возможности применения на практике - и с точки зрения подачи материала, и примеров.

Документ правда старый: некоторые вещи уже так не делаются как по контенту (ну типа в ИТ-инфраструктуре уже другие подходы), так и по визуализации. Но это все можно найти в других источниках. А с точки зрения «как делать калссическую ИТ-стратегию» прямо нравится.

P.S. Под «классической» ИТ-стратегией понимаю стратегию от целей бизнеса, а не когда мы помогаем сформулировать цели бизнеса с помощью ИТ.

#практика #итстратегия #кейс #геронимус #лучшее
via @it_ace

💬 Комментировать
OFFTOPIC: ИМХО просто отличная книга по личной эффективности.

https://www.litres.ru/bred-stalberg/na-pike/
С праздником всех причастных!
Всем привет! Пока готовиться обзор очередной статьи, сделаю анонс моей лекции, вдруг кому то будет интересно

https://mba.mgimo.ru/announce/afanasev
Lakehouse: A New Generation of Open Platforms that Unify Data Warehousing and Advanced Analytics

Интересная статья от сотрудников компании Databricks, которые предлагаю новую концепцию организации хранения и обработки данных, которую называют Likehouse.

Идея вот в чем: доминирующая на рынке концепция DataLake (для хранения) + DHW (для обработки) несмотря на свой шаг вперед относительно концепции чистого DWH все еще обладает рядом недостатков и требует компромисса между надежность, стоимостью и возможностями аналитики (что начинает быть довольно важным фактором). Поэтому вместо того, что бы разнести хранение и обработку данных в разные системы и организовать перемещение данных между ними (все равно сохраняется элемент ETL), Databricks предлагает совместить все функции в виде:

1. Слоя хранения данных на базе S3/HDFS, но хранить данные в структурированном формате Parquet
2. Слоя мета данных, описывающим данные, отвечающем за индексирование, кэш и тд
3. Слоя доступа к данным в виде API в системам BI и фреймворка обработки данных таким как Tensorflow/Pandas и тд

За счет такой комбинации предлагается не только обеспечить оптимальное TCO, но и сохранить основные качества ACID системы и SQL-like скорость работы (через метаданные, кэш и тд)

Исходная статья ниже
Близится наступление знакового события в области управления данными - вручение премии CDO Awards 21. Уже сформирован полный перечень номинанотов и подготовлены обзоры/интерью про заявленные проекты.

Часть из них я отмечал в постах выше, а полный перечень и все интервью представленны тут: https://www.osp.ru/lp/cdoaward2021#nominees
Поздравляю всех причастных с праздником!
2021-AI-Index-Report_Master.pdf
13.8 MB
Вышел свежий отчет от Stanford - 2021 AI INDEX REPORT
Внимание, 222 страницы!
Forwarded from AI Meetups (Николай Крупий)
19 марта, 19:00 — 21:30 МСК

Дзен-митап: алгоритмы и рекомендации. Онлайн

Зарегистрироваться
Будет #трансляция

При внедрении рекомендательных систем зачастую приходится учитывать особенности продукта. Например, гарантировать конкретной публикации определенное число показов, ограничить число показов сверху, совместить разные подборки с рекомендациями. В этих случаях для решения оптимизационных задач применяются и стандартные рекомендательные методы, и алгоритмы.

В пятницу, 19 марта, мы обсудим конкретные кейсы: как в ivi персонализируют главную страницу с помощью многоруких бандитов или как в Дзене создали систему для динамического распределения трафика. А также погрузимся в актуальные стратегии ценообразования.
После докладов повторим предновогодний опыт и разыграем десяток подарков в квесте про рекомендации.
Всем привет! Появилась запись ранее анонсированной лекции.

IT для бизнеса в постиндустриальную эпоху https://youtu.be/IkUvEk6GXOs
Беглый просмотр книги показал ее интересность в плане содержания. Похоже хорошее самари текущего положения вещей в области AGI, обзор основных методов и подходов изложенный понятным языком.