Клуб CDO
3.05K subscribers
379 photos
24 videos
88 files
1.43K links
Сообщество профессионалов в области работы с данными и искуственным интеллектом
Download Telegram
Интересно, что это такое :)
Forwarded from GoPractice!
Встречайте «Симулятор управления ML/AI-проектами»

Долгое время основные вызовы в применении ML-технологий лежали в инженерной и научной плоскостях.

Развитие технологий привело к тому, что сейчас эти вызовы стремительно смещаются в плоскость продуктовую.

Все чаще вопрос оказывается не в том, как что-то реализовать, а в том, где есть возможности для применения ML-технологий: создадут ли они ценность, принесет ли это выгоду бизнесу, как организовать разработку и довести проект до успешного внедрения.

Все это создает спрос на специалистов, которые способны увидеть возможности для применения машинного обучения и реализовать ML-проект. Уже сейчас зарплата, например, ML/AI-продакта превышает доход обычного продакт-менеджера на 20–40%.

Как стать таким специалистом?

Эту задачу и призван решить наш новый «Симулятор управления ML/AI-проектами».

Почему мы создали симулятор

Представления большинства нетехнических специалистов про ML находятся в одной из двух крайностей:

🪄 Одни видят ML/AI как магию, которая позволяет сделать все, что угодно. Надо лишь поставить задачу разработчикам;

⚙️ Другие же считают, что ML — это что-то очень сложное, глубоко техническое и недоступное.

Такая ситуация возникает по той причине, что человеку со стороны бизнеса достаточно сложно разобраться в ML.

Но на самом деле, если десять лет назад глубокое понимание математики и программирования было необходимым знанием для погружения в ML-индустрию, то на текущем этапе развития алгоритмы и модели стали уже общедоступными.

На этом фоне ключевая ценность работы с ML смещается в способность увидеть возможность для применения машинного обучения, а потом адаптировать существующие алгоритмы и технологии для конкретной прикладной задачи.

Но научиться управлять ML-проектами можно только на практике. А для того чтобы менеджеру доверили такой проект, нужен опыт. Замкнутый круг.

«Симулятор управления ML/AI-проектами» нацелен на то, чтобы разорвать этот круг и дать необходимые навыки и опыт для работы менеджеров ML-проектов.

Чему учит симулятор

🔦 Видеть, где машинное обучение может принести пользу бизнесу;

🤖 Создавать продукты на основе технологий машинного обучения;

🏗 Строить процесс создания и внедрения ML-решений, предотвращать типичные ошибки и проблемы заранее;

💵 Организовать работу над ML-проектами так, чтобы они приносили пользу бизнесу.

Как устроено обучение в симуляторе

Как и в других симуляторах GoPractice, вы погружаетесь в интерактивную историю, в которой вам предстоит помочь компании выбраться из кризиса и стать лидером рынка.

Вы будете учиться, принимать решения, ошибаться, анализировать ошибки, находить новые пути, тестировать и внедрять ML-модели и в конце концов достигать успеха.

Обучение в симуляторе построено вокруг работы над тремя проектами, каждый из которых научит вас решать распространенную ML-задачу:

👓 Задача на основе компьютерного зрения (computer vision);

📊 Прогнозирование продаж;

💡 Создание рекомендательной системы.

Этот симулятор — многолетний практический опыт создания ML-решений, упакованный в двухмесячную интерактивную образовательную программу.

Узнать подробнее о том, зачем продакт-менеджерам, предпринимателям и другим специалистам изучать ML, а также прочитать отзывы наших первых студентов вы можете в нашем блоге по ссылке.

Стоимость и специальное предложение

Стоимость обучения в симуляторе составит 65 900 рублей.

А для тех, кто начнет учиться до 15 мая, цена будет ниже — 59 900 рублей.

Обучение в симуляторе проходит онлайн и в своем темпе. При этом вы всегда можете задать вопрос авторам и получить от них всю необходимую поддержку.

Начать обучение можно прямо сейчас.
Новая публикация на тему Federated Learning в журнале Nature.

"A federated learning differential privacy algorithm for non-Gaussian heterogeneous data"

https://www.nature.com/articles/s41598-023-33044-y
Вот всегда меня интересовало, как же можно было сделать такую систему рекомендаций, что просто страшно ленту открывать. А вот оно оказывается как оно делается :)

Ну правда, я всегда поражался тому, что мне рекомендует Twitter. И похоже, что проблема у них в Embedding Spaces - судя по статье, они выбирают твиты для рекомендаций из "сообществ" -> те, которые вызывают наибольшую реакцию и хайп. Ну и тогда понятно почему ко мне лезет в ленту какая то жесть, вместо полезных статей про управления данными :)

Интересная инфа про нагрузку: "Вышеописанный пайплайн работает примерно 5 миллиардов раз в день и выполняется в среднем за 1,5 секунды. При этом один запуск пайплайна требует 220 секунд времени CPU — почти в 150 раз больше, чем задержка, которую вы видите в приложении."

https://blog.twitter.com/engineering/en_us/topics/open-source/2023/twitter-recommendation-algorithm
Kupriyanov_AD16.pptx
7.4 MB
Отличная презентация про использование ChatGPT для аналитика, рассказавающая о подходах prompt engineering. Все таки мощная штука!
О, интересно. В рамках минорного изменения версии Dota 2 на 7.33 вышел огромный мажорный апдейт, в корне все меняющий в стратегии игры :) годы изучения надо начинать сначала :)))

https://www.dota2.com/newfrontiers
На одной из встреч со своими коллегами опять вспомнили про тему личной эффективности и я обещал поделиться литературой и материалами для изучения. Сел делать подборку и набрел на хорошее саммари книги Максима Дорофеева "Джедайские техники"

Делюсь со всеми: https://lifehacker.ru/dzhedajskie-tehniki/
Дайджест статей

Data Mesh — A Data Movement and Processing Platform @ Netflix
https://netflixtechblog.com/data-mesh-a-data-movement-and-processing-platform-netflix-1288bcab2873


Массивный курс по управлению данными и обзор новинок от NVIDIA. Дайджест полезных текстов про ML и дата-аналитику
https://habr.com/ru/companies/selectel/articles/730664/?utm_source=habrahabr&utm_medium=rss&utm_campaign=730664


Инфраструктура открытых данных для ИИ — кто и зачем её разрабатывает
https://habr.com/ru/companies/vasexperts/articles/729922/


DataHub: репозитории данных коммерческого типа. Как зарабатывать на доступе к данным?
https://habr.com/ru/articles/730638/?utm_source=habrahabr&utm_medium=rss&utm_campaign=730638


Lambda Architecture: A Powerful Approach to Data Engineering
https://dzone.com/articles/lambda-architecture-a-powerful-approach-to-data-en


Prompt Engineering: Unlocking the Power of Generative AI Models
https://dzone.com/articles/prompt-engineering-unlocking-the-power-of-generati


Demystifying Data Fabric Architecture: A Comprehensive Overview
https://dzone.com/articles/demystifying-data-fabric-architecture-a-comprehens


Why It’s Important to Change Misconceptions About Data Warehouse Technology
https://www.datasciencecentral.com/why-its-important-to-change-misconceptions-about-data-warehouse-technology/


Big Data в облаках
https://habr.com/ru/companies/glowbyte/articles/729868/


Жизненный цикл конфиденциальной информации в кругу централизованных сервисов
https://habr.com/ru/articles/729450/
Forwarded from Innovation & Research
Рынок больших данных в России достигнет 319 млрд руб. до конца 2024 года

Ассоциация больших данных при участии SberData подготовила стратегию развития рынка больших данных в России. Она поможет обеспечить рост рынка больших данных до 319 млрд руб. к концу 2024 г. и направлена на достижение трех ключевых целей:

• Создание качественной деловой среды для бизнеса
• Поддержку технологической независимости государства
• Повышение качества жизни граждан

Согласно базовому прогнозу стратегии, до 2024 г. в отрасли будет создано 32 тыс. новых высококвалифицированных рабочих мест, доля российских ИТ-решений в технологических стеках компаний достигнет 85%, а компании смогут заработать почти 1 трлн рублей дополнительной операционной прибыли от внедрения новых продуктов и технологий на основе больших данных.

Ожидается рост рынка ИТ-консалтинга в области больших данных (до 107 млрд руб. к 2024 г.) и технологических инструментов (до 60 млрд руб.) за счет увеличения спроса на российские программные решения.

Среди продуктов и сервисов на основе данных быстрее всего будут расти прикладные сервисы с использованием ИИ – рост на 162% до 44 млрд руб.

#Data #Сбер

https://data-economy.ru/news/tpost/zehe76bh81-first-russian-data-forum-rinok-bolshih-d
Сегодня анонс GigaChat, которым наша команда в СберДевайсах занимается уже несколько месяцев.

Можно присылать заявки на тестирование и пробовать.

Если какие то вопросы возникают - пиши в комментарии или мне, постараюсь помочь
Forwarded from Сбер
This media is not supported in your browser
VIEW IN TELEGRAM
Салют, GigaСhat!🚀

Мы первыми из российских техногигантов вступаем в гонку мировых лидеров в области AI и запускаем собственную версию мультимодальной нейросети, которая на первом этапе будет доступна в режиме тестирования по приглашениям.

В отличие от ChatGPT, она изначально уже поддерживает мультимодальное взаимодействие и более грамотно общается на русском языке.

Ну и множество уже привычных задач умеет решать: поддерживать беседу, писать тексты, выполнять инструкции, отвечать на фактологические вопросы.

Сейчас GigaСhat работает в режиме бета-версии. Чтобы оказаться в числе первых, кто протестирует новую нейросеть, подписывайтесь на наш закрытый телеграм-канал. Подписчики канала первые получат доступ к нейросети.

@sberbank
Please open Telegram to view this post
VIEW IN TELEGRAM
На прошлой неделе принимал участие в конференции First Russian Data Forum в секции "Будущее обработки данных". Очень интересная получилась секция, хочу тут оставить несколько комментариев и поделиться несколькими интересными слайдами, а следом выложу еще пару презентаций.

Хотел бы отметить выступление Максима Григорьева (АФТ), который поделился основными трендами и отметил переход к установлению взаимодействия между компаниями по совместной работе с данными.

Далее был очень интересный доклад Алексея Неймана (АБД), презентацию к которому я выложу (с разрешения Алексея) ниже отдельным постом. АБД очень системно прорабатывает тему обмена данными и коллеги поделились результатами интересных экспериментов, а так же систематизацией рисков и барьеров.

Далее Сергей Карпович из ВТБ рассказал об опыте работы с решениями IntelSGX и о том, что после ухода Intel они вместе с МФТИ работают над проектом программной реализации защищенных анклавов, вместо использования чисто аппаратных решений от других производителей.
Нейман А. АОД_New.pdf
824.6 KB
Презентация Алексея Неймана из Ассоциации Больших Данных