Кейсы на производстве реализовывать особенно сложно, поэтому очень классно что их появляется все больше.
https://www.computerworld.ru/cio/news/260421-NLMK-vnedril-servis-prediktivnoy-analitiki-dlya-izmereniya-temperatury-stali?fbclid=IwAR1dgbUukS4T9w73Ep0xtylhGLojawMhuXhADIcxfrzeyIn4dm8YZS-m5QE
https://www.computerworld.ru/cio/news/260421-NLMK-vnedril-servis-prediktivnoy-analitiki-dlya-izmereniya-temperatury-stali?fbclid=IwAR1dgbUukS4T9w73Ep0xtylhGLojawMhuXhADIcxfrzeyIn4dm8YZS-m5QE
Вестник цифровой трансформации | «Директор информационной службы»
НЛМК внедрил сервис предиктивной аналитики для измерения температуры стали
Группа НЛМК запустила цифровой сервис предиктивной аналитики, который помог повысить эффективность производства стали на заводах НЛМК-Калуга и НЛМК-Урал. Решение разработано Accenture.
Буквально сейчас, в 11-00 начнется онлайн встреча с Simon Brawn, автором книги "Чистая архитектура" (делал обзор выше) - мега книга по разработке ПО, на тему "Как на самом деле работают команды в проектировании архитектуры."
Оказывается трансляция будет общедоступной, ниже по ссылке. Очень рекомендую.
https://www.youtube.com/watch?v=_vqAAJ8mY3w
Оказывается трансляция будет общедоступной, ниже по ссылке. Очень рекомендую.
https://www.youtube.com/watch?v=_vqAAJ8mY3w
YouTube
Как на самом деле работают команды в проектировании архитектуры.
Английскую версию трансляции смотрите : https://youtu.be/VMsl2xg5wBQ
Что-то накопилось статей, никак не разберу. поэтому попробую поделиться просто интересными и релевантными, даже если не успеваю сделать краткий обзор.
Вот, например, интересные изменения законодательства по работе с персональными данными. Надо быть начеку!
https://habr.com/ru/company/leader-id/blog/553526/
Вот, например, интересные изменения законодательства по работе с персональными данными. Надо быть начеку!
https://habr.com/ru/company/leader-id/blog/553526/
Хабр
Теперь персональные данные должны удалять отовсюду по первому требованию, но есть побочка
Речь идет о поправках к закону о персональных данных, что вступили в силу в марте. Теперь любые персональные данные обязаны убрать откуда угодно по первому требованию их владельца. Причем владельцу не...
И еще из отложенного:
На хабре в блоге Александр Еськов Sistemaalex опубликован цикл статей на тему управления данными:
1. Таксономия форматов времени и дат в неочищенных данных, 2012 г.
2. Очистка данных: проблемы и современные подходы 2000 г.
3. Таксономия «грязных данных» 2003 г.
4. Проблемы, методы и вызовы комплексной очистки данных 2003 г.
5. Формульное определение проблем качества данных 2005 г.
6. Обзор инструментов качества данных 2005 г.
На хабре в блоге Александр Еськов Sistemaalex опубликован цикл статей на тему управления данными:
1. Таксономия форматов времени и дат в неочищенных данных, 2012 г.
2. Очистка данных: проблемы и современные подходы 2000 г.
3. Таксономия «грязных данных» 2003 г.
4. Проблемы, методы и вызовы комплексной очистки данных 2003 г.
5. Формульное определение проблем качества данных 2005 г.
6. Обзор инструментов качества данных 2005 г.
Habr
Александр Еськов aka Sistemaalex - Специалист on Habr
Александр Еськов aka Sistemaalex.
И еще из накопившегося: статья про использование data build tool в Wheely.
Кстати, DBT довольно интересный и набирающий популярность инструмент для упралвения DWH, достойный отдельного изучения. А в статье описывается как этот инструмент позволяет орагнизовать работу с большим количеством структур данных в Wheely.
https://m.habr.com/ru/company/wheely/blog/549614/
Кстати, DBT довольно интересный и набирающий популярность инструмент для упралвения DWH, достойный отдельного изучения. А в статье описывается как этот инструмент позволяет орагнизовать работу с большим количеством структур данных в Wheely.
https://m.habr.com/ru/company/wheely/blog/549614/
Хабр
Мультитул для управления Хранилищем Данных — кейс Wheely + dbt
Уже более двух лет data build tool активно используется в компании Wheely для управления Хранилищем Данных. За это время накоплен немалый опыт, мы на тернистом пути проб и ошибок к совершенству в...
несколько базовых вещей про MLOps, для того, что бы немного погрузиться в эту тему
https://www.datasciencecentral.com/profiles/blogs/mlops-comprehensive-beginner-s-guide
https://www.datasciencecentral.com/profiles/blogs/mlops-comprehensive-beginner-s-guide
Data Science Central
MLOps: Comprehensive Beginner's Guide
MLOps, AIOps, DataOps, ModelOps, and even DLOps. Are these buzzwords hitting your newsfeed? Yes or no, it is high time to get tuned for the latest updates in AI-powered business practices. Machine Learning Model Operationalization Management (MLOps) is a…
Ранее уже упоминал статью "How to Move Beyond a Monolithic Data Lake to a Distributed Data Mesh"
https://martinfowler.com/articles/data-monolith-to-mesh.html
а тут обнаружил перевод на Хабре: https://habr.com/ru/post/495670/
https://martinfowler.com/articles/data-monolith-to-mesh.html
а тут обнаружил перевод на Хабре: https://habr.com/ru/post/495670/
martinfowler.com
How to Move Beyond a Monolithic Data Lake to a Distributed Data
Mesh
Mesh
There are problems with the centralized data lake. A future data mesh needs domains, self-service platforms, and product thinking.
Еще из залежей Хабра - статья с детальным описанием аналитического хранилища Газпромбанка, которое было разработано компанией Glowbyte.
Достаточно детально описывается архитектуры, технологический стек.
https://habr.com/ru/company/glowbyte/blog/554834/
Достаточно детально описывается архитектуры, технологический стек.
https://habr.com/ru/company/glowbyte/blog/554834/
Хабр
Как построить современное аналитическое хранилище данных на базе Cloudera Hadoop
Привет. В конце прошлого года GlowByte и Газпромбанк сделали большой совместный доклад на конференции Big Data Days, посвященный созданию современного аналитического хранилища данных на базе...
Минутка рекламы - 20 мая на конференции SmartDev 21 мы (команда SberDevices) анонсируем много новых разработок, которые выводим на рынок. В частности моя команда (технологические платформы) анонсирует сервисы
- SmartSpeech (платформа распознавания/генерации речи)
- SmartBIO (платформа биодинтификации)
- Layer (платформа распознавания в видеопотоке товаров, актеров, предметов и локаций)
- SmartHome для разработчиков (платформа умного дома с интеграцией со сторониими устройствами)
- коммуникационная платформа Jazz
А мои коллеги расскажут много интересного про виртуального асисстента Салют, сервиса CV, AR и тд
Приходите
https://smartdev21.ru
- SmartSpeech (платформа распознавания/генерации речи)
- SmartBIO (платформа биодинтификации)
- Layer (платформа распознавания в видеопотоке товаров, актеров, предметов и локаций)
- SmartHome для разработчиков (платформа умного дома с интеграцией со сторониими устройствами)
- коммуникационная платформа Jazz
А мои коллеги расскажут много интересного про виртуального асисстента Салют, сервиса CV, AR и тд
Приходите
https://smartdev21.ru
Сори, за задержку с публикациями, подготовка и проведение конференции заняли довольно много времени. Материалы в подгтовке, а пока вот запись нашего блока конференции:
https://www.youtube.com/watch?v=WxRNLjDAyv4
https://www.youtube.com/watch?v=WxRNLjDAyv4
Друзья, и еще одна корпоративная, но важная новость. Команда SberDevices сегодня открывает доступ к датасету Golos — самому большому размеченному вручную набору речевых данных на русском языке, включающему 1240 часов аудиоданных, а также обученную на них модель распознавания речи, которая показывает точность, сравнимую с человеческой.
Вы можете использовать его абсолютно открыто, мы постарались сделать максимально удобную лицензию для разработчиков в области речевых технологий.
Кроме самих данным мы так же делаем доступной обученную на них модель распознавания речи. Она обучалась с использованием мощностей суперкомпьютера «Кристофари» от Сбера на 16 видеокартах Nvidia Tesla V100 в течение 8 дней. Доступная для использования акустическая модель QuartzNet 15x5 была обучена на данных датасетов Golos и Common Voice, а языковая модель KenLM построена на Common Crawl и аннотациях Golos.
Мы надеемся, что датасет Golos даст возможность научному сообществу России двигаться ещё быстрее в совершенствовании русскоязычных речевых технологий.
https://github.com/sberdevices/golos
Вы можете использовать его абсолютно открыто, мы постарались сделать максимально удобную лицензию для разработчиков в области речевых технологий.
Кроме самих данным мы так же делаем доступной обученную на них модель распознавания речи. Она обучалась с использованием мощностей суперкомпьютера «Кристофари» от Сбера на 16 видеокартах Nvidia Tesla V100 в течение 8 дней. Доступная для использования акустическая модель QuartzNet 15x5 была обучена на данных датасетов Golos и Common Voice, а языковая модель KenLM построена на Common Crawl и аннотациях Golos.
Мы надеемся, что датасет Golos даст возможность научному сообществу России двигаться ещё быстрее в совершенствовании русскоязычных речевых технологий.
https://github.com/sberdevices/golos
dm.pdf
8 MB
MIT выпустил беспланую книгу "Algorithms for Decision Making". Очень объемное описание всей математики, лежащей под катопом систем поддержки принятия решений, прогнозирования и тп, включая даже такие темы как мультиагентные системы, соллоборативные агенты и тп.
Книжка во вложении
Книжка во вложении
technology-radar-vol-24-en.pdf
12.7 MB
Как то я вот прощелкал отличный информационный инструмент, позволяющий быть в курсе технологических трендов в ИТ, и только сейчас обратил внимание на https://www.thoughtworks.com/radar
Для таких же как я делюсь ссылкой и свежим обзором технологий.
Для таких же как я делюсь ссылкой и свежим обзором технологий.
Рекомендация книги. Хочу обратить ваше внимание на книгу Романа Зыкова, основателя компании RetailRocket, в которой отвечал за функцию работы с данными и разработке системы рекомендации. Книга совсем новая, называется "Роман с Data Science. Как монетизировать большие данные" и предназначена для думающих читателей, которые хотят попробовать свои силы в области анализа данных и создавать сервисы на их основе. Она будет вам полезна, если вы менеджер, который хочет ставить задачи аналитике и управлять ею. Если вы инвестор, с ней вам будет легче понять потенциал стартапа. Те, кто «пилит» свой стартап, найдут здесь рекомендации, как выбрать подходящие технологии и набрать команду. А начинающим специалистам книга поможет расширить кругозор и начать применять практики, о которых они раньше не задумывались, и это выделит их среди профессионалов такой непростой и изменчивой области.
https://www.piter.com/collection/all/product/roman-s-data-science-kak-monetizirovat-bolshie-dannye
https://www.piter.com/collection/all/product/roman-s-data-science-kak-monetizirovat-bolshie-dannye
www.piter.com
Роман с Data Science. Как монетизировать большие данные
Как довести проекты машинного обучения (machine learning) и искусственного интеллекта до топового уровня
Forwarded from Инжиниринг Данных (Dmitry Anoshin)
Несмотря на то, что Delta Lake ,книга выйдет в Апреле 2022, уже сейчас можно получить к ней доступ на O'Reilly
https://www.oreilly.com/library/view/delta-lake-the/9781098104580/
https://www.oreilly.com/library/view/delta-lake-the/9781098104580/
Forwarded from Data Events (Yuliya Bazarova)
Уже завтра приглашаем на Tinkoff. AI meetup!⚡️
В этот раз направим все внимание на рекомендательные системы.
Поговорим:
— об аналитике пользовательских покупок: предсказании потребностей и роли в этом машинного обучения. Расскажем каким SOTA подходам действительно можно верить.
— о персонализированном кэшбэке: как в ранжировании спецпредложений для клиента помогают наработки в области глубокого обучения и почему одних лишь сеток недостаточно для хорошей персонализации.
Соберем круглый стол экспертов из Тинькофф, Яндекса и Сбера – обсудим опыт компаний использования рекомендательных систем.
🕖Встречаемся 3 июня в 19:00 по московскому времени
Регистрация: https://l.tinkoff.ru/ai-recsys-21
В этот раз направим все внимание на рекомендательные системы.
Поговорим:
— об аналитике пользовательских покупок: предсказании потребностей и роли в этом машинного обучения. Расскажем каким SOTA подходам действительно можно верить.
— о персонализированном кэшбэке: как в ранжировании спецпредложений для клиента помогают наработки в области глубокого обучения и почему одних лишь сеток недостаточно для хорошей персонализации.
Соберем круглый стол экспертов из Тинькофф, Яндекса и Сбера – обсудим опыт компаний использования рекомендательных систем.
🕖Встречаемся 3 июня в 19:00 по московскому времени
Регистрация: https://l.tinkoff.ru/ai-recsys-21
Summary книги Чистый Agile
Наконец-то осилил добить небольшое саммари в виде цитат из Мега книги “Чистый Agile. Основы гибкости” от Роберта Мартина.
Просто must red всем, кто связан с разработкой ПО вне зависимости от роли и должности. В книге не только изложена суть того, что мы называем Agile, но и в целом о профессии разработчика ПО и о тех принципах, которым следуют настоящие профессионалы своего дела.
Для тех, у кого совсем нет времени, вот тут документ с основными цитатами: https://www.dropbox.com/s/sm91e4f71enjjxl/%D0%A7%D0%B8%D1%81%D1%82%D1%8B%D0%B9%20Agile%20summary%20short.pdf?dl=0
Для тех, кто хочет увидеть цитаты в контексте книги вот тут они с фотографиями страниц: https://www.dropbox.com/s/6h8iipmd2b69q6k/%D0%A7%D0%B8%D1%81%D1%82%D1%8B%D0%B9%20Agile%20summary.pdf?dl=0
А для тех, что хочет почитать в выходные, ссылка на саму книгу: https://www.litres.ru/robert-s-martin/chistyy-agile-osnovy-gibkosti/chitat-onlayn/
Наконец-то осилил добить небольшое саммари в виде цитат из Мега книги “Чистый Agile. Основы гибкости” от Роберта Мартина.
Просто must red всем, кто связан с разработкой ПО вне зависимости от роли и должности. В книге не только изложена суть того, что мы называем Agile, но и в целом о профессии разработчика ПО и о тех принципах, которым следуют настоящие профессионалы своего дела.
Для тех, у кого совсем нет времени, вот тут документ с основными цитатами: https://www.dropbox.com/s/sm91e4f71enjjxl/%D0%A7%D0%B8%D1%81%D1%82%D1%8B%D0%B9%20Agile%20summary%20short.pdf?dl=0
Для тех, кто хочет увидеть цитаты в контексте книги вот тут они с фотографиями страниц: https://www.dropbox.com/s/6h8iipmd2b69q6k/%D0%A7%D0%B8%D1%81%D1%82%D1%8B%D0%B9%20Agile%20summary.pdf?dl=0
А для тех, что хочет почитать в выходные, ссылка на саму книгу: https://www.litres.ru/robert-s-martin/chistyy-agile-osnovy-gibkosti/chitat-onlayn/
Dropbox
Чистый Agile summary short.pdf
Shared with Dropbox