В нашей рубрике "weekend reading" спешу поделиться очередным must read. Мономентальное исследование на тему decision making, как в отношении органических экспертов, так и в стравнении с AI. Исследование причин ошибок, логики их допущения как людьми, так и машинами. Я пока дочитал 1/3, но не могу не поделиться этой книгой уже сейчас.
https://www.litres.ru/daniel-kaneman/shum-nesovershenstvo-chelovecheskih-suzhdeniy/
https://www.litres.ru/daniel-kaneman/shum-nesovershenstvo-chelovecheskih-suzhdeniy/
ЛитРес
«Шум. Несовершенство человеческих суждений» – Даниэль Канеман | ЛитРес
Два одинаково уважаемых врача могут поставить пациенту совершенно разные диагнозы.Два одинаково честных судьи – вынести абсолютно разные вердикты по одному делу.Два одинаково опытных специалиста по п…
и еще одна полезная ссылка, смысл которой лучше всего раскрыть цитатой из нее же "В самом деле, чем шире ваш кругозор, тем больше за вашими плечами непрочитанных книг. Назовем эту коллекцию непрочитанных книг антибиблиотекой"
https://monocler.ru/antibiblioteka-umberto-eko-pochemu-neprochitannyie-knigi-vazhnee-prochitannyih/
https://monocler.ru/antibiblioteka-umberto-eko-pochemu-neprochitannyie-knigi-vazhnee-prochitannyih/
Моноклер
«Черные лебеди» Нассима Талеба и антибиблиотека Умберто Эко: как сохранять спокойствие перед лицом неопределенности
Что такое "антибиблиотека Умберто Эко", и "Черный лебедь" Нассима Николаса Талеба и как выстраивать отношения с непредсказуемым миром.
Дайджест статей 15/01/2022
Хранители данных: как устроена работа с DWH в Lamoda
https://habr.com/ru/post/595811/?utm_source=habrahabr&utm_medium=rss&utm_campaign=595811
What is Data Lineage?
https://www.castordoc.com/blog/what-is-data-lineage
Databricks launches its first industry-specific lakehouse
https://techcrunch.com/2022/01/13/databricks-launches-its-first-industry-specific-lakehouse/
The Next Evolution of the Database Sharding Architecture
https://www.infoq.com/articles/next-evolution-of-database-sharding-architecture/?utm_campaign=infoq_content&utm_source=infoq&utm_medium=feed&utm_term=global
Хранители данных: как устроена работа с DWH в Lamoda
https://habr.com/ru/post/595811/?utm_source=habrahabr&utm_medium=rss&utm_campaign=595811
What is Data Lineage?
https://www.castordoc.com/blog/what-is-data-lineage
Databricks launches its first industry-specific lakehouse
https://techcrunch.com/2022/01/13/databricks-launches-its-first-industry-specific-lakehouse/
The Next Evolution of the Database Sharding Architecture
https://www.infoq.com/articles/next-evolution-of-database-sharding-architecture/?utm_campaign=infoq_content&utm_source=infoq&utm_medium=feed&utm_term=global
Хабр
Хранители данных: как устроена работа с DWH в Lamoda
Всем привет! Меня зовут Юлия Скогорева, я системный аналитик в команде Center of excellence дирекции данных и аналитики Lamoda. Если бизнесу нужны какие-то данные для принятия важных решений, то на...
Я тут наконец-то добил перевод поста A Scalable Approach for Partially Local Federated Learning на тему федеративного машинного обучения.
Прошу лайкать, у кого есть возможность это делать на Хабре 🙂
https://habr.com/ru/post/645783/
Прошу лайкать, у кого есть возможность это делать на Хабре 🙂
https://habr.com/ru/post/645783/
Хабр
Масштабируемый подход к частично локальному федеративному обучению
Данный текст является авторским переводом поста A Scalable Approach for Partially Local Federated Learning . Примечания: Меня довольно сильно интересует тема распределенного обучения ML моделей...
Я тут немного излучил сайт на котором статья выше опубликована - оказалось прям там кладезь отличных статей на самые разные темы! Рекомендую посмотреть
https://monocler.ru/
https://monocler.ru/
Моноклер
Видеолекции и лонгриды о культуре, человеке и обществе. Психология, нейронаука и философия в статьях и переводах. Психологический анализ фильмов и разбор книг.
Интересная новость - IBM продаёт бизнес юнит Watson Health Care на 1 млрд.
Юнит так и не стал прибыльным с момента его основания в 2015 году, потратили на него около 4 млрд, а годовая выручка в последний год составила тот же 1 млрд - что говорит о мультипликаторе 1 к годовой выручке.
При этом несмотря на большой пиар этого направления везде и всюду, результаты работы этого подразделения не удовлетворяют амбициям IBM и они решили «отойти» от развития прикладного решения в область развития «платформенных» решений.
https://www.bloomberg.com/news/articles/2022-01-21/ibm-is-said-to-near-sale-of-watson-health-to-francisco-partners
Юнит так и не стал прибыльным с момента его основания в 2015 году, потратили на него около 4 млрд, а годовая выручка в последний год составила тот же 1 млрд - что говорит о мультипликаторе 1 к годовой выручке.
При этом несмотря на большой пиар этого направления везде и всюду, результаты работы этого подразделения не удовлетворяют амбициям IBM и они решили «отойти» от развития прикладного решения в область развития «платформенных» решений.
https://www.bloomberg.com/news/articles/2022-01-21/ibm-is-said-to-near-sale-of-watson-health-to-francisco-partners
Bloomberg
IBM Sells Some Watson Health Assets for More Than $1 Billion
International Business Machines Corp. agreed to sell part of its IBM Watson Health business to private equity firm Francisco Partners, scaling back the technology company’s once-lofty ambitions in health care.
Дайджест статей 22/01/22
Data Integrity: A Data-Driven Organization's Biggest Concern
https://dzone.com/articles/data-integrity
Big Data с «кремом» от LinkedIn: инструкция о том, как правильно строить архитектуру системы
https://habr.com/ru/post/646441/?utm_source=habrahabr&utm_medium=rss&utm_campaign=646441
Нейродайджест: главное из области машинного обучения за декабрь 2021
https://habr.com/ru/post/646291/?utm_source=habrahabr&utm_medium=rss&utm_campaign=646291
Машинное обучение в банковском ценообразовании. VBP
https://habr.com/ru/post/646093/?utm_source=habrahabr&utm_medium=rss&utm_campaign=646093
Data Integrity: A Data-Driven Organization's Biggest Concern
https://dzone.com/articles/data-integrity
Big Data с «кремом» от LinkedIn: инструкция о том, как правильно строить архитектуру системы
https://habr.com/ru/post/646441/?utm_source=habrahabr&utm_medium=rss&utm_campaign=646441
Нейродайджест: главное из области машинного обучения за декабрь 2021
https://habr.com/ru/post/646291/?utm_source=habrahabr&utm_medium=rss&utm_campaign=646291
Машинное обучение в банковском ценообразовании. VBP
https://habr.com/ru/post/646093/?utm_source=habrahabr&utm_medium=rss&utm_campaign=646093
DZone
Data Integrity: A Data-Driven Organization's Biggest Concern
Although many organizations have implemented a system for data collection and analysis, it's crucial that they can also maintain the integrity of their data.
В блоге Gartner обратил внимание на пост The Gartner 2022 Leadership Vision for Data and Analytics Leaders Questions and Answers
по сути это воросы/ответы после проведенного Gartner webinar, все переводить смысла нет, но несколько утверждений показалост мне интересными:
- синтетические данные для AI - за этим будущее
- data mesh vs. data fabric - что выбирать, должна решать data team
- on-Premise / on-Cloud - это должна решать security team
- почему CDO живут 2 года? - вообще CDO "от бизнеса" более эффективны, чем "CDO от технологий". Очень хорошие CDO имеют шансы стать CEO. А что бы "прожить" как CDO больше 2-х лет, смотрите наш webinar 🙂
https://blogs.gartner.com/andrew_white/2022/01/09/the-gartner-2022-leadership-vision-for-data-analytics-leaders-qa/
по сути это воросы/ответы после проведенного Gartner webinar, все переводить смысла нет, но несколько утверждений показалост мне интересными:
- синтетические данные для AI - за этим будущее
- data mesh vs. data fabric - что выбирать, должна решать data team
- on-Premise / on-Cloud - это должна решать security team
- почему CDO живут 2 года? - вообще CDO "от бизнеса" более эффективны, чем "CDO от технологий". Очень хорошие CDO имеют шансы стать CEO. А что бы "прожить" как CDO больше 2-х лет, смотрите наш webinar 🙂
https://blogs.gartner.com/andrew_white/2022/01/09/the-gartner-2022-leadership-vision-for-data-analytics-leaders-qa/
Gartner
Gartner: Fueling the Future of Business
The Gartner 2022 Leadership Vision for Data and Analytics Leaders Questions and Answers
Всем привет! Накидал тут небольшой материал про Data Fabric, попробовал описать самые сутевые моменты концепции.
https://habr.com/ru/post/647379/
https://habr.com/ru/post/647379/
Хабр
Data Fabric — основы концепций и ключевые различия с Data Mesh и Data Lake
Добрался тут изучить ряд статей на тему Data Fabric, последнее время довольно много публикуется материала на эту тему: как про Data Fabric в целом, так и сравнения этого подхода с такими модными...
Дайджест статей 29/01/22
A new era for data: What’s possible with as-a-service
https://www.technologyreview.com/2022/01/24/1043945/a-new-era-for-data-whats-possible-with-as-a-service/
CDO Challenge: Providing Clear “Line of Sight” from Data to Value
https://www.datasciencecentral.com/cdo-challenge-providing-clear-line-of-sight-from-data-to-value/
Notable enterprise data trendsetters, 2002 – 2022
https://www.datasciencecentral.com/notable-enterprise-data-trendsetters-2002-2022/
Intelligent Data as a Service (iDaaS) - Example Data Architecture
https://dzone.com/articles/intelligent-data-as-a-service-idaas-example-data-a
A new era for data: What’s possible with as-a-service
https://www.technologyreview.com/2022/01/24/1043945/a-new-era-for-data-whats-possible-with-as-a-service/
CDO Challenge: Providing Clear “Line of Sight” from Data to Value
https://www.datasciencecentral.com/cdo-challenge-providing-clear-line-of-sight-from-data-to-value/
Notable enterprise data trendsetters, 2002 – 2022
https://www.datasciencecentral.com/notable-enterprise-data-trendsetters-2002-2022/
Intelligent Data as a Service (iDaaS) - Example Data Architecture
https://dzone.com/articles/intelligent-data-as-a-service-idaas-example-data-a
MIT Technology Review
A new era for data: What’s possible with as-a-service
Organizations can find value by shifting to a subscription model for storing, managing, securing, and deriving insights from data.
Google опубилковал обзор основных трендов в ML за 2021 (который прошлый) год
https://russia.googleblog.com/2022/01/google-2021.html
https://russia.googleblog.com/2022/01/google-2021.html
Официальный блог Google Россия
Исследование Google: тренды машинного обучения 2021
Джефф Дин, старший научный сотрудник и вице-президент Google Research За последние несколько десятилетий я стал свидетелем больших изменений...
Meta AI releases “data2vec”, a self-supervised algorithm that works for speech, vision, and text
https://analyticsindiamag.com/meta-ai-releases-data2vec-a-self-supervised-algorithm-that-works-for-speech-vision-and-text/
https://analyticsindiamag.com/meta-ai-releases-data2vec-a-self-supervised-algorithm-that-works-for-speech-vision-and-text/
Analyticsindiamag
Meta AI releases “data2vec”, a self-supervised algorithm that works for speech, vision, and text – AIM
They have applied it separately to speech, text and images where it outperformed the previous best single-purpose algorithms for computer vision and speech.
Forwarded from Инжиниринг Данных (Dmitry Anoshin)
Мы уже слышали про Lake House архитектуру и open source решения в этой области:
- delta lake for spark
- apache hudi
- apache iceberg
Не все используют Databricks, поэтому интересно смотреть как другие компании строят ACID friendly data lake.
https://blogs.halodoc.io/lake-house-architecture-halodoc-data-platform-2-0/amp/
- delta lake for spark
- apache hudi
- apache iceberg
Не все используют Databricks, поэтому интересно смотреть как другие компании строят ACID friendly data lake.
https://blogs.halodoc.io/lake-house-architecture-halodoc-data-platform-2-0/amp/