Клуб CDO
3.06K subscribers
379 photos
24 videos
88 files
1.44K links
Сообщество профессионалов в области работы с данными и искуственным интеллектом
Download Telegram
Минутка занимательной истории

Это Pixar Image Computer 1986 года. Это было одно из первых устройств, разработанных Pixar, тогда ещё подразделением Lucasfilm. Этот компьютер был предназначен для обработки изображений высокой сложности, особенно для рендеринга графики высокого разрешения в медицинских исследованиях, геофизике и кинопроизводстве.

Pixar Image Computer использовал технологию, которая была очень продвинутой для своего времени. Он мог обрабатывать изображения с высоким разрешением, что было большим прорывом в области компьютерной графики. Однако из-за высокой цены и сложности в использовании, он не получил широкого распространения в промышленности и был коммерчески неуспешен.

Pixar впоследствии перешла от производства оборудования к созданию анимационных фильмов, что в конечном итоге привело к её огромному успеху в этой области.

Такой вот pivot
Дайджест статей

ID vs. Multimodal Recommender System: Perspective on Transfer Learning
https://dzone.com/articles/id-vs-multimodal-recommender-system-perspective-on

Разоблачаем Эффект Даннинга-Крюгера. Статистический артефакт, пример автокорреляции
https://habr.com/ru/articles/776444/

В ногу со временем: введение в многомерный анализ и OLAP-технологии
https://habr.com/ru/articles/775042/

Clickhouse, Grafana и 3000 графиков. Как построить систему быстрых дашбордов
https://habr.com/ru/companies/ozontech/articles/774712/

Искусственный интеллект в Google: от старых проектов к новым достижениям
https://habr.com/ru/companies/ru_mts/articles/775232/

Модельный риск: как увеличить эффективность работы ML моделей в большой компании
https://habr.com/ru/companies/X5Tech/articles/775424/

Обучение ИИ на синтетических данных: исследователи из MIT меняют правила игры с системой StableRep
https://habr.com/ru/companies/bothub/articles/776130/

Вредные советы: как самостоятельно внедрить DWH и потратить впустую деньги и время
https://habr.com/ru/articles/776258/

Что эффективнее — усложнять модель или увеличивать количество данных?
https://habr.com/ru/articles/776332/

Data Validation To Improve the Data Quality
https://dzone.com/articles/data-validation-to-improve-data-quality?utm_source=pocket_saves
Друзья, небольшое обновление бота "Игорь"😹️

- поставил самую свежую модель gpt-3.5-turbo-1106 (ChatGPT4 все еще довольно дорогая, но если кому то прям надо - напишите, я могу отдельно ее включить)
- закрутил гайки по монетизации, теперь если вас нет в списке пользователей, которые хотя бы раз делали donation, то бот будет отвечать раз в 5 минут, если есть - то как обычно без ограничений.

Пока статистика монетизации хромает, из всех пользователей, кто использует Игоря, донаты делают не больше 5% (хотя бы раз), так что продолжаем не забывать поддерживать проект: https://t.me/cdo_club/1562
Довольно интересный канал ведут ребята из Tinkoff:
- Youtube: https://www.youtube.com/@CodeofArchitecture
- Telegramm: https://t.me/its_reading_club

Они записывают подкасты где обсуждают профессиональный нон-фикшен. Разбирают довольно интересные книги по инженерии ПО, контента пока не очень много, но выглядит многообещающе
Хотел отдельный пост написать про этот материал, но во всех каналах уже более быстрые и менее занятые коллеги публикуют его, так что просто сделаю forward 🙂
📺 Как устроены изнутри языковые модели

Я постоянно пишу про сложные технические темы. Я осознанно не вдаваюсь в детали, но зато посты получаются более насыщенными моими инсайтами. В то же время, я с большим уважением отношусь к людям, которые могут простыми словами объяснять, как устроены сложные вещи.

Именно такой контент регулярно выпускает Andrey Karpathy — один из главных людей в OpenAI и в прошлом директор AI-направления в Tesla. Несколько дней назад у него вышло видео «Intro to Large Language Models». Там он за час рассказывает из каких основных компонентов состоят системы, как ChatGPT. Если слышали термины «инференс», «файн-тюнинг», «галлюцинации модели», но не понимаете их до конца, то рекомендую к просмотру. Видео набрало за эти дни уже пол миллиона просмотров.

Если пока нет времени, чтобы посмотреть видео целиком, то Леша из канала «Ночной Писаревский» сделал хорошую выжимку на 5 минут на VC. Этого хватит, чтобы получить первичную картину и начать лучше ориентироваться в теме.
Please open Telegram to view this post
VIEW IN TELEGRAM
Понравилось интервью Давида Яна на канале NEW HR

Много интересных мыслей про работу с командой, мотивацию, удержание, управление, стили неформального лидерства и тд. Конечно, не обошлось тут без Yva.ai, но в целом и про это решение было интересно послушать.

Особенно, кстати, на что я обратил внимание: Yva.ai это система, которая позволяет управлять оттоком сотрудников. "Отток" сотрудников в целом очень похож на тему управления оттоком клиентов, да и вообще, постоянно замечаю, что маркетинг и HR очень похоже в плане механик автоматизации по привлечению, конверсии и удержанию. Так что, Давид много говорит (и довольно грамотно) не о самом выявлении того, что сотрудник собрался менять работу, а следующем шаге - а что надо сделать, что бы он изменил свое это стремление.

Это важно, ведь решения, которые позволяют идентифицировать то, что клиент или сотрудник вас скоро покинет - бесполезны без правильно предпринятых действий по удержанию. А вот в них то и самая магия :) Выявить на основе анализа поведенческих данных то, что сотрудник уходит - не так и сложно, а вот понять почему - намного сложнее.

https://www.youtube.com/watch?v=w-XIlBr57Ys&list=WL&index=8
Прогноз погоды остается одной из самых сложных задач с момента возникновения метеорологии как науки (а не как наблюдения за высотой полета ласточек). И все знают (по сообщениям той же МЧС), что до сих пор человечество не может похвастаться тем, что сумело разработать точную мат модель предсказания движения воздушных потоков. Метеорологические службы всегда обладали одними мощными суперкомпьютерами, оперировали огромными объемами данных о наблюдениях физической природы и конечно разработка такой модели активно ведется.

В этой статье рассказывается об институте ECMWF который был создан в 1975 году. В Центре работает около 350 сотрудников, в основном назначенных из разных стран-участниц и сотрудничающих государств. На протяжении почти 50 лет учёные развивали и совершенствовали свою модель, которая сейчас является самой лучшей в мире. Год за годом, шаг за шагом они внедряли обновления и допиливали свою модель до идеального состояния.

Качество прогнозов стабильно росло на протяжении десятков лет. Например, в 1986 году модель ECMWF прогнозировала поле давления на 3-е суток с точностью 90%. Сейчас этот показатель 98-99%.

Некоторые интересные подробности и детали этой модели описываются в статье ниже: https://habr.com/ru/articles/775236/
Media is too big
VIEW IN TELEGRAM
Не могу не поздравить нашу команду #sberdevices с получением премии TAdviser “ВКС с Искусственным интеллектом» с продуктом SberJazz :)
и это только май 2023
Сегодня редакция тут в полном составе
Пара слайдов вам для презентаций и интересная книжка
Дайджест статей

Боты для «раздевания» фотографий и другие кейсы, как ИИ меняет интернет-порно
https://habr.com/ru/articles/777612/

Внутренние данные: топливо успеха в банковской индустрии, или Тайны загрузки данных, формирующих будущее инноваций
https://habr.com/ru/companies/alfa/articles/776744/

FineBI: Обработка данных для начинающих пользователей
https://habr.com/ru/companies/glowbyte/articles/776648/

Нетипичные сценарии использования BI-системы (Apache Superset)
https://habr.com/ru/companies/rostelecom/articles/772118/

The Importance of Master Data Management (MDM)
https://dzone.com/articles/the-importance-of-master-data-management-mdm?utm_source=pocket_saves

Integration of Big Data in Data Management
https://dzone.com/articles/integration-of-big-data-in-data-management?utm_source=pocket_saves

Implementing Data Lakes in Data Management
https://dzone.com/articles/implementing-data-lakes-in-data-management?utm_source=pocket_saves

The Importance of Master Data Management (MDM)
https://dzone.com/articles/the-importance-of-master-data-management-mdm?utm_source=pocket_saves
Небольшая статья на тему конфиденциальных вычислений. На мой взгляд не самая глубокая, но дает общее представление о том, что такое "защищенные анклавы", так что тем, кто хочет разобраться в этой теме - могу рекомендовать

https://habr.com/ru/companies/brave/articles/717916/