Клуб CDO
3.07K subscribers
380 photos
24 videos
88 files
1.44K links
Сообщество профессионалов в области работы с данными и искуственным интеллектом
Download Telegram
#AI

Интересное сочетание трендов.

Шумский в своей книге "Воспитание машин: Новая история разума" на цифрах доказывает, что общая вычислительная мощность всей имеющейся вычислительной техники уже превышает вычислительную мощность мозга.

Карелин очень много пишет в последнее время про перспективы разработки ИИ на основе базисных моделей. Это сверх большие модели, типа GPT-3, BERT и тп, имеющих миллиарды параметров и обучение которых требует миллионы долларов, что под силу только технологическим гигантам. При этом эти модели выглядят хотя и убого, с точки зрения когнитивных возможностей человека, но перспективными и есть гипотеза, что дальнейшее увеличение таких моделей это один из возможных путей к AGI. Встает задача, как получить такие вычислительные мощности, что бы можно было продолжить наращивать сложность и объем базисных моделей?

Я уже писал ранее про проект Folding at Home и про то, что объединение обычных пользовательских компьютеров в единую вычислительную сеть позволило увеличь общую вычислительную мощность проекта до 470 петафлопс (по состоянию на 2019 год, если не ошибаюсь). Таким образом, проект Folding@Home можно назвать самым мощным суперкомпьютером в мире, уступающим лишь Bitcoin, мощность которого составляет 80 704 291 петафлопс. Для сравнения, первую строчку в мировом рейтинге суперкомпьютеров TOP500 занимает система «Summit» с теоретической пиковой производительностью около 200 петафлопс.

И вот попалась инверсная работа ребят из Яндекса, которые разрабатывают метод децентрализованного обучения Distributed Deep Learning in Open Collaborations, который позволяет обучать DL модели на кластере распределенных дешёвых машин. Особенностью и проблемой тут является то, что участники такой распределенной вычислительной сети довольно ненадежны в том плане, что они могут случайно подключаться и отключаться от сети вне зависимости от статуса выполнения своей задачи. Так же свои сложности вносит и разнородность/ненадежность сети между участниками и разнообразие вычислительной мощности каждого участника. Пока разработки библиотеки (что интересно, на Python) в довольно начальном состоянии, но перспективы интересные. Подробно метод описан по ссылке ниже, так же приведены ссылки на материалы, github и тд.

Как итог - продолжаю идет о том, что будущее за распределенными децентрализованными решениями. А еще у меня тут постоянно посещает идея, что мы, возможно, не правильно вообще думаем, что AGI это аналог интеллекта одного человека. Очень может быть, что он больше будет похож на социальный интеллект всего человечества в целом. Меня довольно сильно интересует не только как функционирует каждый отдельный мозг как один элемент общей мыслительной сети всей совокупности людей, но и производные свойства типа shared knowledge и тд.

https://habr.com/ru/company/yandex/blog/574466/
Дайджест статей 04/06/2022

Сегодня что то вот прям одна статья по теме из всего объема информационных потоков попалась, зато какая 🙂

Introducing the Data Product Development Canvas (Version 1.0)
https://www.datasciencecentral.com/introducing-the-data-product-development-canvas-version-1-0/
Тренды ИИ. Отберет ли искусственный интеллект работу у людей? Обзор GPT3. Татьяна Шаврина, Сбер:

Оглавление:

00:00 - Про что этот подкаст
02:57 - Когда ИИ отнимет у нас работу
07:59 - Творческие возможности ИИ
18:14 - Модель GPT-3
22:54 - Масштабирование параметров ИИ
25:46 - Копирование проектов
31:49 - Тренды ИИ
40:18 - Погружение в ИИ
43:33 - Советы от ИИ
47:42 - Где следить за трендами ИИ

https://www.youtube.com/watch?v=Jqu8KAEynuI
📣 30 марта! Форум BIG DATA&AI 2023 – центральное событие года по теме больших данных, продвинутой аналитики и искусственного интеллекта
✒️ Мастер-класс. Виталий Чугунов, Алексей Шабалин, «ЕСЛ-Софт»: «Peraspera Data Hunter — охота за данными начинается»
✒️ Охота за большими данными требует гибкости: надо вовремя и быстро найти то, что нужно именно сейчас, зачастую скомбинировав внешние данные с внутренними. При этом удовольствие пофантазировать, проверить аналитическую гипотезу выпадает не всегда. Ведущие мастер-класса для аналитиков — Виталий Чугунов, генеральный директор «ЕСЛ-Софт», и Алексей Шабалин, заместитель руководителя отдела интеграционных и системно-технических решений «ЕСЛ-Софт», продемонстрируют, как совместить в работе приятное с полезным на примере процесса выслеживания финансовых мошенников. И отчет о трофеях покажут!
💥Спешите регистрироваться »
#bigdata #bi #аналитика #AI #искусственныйинтеллект #большиеданные
​​📢 30 марта! Форум BIG DATA&AI 2023
📢 Андрей Евтихов, управляющий директор, SberDevices: Новый "цифровой мозг" компании и рывок к технологической независимости.
Как увеличить объем собираемых данных на порядок и втрое сократить стоимость владения решениями для управления данными?
Андрей Евтихов, управляющий директор, SberDevices представит опыт производителя «умных» устройств не только по созданию новых возможностей для бизнеса за счет внедрения собственной платформы данных, но и по достижению технологической независимости в экстремальных внешних условиях. Проект номинирован на премию Data Award 2023.
✒️ Спешите регистрироваться »
#bigdata #bi #аналитика #AI #искусственныйинтеллект #большиеданные #ML #BI #SberDevices #DataAward