Клуб CDO
2.76K subscribers
354 photos
23 videos
84 files
1.37K links
Сообщество профессионалов в области работы с данными и искуственным интеллектом
Download Telegram
Всем привет! Хочу напомнить, что осталось буквально 5 дней на подачу заявки для участие в ежегодной премии CDO Awards (https://www.osp.ru/lp/dataaward2022), где я являюсь участником экспертного совета и вообще всеми возможными силами поддерживаю этот уникальный для Российского рынка проект.

На текущий момент из поданный заявок уже готовы материалы по 7-ми и на сайте опубликованы подробные интервью по каждому проекту (см ниже полный список со ссылками) и еще 14 находятся в работе (так что следите за обновлениями)

М.Видео-Эльдорадо: умное наполнение полок, и не только
https://cio.ru/articles/261121-MVideo-Eldorado-umnoe-napolnenie-polok-i-ne-tolko

Опасные явления: Росгидромет подскажет руководителю, что делать
https://cio.ru/articles/201221-Opasnye-yavleniya-Rosgidromet-podskazhet-rukovoditelyu-chto-delat-

«Цельс»: от неразмеченной выборки к дата-сету мечты
https://cio.ru/articles/291221-Tsels-ot-nerazmechennoy-vyborki-k-data-setu-mechty

Атлас некоммерческих организаций: «живые» НКО на карте России
https://cio.ru/articles/100122-Atlas-nekommercheskih-organizatsiy-zhivye-NKO-na-karte-Rossii

«Лаборатория Цифровой Трансформации»: строя цифровые мосты между регионами
https://cio.ru/articles/130122-Laboratoriya-Tsifrovoy-Transformatsii-stroya-tsifrovye-mosty-mezhdu-regionami

«СМАРТС»: акустический мониторинг «слышит» проблемы дорог
https://cio.ru/articles/020222-SMARTS-akusticheskiy-monitoring-slyshit-problemy-dorog

«Лобачевский» в Нижнем Новгороде: первый год на службе
https://cio.ru/articles/040222-Lobachevskiy-v-Nizhnem-Novgorode-pervyy-god-na-sluzhbe
Включил реакции кстати
Forwarded from База знаний AI
🎧 Послушать на выходных: подкаст DeepMind о значимости языковых ИИ-моделей

Авторы подкаста рассматривают язык как ключевой инструмент не только общения, но также мышления, запоминания и взаимодействия в целом. И, соответственно, смотрят на языковые модели под этим углом, задаваясь вопросом: если достаточно хорошо обучить нейросети пониманию и работе с языком, получится ли таким образом создать «сильный» искусственный интеллект. Не обходят вниманием авторы и этический аспект создания подобных ИИ-моделей.

👉🏻 Слушать подкаст: Apple Podcasts | Google Podcasts | Spotify | YouTube
Вышла новая языковая модель с открытым исходным кодом

EleutherAI на этой неделе представили свою новейшую языковую модель GPT-NeoX-20B в рамках расширения доступа к высокопроизводительному ИИ для генерации текста.

По данным EleutherAI, GPT-NeoX-20B, доступный сейчас через API, а на следующей неделе — на open source, превосходит другие общедоступные языковые модели в нескольких областях, но в целом дешевле в развертывании.

GPT-NeoX-20B разработан на инфраструктуре CoreWeave, обучен на текстовом наборе данных EleutherAI объемом 825 ГБ и содержит 20 миллиардов параметров, что примерно в 9 раз меньше, чем GPT-3 OpenAI.

В машинном обучении параметры являются частью модели, которая изучается на основе исторических данных обучения.

Вообще говоря, в языковой области корреляция между количеством параметров и сложностью сохраняется на удивление хорошо.

EleutherAI не утверждают, что GPT-NeoX-20B решает какую-либо из основных проблем, с которыми сталкиваются современные языковые модели, включая такие аспекты, как предвзятость и токсичность. Но они утверждают, что преимущества выпуска модели и других подобных ей перевешивают риски.

Обучение языковых моделей с нуля может стоить до миллионов $, а вывод (то есть фактический запуск обученной модели) является еще одним препятствий.

По одной из оценок, стоимость запуска GPT-3 на одном экземпляре Amazon Web Services составляет не менее $87 000 в год.

«От спама и астротурфинга до зависимости от чат-ботов существует явный вред, который может проявиться в результате использования этих моделей уже сегодня, и мы ожидаем, что согласование будущих моделей будет иметь решающее значение. Мы считаем, что ускорение исследований в области безопасности чрезвычайно важно», — заявил соучредитель EleutherAI
Коннор Лихи.

Предыдущие модели EleutherAI уже породили совершенно новые ИИ-стартапы. Если судить по истории, GPT-NeoX-20B сделает тоже самое.
Если кто то пропустил факт, что 17-18 февраля пройдет самая крутая ИИ конференция в России - напоминаю!

https://opentalks.ai/
Клуб CDO
Если кто то пропустил факт, что 17-18 февраля пройдет самая крутая ИИ конференция в России - напоминаю! https://opentalks.ai/
Кстати, если у кого есть желание сходить/послушать, у меня есть промо на скидку на билеты. Пишите в личку!
Microsoft и NVIDIA представили крупнейшую в мире генеративную языковую ИИ-модель с 530 миллиардами параметров

Интересная новость, не могу пройти мимо: MT-NLG имеет в 3 раза больше параметров по сравнению с существующей крупнейшей моделью такого типа и демонстрирует непревзойденную точность в широком наборе задач естественного языка, таких как:
- Предсказание завершения текста по смыслу;
- Понимание прочитанного;
- Генерация логических выводов;
- Создание заключений на естественном языке;
- Различение смысла слов с несколькими значениями.

Ну на счет "понимания" я бы поспорил. Скорее "имитация понимания". Но в целом прогресс последних языковых моделей впечатляет.

https://news.microsoft.com/ru-ru/microsoft-nvidia-megatron-turing-natural-language-generation/
Обнаружил просто фееричную книгу по алгоритмам и теории построения распределённых систем. Алгоритмы консенсуса, обработки событий, теория потоков и тд. Ничего подобного не видел на русском до этого момента.
Презентация Григория Сапунова с только что прошедшего доклада на OpenTalks.Al об основных новостях индустрии NLP

https://docs.google.com/presentation/d/1NOuZjYa-o2V9fFUUulbNtg8cj96WH8unm3_RLcl2Rv4/mobilepresent?slide=id.p
#книгамесяца Джордж Лакофф, Марк Джонсон – Метафоры, которыми мы живем

Книга, которая глубоко сформирует ваше представление о том, как работает разум.
В рамках подготовке к премии CDO Awards 2022 опубликован новый сет интервью с номинантами:

ID Collect: интеллектуальная работа с должниками
https://cio.ru/articles/180222-ID-Collect-intellektualnaya-rabota-s-dolzhnikami

X5 Group: A/B платформа — универсальный инструмент проверки бизнес-гипотез
https://cio.ru/articles/180222-X5-Group-AB-platforma--universalnyy-instrument-proverki-biznes-gipotez

Ускоренная помощь по-рязански
https://cio.ru/articles/180222-Uskorennaya-pomosch-po-ryazanski

«Пакет» от X5: стать ближе к клиентам
https://cio.ru/articles/180222-Paket-ot-X5-stat-blizhe-k-klientam
OpenTalks.AI

В четверг выступил модератором секции “Secure and Private Machine Learning” на конференции OpenTalks.AI.
Обсуждали темы Federated Learning и конфиденциальных совместных вычислений. Мне кажется было достаточно интересно, выступили коллеги из Intel Ольга Перепелкина и Patrick Foley, а так же коллеги из компании Bloomtech и банка ВТБ Петр Емельянов и Дмитрий Берестнев.

Особенное спасибо Ольге и Петру. Оля рассказывала про Federated Learning, а Петр прекрасно рассказал о конфиденциальных вычислениях. Несколько фото прикрепляю. Если спикера разрезам выложить доклады - сделаю отдельно. PS прямо перед нашей секций была секция AGI “Мотивация у человека и сильного ИИ”, которую вел Антон Колодин, лидер сообщества AGI Russia, там удалось познакомиться с Сергеем Шумским, работы которого очень уважаю, люблю и всем рекомендую и другими видными участниками сообщества.