Machine Learning | Нейронные сети, ИИ, Big Data
7.72K subscribers
626 photos
48 videos
14 files
733 links
Всё о Machine Learning простым языком.

Сотрудничество: @max_excel
Download Telegram
🗯 Ускорение роста бизнеса с помощью обработки естественного языка

Обработка естественного языка (NLP) — это поддисциплина в рамках искусственного интеллекта (ИИ), которая позволяет синтезировать и анализировать речь и текст, и при этом вооружает компьютеры способностью понимать и общаться с людьми и другими машинами.

Сегодня НЛП широко используется предприятиями в разных отраслях в нескольких формах. На самом деле, согласно недавнему исследованию, к 2026 году ожидается, что размер мирового рынка НЛП достигнет 35,1 миллиарда долларов.

Machine Learning
💁‍♂️ Математика для машинного обучения

Если вам когда-нибудь понадобится освежить в памяти математику для машинного обучения, мы составили список литературы, которой регулярно пользуемся.

Machine Learning
👨‍💻 Чего ИИ не может

Искусственный интеллект может выполнять многие задачи лучше, чем люди, практически без затрат. Этот простой факт может создать огромную экономическую ценность, но также и вызвать беспрецедентное сокращение рабочих мест — волну разрушения, которая затронет как «синих», так и «белых воротничков».

В будущем ИИ будет делать все: от выдачи наших кредитов до строительства наших домов и даже найма и увольнения. Такая трансформация способов выполнения работы не только приведет к серьезной безработице, но и потенциально вызовет множество социальных проблем.

Machine Learning
🎣 CORL: Библиотека автономного обучения с подкреплением

Offline RL — это новая парадигма, которая делает RL похожим на обучение с учителем, что делает его более применимым к реальным проблемам. Существует целая куча недавно разработанных алгоритмов Offline RL, однако надежных реализаций с открытым исходным кодом для таких алгоритмов не так много.

Machine Learning
🗞 Бесплатный ML University от Amazon

Компания предоставляет любому, в любом месте и в любое время доступ к тем же курсам машинного обучения, которые используются для обучения собственных разработчиков Amazon машинному обучению.

Machine Learning
This media is not supported in your browser
VIEW IN TELEGRAM
Знакомство с Галактикой

Большая языковая модель для науки. Может обобщать академическую литературу, решать математические задачи, создавать статьи для Wiki, писать научный код, аннотировать молекулы и белки и многое другое.

Machine Learning
🎭 Преимущества периферийного зрения для машин

Исследователи находят сходство между тем, как некоторые системы компьютерного зрения обрабатывают изображения, и тем, как люди видят краем глаза.

Исследования Массачусетского технологического института показывают, что определенный тип надежной модели компьютерного зрения воспринимает визуальные представления так же, как люди делают это с помощью периферийного зрения.

Machine Learning
📔 15 бесплатных книг по машинному обучению и глубокому обучению

Если вы хотите сделать карьеру в области машинного обучения или стать специалистом по данным, который хочет перейти в мир машинного обучения, приведен список БЕСПЛАТНЫХ электронных книг, которые помогут вам в этом.

Machine Learning
🏄 Perceiver IO: a scalable, fully-attentional model that works on any modality

Стала доступна мультимодальная модель на huggingface.

Machine Learning
📑 Как создавать качественные ML-системы

Для создания качественных проектов машинного обучения нужно воспринимать их именно как систему, обращать внимание на все ее компоненты и их взаимосвязи. К этому учеба не готовит, поэтому стоит сразу определить для себя алгоритм работы с ML-проектами. В статьях узнаете о важности планирования и ведения документации, жизненном цикле, Data-centric ИИ, данных для обучения, разметке и очистке, синтетических данных и еще немного о Data Engineering и ETL.

Часть 1: каждый проект должен начинаться с плана
Часть 2: приручаем хаос

Machine Learning
⌨️ Как маленькая нейроязыковая модель в Клавиатуре победила серверные подсказки

Статья о том, как разработчики Яндекса создали новую нейроязыковую модель для своей Клавиатуры и отказались от n-граммной.

Попутно объяснили, почему пословной языковой модели может не хватать и требуется так же побуквенная, а ещё описали архитектуру нейросетевой модели весом менее 20 МБ, которая работает на устройстве локально.

Machine Learning
🤖 Как искусственный интеллект меняет будущее: обзор конференции OpenTalks.AI 2023

В начале прошлой недели в Ереване проходила самая крупная русскоязычная конференция по искусственному интеллекту OpenTalksAI. На конференции было ~600 участников, ~100 спикеров и 28 сессий в рамках трех крупных секций - бизнес, разработка и наука.

Machine Learning
👨‍💻 Что такое Zero-cost fault tolerance в распределённом глубоком обучении и как его применяют в поисковике

Автор доклада делится опытом, как можно полностью инкапсулировать от ML-щика и исследователя заботу о fault tolerance, распределённой транзакционной записи в storage, асинхронности и минимизации простоев GPU. Дать возможность пользователю автоматически масштабироваться и вообще не думать об инфраструктурных вопросах.

Алексей Морозов, руководитель группы модернизации нейронных сетей в Яндекс Поиске, расскажет об этом на большой конференции Practical ML Conf 7 сентября. На ней будут технические доклады от инженеров, максимум пользы и знаний о практическом применении ML.

Регистрация вот здесь.

Machine Learning
YandexGPT 2: и швец, и жнец, и на дуде игрец

На Practical ML Conf Яндекс анонсировал обновленную версию своей нейронной сети. Теперь Yandex GPT 2 лучше умеет шутить, придумывать рифмы, писать тексты в разных жанрах и работать с несколькими условиями в одном запросе.

Проверить Yandex GPT 2 в действии можно уже сейчас в "Давай придумаем" с Алисой
Инструменты для MLOps: выбираем между вендорскими и Open Source-решениями

MLOps применяет DevOps для автоматизации конвейеров ML в производстве. Существует много инструментов, как проприетарных, так и Open Source. Мы сравним их подходы в этой статье.

Machine Learning
✍️ Как сократить потребление оперативной памяти нейросети в 5 раз: рассказываем о генерации субтитров в Яндекс Браузере

Сейчас нейросеть из браузера может создавать субтитры буквально к любым русскоязычным видео в интернете: от видеохостингов и социальных сетей до страниц телеканалов и загруженных в облачные хранилища роликов.

Но перед этим нужно было решить важную задачу: уменьшить потребление оперативной памяти нейросетью в разы и встроить её в браузер. Оптимизация буферов (450+ Мб) и моделей (200+ Мб) позволили дойти отметки в 150 Мб. Ещё удалось значительно уменьшить место на диске, которое занимала модель, не потеряв в качестве по сравнению с серверным решением.

За основу взята архитектура VGGTransformer. Нейросеть обучили на блочное применение: предсказание работает с помощью скользящего окна длиной 5 секунд со сдвигом 600 мс.

Подробнее о разработке — в статье на Хабре.

Machine Learning
🙀 Стоит ли бояться искусственного интеллекта?

Джон Леннокс затронул критические вопросы, связанные с искусственным интеллектом, и то, как будущее искусственного интеллекта влияет на христианское видение реальности.

Machine Learning
🔎 Яндекс выпустил датасет с 500 тыс. русскоязычных отзывов на организации

С помощью датасета можно производить, например, лингвистический анализ и анализ тональности текста. Датасет опубликован на Гитхабе. Также читайте подробную статью от разработчиков на Хабре.

Machine Learning
🪩 Идём на онлайн ML Party — 25 октября Яндекс организовывает митап для ML-специалистов.

Будут вещать про алгоритм обучения генеративных моделей с подкреплением, проект на стыке технологий ML и ecom-продукта, нейросетевую генерацию объявлений и этапы задачи матчинга предложений на товары.

На событии прозвучат три технических доклада от Фёдора Лебедя, разработчика отдела NLP группы YandexGPT Alignment, Максима Мачула, руководителя службы качества контента в Поиске по товарам, и Алексея Березникера, руководителя команды генерации рекламы.
Чтобы получить ссылку на трансляцию, нужно зарегистрироваться.

Machine Learning
This media is not supported in your browser
VIEW IN TELEGRAM
О создании детализированных Яндекс Карт: как в приложении появилась разметка, что такое «растишка» и зачем команде сервиса астроном

В этом выпуске подкаста Yet Another Podcast гости рассказывают, что такое высокодетализированные карты, как для их создания использовались нейросети и Unity, а также отвечают на распространенные вопросы пользователей.

Machine Learning
🙌 В Петербурге открылось образовательное пространство ШАДа

У Школы анализа данных Яндекса появилась новая площадка в офлайне — помимо основной программы занятий для студентов, тут начнут делиться экспертизой c ML-комьюнити. В планах — открытые лектории, интенсивы и воркшопы от экспертов Яндекса и ведущих преподавателей Школы. Можно будет участвовать в соревнованиях по ML и алгоритмам, а также работать вместе с ШАДовцами над учебными проектами в области DS, инфраструктуры больших данных и ИИ в прикладных науках.

Machine Learning