🗯 Ускорение роста бизнеса с помощью обработки естественного языка
Обработка естественного языка (NLP) — это поддисциплина в рамках искусственного интеллекта (ИИ), которая позволяет синтезировать и анализировать речь и текст, и при этом вооружает компьютеры способностью понимать и общаться с людьми и другими машинами.
Сегодня НЛП широко используется предприятиями в разных отраслях в нескольких формах. На самом деле, согласно недавнему исследованию, к 2026 году ожидается, что размер мирового рынка НЛП достигнет 35,1 миллиарда долларов.
Machine Learning
Обработка естественного языка (NLP) — это поддисциплина в рамках искусственного интеллекта (ИИ), которая позволяет синтезировать и анализировать речь и текст, и при этом вооружает компьютеры способностью понимать и общаться с людьми и другими машинами.
Сегодня НЛП широко используется предприятиями в разных отраслях в нескольких формах. На самом деле, согласно недавнему исследованию, к 2026 году ожидается, что размер мирового рынка НЛП достигнет 35,1 миллиарда долларов.
Machine Learning
💁♂️ Математика для машинного обучения
Если вам когда-нибудь понадобится освежить в памяти математику для машинного обучения, мы составили список литературы, которой регулярно пользуемся.
Machine Learning
Если вам когда-нибудь понадобится освежить в памяти математику для машинного обучения, мы составили список литературы, которой регулярно пользуемся.
Machine Learning
👨💻 Чего ИИ не может
Искусственный интеллект может выполнять многие задачи лучше, чем люди, практически без затрат. Этот простой факт может создать огромную экономическую ценность, но также и вызвать беспрецедентное сокращение рабочих мест — волну разрушения, которая затронет как «синих», так и «белых воротничков».
В будущем ИИ будет делать все: от выдачи наших кредитов до строительства наших домов и даже найма и увольнения. Такая трансформация способов выполнения работы не только приведет к серьезной безработице, но и потенциально вызовет множество социальных проблем.
Machine Learning
Искусственный интеллект может выполнять многие задачи лучше, чем люди, практически без затрат. Этот простой факт может создать огромную экономическую ценность, но также и вызвать беспрецедентное сокращение рабочих мест — волну разрушения, которая затронет как «синих», так и «белых воротничков».
В будущем ИИ будет делать все: от выдачи наших кредитов до строительства наших домов и даже найма и увольнения. Такая трансформация способов выполнения работы не только приведет к серьезной безработице, но и потенциально вызовет множество социальных проблем.
Machine Learning
🎣 CORL: Библиотека автономного обучения с подкреплением
Offline RL — это новая парадигма, которая делает RL похожим на обучение с учителем, что делает его более применимым к реальным проблемам. Существует целая куча недавно разработанных алгоритмов Offline RL, однако надежных реализаций с открытым исходным кодом для таких алгоритмов не так много.
Machine Learning
Offline RL — это новая парадигма, которая делает RL похожим на обучение с учителем, что делает его более применимым к реальным проблемам. Существует целая куча недавно разработанных алгоритмов Offline RL, однако надежных реализаций с открытым исходным кодом для таких алгоритмов не так много.
Machine Learning
🗞 Бесплатный ML University от Amazon
Компания предоставляет любому, в любом месте и в любое время доступ к тем же курсам машинного обучения, которые используются для обучения собственных разработчиков Amazon машинному обучению.
Machine Learning
Компания предоставляет любому, в любом месте и в любое время доступ к тем же курсам машинного обучения, которые используются для обучения собственных разработчиков Amazon машинному обучению.
Machine Learning
This media is not supported in your browser
VIEW IN TELEGRAM
Знакомство с Галактикой
Большая языковая модель для науки. Может обобщать академическую литературу, решать математические задачи, создавать статьи для Wiki, писать научный код, аннотировать молекулы и белки и многое другое.
Machine Learning
Большая языковая модель для науки. Может обобщать академическую литературу, решать математические задачи, создавать статьи для Wiki, писать научный код, аннотировать молекулы и белки и многое другое.
Machine Learning
🎭 Преимущества периферийного зрения для машин
Исследователи находят сходство между тем, как некоторые системы компьютерного зрения обрабатывают изображения, и тем, как люди видят краем глаза.
Исследования Массачусетского технологического института показывают, что определенный тип надежной модели компьютерного зрения воспринимает визуальные представления так же, как люди делают это с помощью периферийного зрения.
Machine Learning
Исследователи находят сходство между тем, как некоторые системы компьютерного зрения обрабатывают изображения, и тем, как люди видят краем глаза.
Исследования Массачусетского технологического института показывают, что определенный тип надежной модели компьютерного зрения воспринимает визуальные представления так же, как люди делают это с помощью периферийного зрения.
Machine Learning
📔 15 бесплатных книг по машинному обучению и глубокому обучению
Если вы хотите сделать карьеру в области машинного обучения или стать специалистом по данным, который хочет перейти в мир машинного обучения, приведен список БЕСПЛАТНЫХ электронных книг, которые помогут вам в этом.
Machine Learning
Если вы хотите сделать карьеру в области машинного обучения или стать специалистом по данным, который хочет перейти в мир машинного обучения, приведен список БЕСПЛАТНЫХ электронных книг, которые помогут вам в этом.
Machine Learning
🏄 Perceiver IO: a scalable, fully-attentional model that works on any modality
Стала доступна мультимодальная модель на huggingface.
Machine Learning
Стала доступна мультимодальная модель на huggingface.
Machine Learning
📑 Как создавать качественные ML-системы
Для создания качественных проектов машинного обучения нужно воспринимать их именно как систему, обращать внимание на все ее компоненты и их взаимосвязи. К этому учеба не готовит, поэтому стоит сразу определить для себя алгоритм работы с ML-проектами. В статьях узнаете о важности планирования и ведения документации, жизненном цикле, Data-centric ИИ, данных для обучения, разметке и очистке, синтетических данных и еще немного о Data Engineering и ETL.
Часть 1: каждый проект должен начинаться с плана
Часть 2: приручаем хаос
Machine Learning
Для создания качественных проектов машинного обучения нужно воспринимать их именно как систему, обращать внимание на все ее компоненты и их взаимосвязи. К этому учеба не готовит, поэтому стоит сразу определить для себя алгоритм работы с ML-проектами. В статьях узнаете о важности планирования и ведения документации, жизненном цикле, Data-centric ИИ, данных для обучения, разметке и очистке, синтетических данных и еще немного о Data Engineering и ETL.
Часть 1: каждый проект должен начинаться с плана
Часть 2: приручаем хаос
Machine Learning
⌨️ Как маленькая нейроязыковая модель в Клавиатуре победила серверные подсказки
Статья о том, как разработчики Яндекса создали новую нейроязыковую модель для своей Клавиатуры и отказались от n-граммной.
Попутно объяснили, почему пословной языковой модели может не хватать и требуется так же побуквенная, а ещё описали архитектуру нейросетевой модели весом менее 20 МБ, которая работает на устройстве локально.
Machine Learning
Статья о том, как разработчики Яндекса создали новую нейроязыковую модель для своей Клавиатуры и отказались от n-граммной.
Попутно объяснили, почему пословной языковой модели может не хватать и требуется так же побуквенная, а ещё описали архитектуру нейросетевой модели весом менее 20 МБ, которая работает на устройстве локально.
Machine Learning
🤖 Как искусственный интеллект меняет будущее: обзор конференции OpenTalks.AI 2023
В начале прошлой недели в Ереване проходила самая крупная русскоязычная конференция по искусственному интеллекту OpenTalksAI. На конференции было ~600 участников, ~100 спикеров и 28 сессий в рамках трех крупных секций - бизнес, разработка и наука.
Machine Learning
В начале прошлой недели в Ереване проходила самая крупная русскоязычная конференция по искусственному интеллекту OpenTalksAI. На конференции было ~600 участников, ~100 спикеров и 28 сессий в рамках трех крупных секций - бизнес, разработка и наука.
Machine Learning
👨💻 Что такое Zero-cost fault tolerance в распределённом глубоком обучении и как его применяют в поисковике
Автор доклада делится опытом, как можно полностью инкапсулировать от ML-щика и исследователя заботу о fault tolerance, распределённой транзакционной записи в storage, асинхронности и минимизации простоев GPU. Дать возможность пользователю автоматически масштабироваться и вообще не думать об инфраструктурных вопросах.
Алексей Морозов, руководитель группы модернизации нейронных сетей в Яндекс Поиске, расскажет об этом на большой конференции Practical ML Conf 7 сентября. На ней будут технические доклады от инженеров, максимум пользы и знаний о практическом применении ML.
Регистрация вот здесь.
Machine Learning
Автор доклада делится опытом, как можно полностью инкапсулировать от ML-щика и исследователя заботу о fault tolerance, распределённой транзакционной записи в storage, асинхронности и минимизации простоев GPU. Дать возможность пользователю автоматически масштабироваться и вообще не думать об инфраструктурных вопросах.
Алексей Морозов, руководитель группы модернизации нейронных сетей в Яндекс Поиске, расскажет об этом на большой конференции Practical ML Conf 7 сентября. На ней будут технические доклады от инженеров, максимум пользы и знаний о практическом применении ML.
Регистрация вот здесь.
Machine Learning
YandexGPT 2: и швец, и жнец, и на дуде игрец
На Practical ML Conf Яндекс анонсировал обновленную версию своей нейронной сети. Теперь Yandex GPT 2 лучше умеет шутить, придумывать рифмы, писать тексты в разных жанрах и работать с несколькими условиями в одном запросе.
Проверить Yandex GPT 2 в действии можно уже сейчас в "Давай придумаем" с Алисой
На Practical ML Conf Яндекс анонсировал обновленную версию своей нейронной сети. Теперь Yandex GPT 2 лучше умеет шутить, придумывать рифмы, писать тексты в разных жанрах и работать с несколькими условиями в одном запросе.
Проверить Yandex GPT 2 в действии можно уже сейчас в "Давай придумаем" с Алисой
♟ Инструменты для MLOps: выбираем между вендорскими и Open Source-решениями
MLOps применяет DevOps для автоматизации конвейеров ML в производстве. Существует много инструментов, как проприетарных, так и Open Source. Мы сравним их подходы в этой статье.
Machine Learning
MLOps применяет DevOps для автоматизации конвейеров ML в производстве. Существует много инструментов, как проприетарных, так и Open Source. Мы сравним их подходы в этой статье.
Machine Learning
✍️ Как сократить потребление оперативной памяти нейросети в 5 раз: рассказываем о генерации субтитров в Яндекс Браузере
Сейчас нейросеть из браузера может создавать субтитры буквально к любым русскоязычным видео в интернете: от видеохостингов и социальных сетей до страниц телеканалов и загруженных в облачные хранилища роликов.
Но перед этим нужно было решить важную задачу: уменьшить потребление оперативной памяти нейросетью в разы и встроить её в браузер. Оптимизация буферов (450+ Мб) и моделей (200+ Мб) позволили дойти отметки в 150 Мб. Ещё удалось значительно уменьшить место на диске, которое занимала модель, не потеряв в качестве по сравнению с серверным решением.
За основу взята архитектура VGGTransformer. Нейросеть обучили на блочное применение: предсказание работает с помощью скользящего окна длиной 5 секунд со сдвигом 600 мс.
Подробнее о разработке — в статье на Хабре.
Machine Learning
Сейчас нейросеть из браузера может создавать субтитры буквально к любым русскоязычным видео в интернете: от видеохостингов и социальных сетей до страниц телеканалов и загруженных в облачные хранилища роликов.
Но перед этим нужно было решить важную задачу: уменьшить потребление оперативной памяти нейросетью в разы и встроить её в браузер. Оптимизация буферов (450+ Мб) и моделей (200+ Мб) позволили дойти отметки в 150 Мб. Ещё удалось значительно уменьшить место на диске, которое занимала модель, не потеряв в качестве по сравнению с серверным решением.
За основу взята архитектура VGGTransformer. Нейросеть обучили на блочное применение: предсказание работает с помощью скользящего окна длиной 5 секунд со сдвигом 600 мс.
Подробнее о разработке — в статье на Хабре.
Machine Learning
🙀 Стоит ли бояться искусственного интеллекта?
Джон Леннокс затронул критические вопросы, связанные с искусственным интеллектом, и то, как будущее искусственного интеллекта влияет на христианское видение реальности.
Machine Learning
Джон Леннокс затронул критические вопросы, связанные с искусственным интеллектом, и то, как будущее искусственного интеллекта влияет на христианское видение реальности.
Machine Learning
🔎 Яндекс выпустил датасет с 500 тыс. русскоязычных отзывов на организации
С помощью датасета можно производить, например, лингвистический анализ и анализ тональности текста. Датасет опубликован на Гитхабе. Также читайте подробную статью от разработчиков на Хабре.
Machine Learning
С помощью датасета можно производить, например, лингвистический анализ и анализ тональности текста. Датасет опубликован на Гитхабе. Также читайте подробную статью от разработчиков на Хабре.
Machine Learning
🪩 Идём на онлайн ML Party — 25 октября Яндекс организовывает митап для ML-специалистов.
Будут вещать про алгоритм обучения генеративных моделей с подкреплением, проект на стыке технологий ML и ecom-продукта, нейросетевую генерацию объявлений и этапы задачи матчинга предложений на товары.
На событии прозвучат три технических доклада от Фёдора Лебедя, разработчика отдела NLP группы YandexGPT Alignment, Максима Мачула, руководителя службы качества контента в Поиске по товарам, и Алексея Березникера, руководителя команды генерации рекламы.
Чтобы получить ссылку на трансляцию, нужно зарегистрироваться.
Machine Learning
Будут вещать про алгоритм обучения генеративных моделей с подкреплением, проект на стыке технологий ML и ecom-продукта, нейросетевую генерацию объявлений и этапы задачи матчинга предложений на товары.
На событии прозвучат три технических доклада от Фёдора Лебедя, разработчика отдела NLP группы YandexGPT Alignment, Максима Мачула, руководителя службы качества контента в Поиске по товарам, и Алексея Березникера, руководителя команды генерации рекламы.
Чтобы получить ссылку на трансляцию, нужно зарегистрироваться.
Machine Learning
This media is not supported in your browser
VIEW IN TELEGRAM
О создании детализированных Яндекс Карт: как в приложении появилась разметка, что такое «растишка» и зачем команде сервиса астроном
В этом выпуске подкаста Yet Another Podcast гости рассказывают, что такое высокодетализированные карты, как для их создания использовались нейросети и Unity, а также отвечают на распространенные вопросы пользователей.
Machine Learning
В этом выпуске подкаста Yet Another Podcast гости рассказывают, что такое высокодетализированные карты, как для их создания использовались нейросети и Unity, а также отвечают на распространенные вопросы пользователей.
Machine Learning
🙌 В Петербурге открылось образовательное пространство ШАДа
У Школы анализа данных Яндекса появилась новая площадка в офлайне — помимо основной программы занятий для студентов, тут начнут делиться экспертизой c ML-комьюнити. В планах — открытые лектории, интенсивы и воркшопы от экспертов Яндекса и ведущих преподавателей Школы. Можно будет участвовать в соревнованиях по ML и алгоритмам, а также работать вместе с ШАДовцами над учебными проектами в области DS, инфраструктуры больших данных и ИИ в прикладных науках.
Machine Learning
У Школы анализа данных Яндекса появилась новая площадка в офлайне — помимо основной программы занятий для студентов, тут начнут делиться экспертизой c ML-комьюнити. В планах — открытые лектории, интенсивы и воркшопы от экспертов Яндекса и ведущих преподавателей Школы. Можно будет участвовать в соревнованиях по ML и алгоритмам, а также работать вместе с ШАДовцами над учебными проектами в области DS, инфраструктуры больших данных и ИИ в прикладных науках.
Machine Learning