Machine Learning | Нейронные сети, ИИ, Big Data
7.72K subscribers
628 photos
48 videos
14 files
735 links
Всё о Machine Learning простым языком.

Сотрудничество: @max_excel
Download Telegram
📂 Об экономии ресурсов: как сделать модель эффективнее с помощью квантизации.

В этой статье ML-разработчик Яндекса рассказал о том, как работает квантизация, дал подробное представление типов данных, которые можно встретить в квантизованных нейросетевых моделях, и рассмотрел современные методы квантизации.

Machine Learning
🤖 Ускорение инференса LLM: инсайды от разработчика YandexGPT

Речь пойдёт о методах дистилляции и квантизации (включая SmoothQuant и GPT-Q), а также о дополнительных способах для редких случаев (Speculative Decoding и Continuous Batching). Также автор раскрывает на практике, с какими сложностями сталкиваются команды при внедрении LLM в реальные продукты, и рассказывает, как найти оптимум между скоростью и качеством, используя фронт Парето.

Machine Learning
Дайджест полезных текстов про ML и дата-аналитику.

Представляем подборку очень свежих и нужных каждому ML-специалисту текстов, ML/AI/Data-сервисов и даже пару кейсов. Контент очень редкий и годный, обязательно к прочтению.

Ссылка на статью - *тык*

Machine Learning
👊 Что такое утечки данных в машинном обучении и как с ними бороться

Ошибочное попадание информации из тестового датасета в обучающий – проблема нередкая. И последствия неприятные: модель выдаст нереалистично высокие показатели эффективности, а в реальных условиях будет работать совсем не так. Команда VK Cloud перевела статью о том, как это предотвратить (несколько способов с примерами).

Machine Learning
👀 YandexART обновилась до версии 1.3 и перешла на технологию латентной диффузии

Читаем статью от старшего разработчика из команды компьютерного зрения Яндекса и разбираемся, почему отказались от каскадной диффузии и как YandexART 1.3 обучили лучше понимать запросы пользователей

Machine Learning
🙂 Бросаем взгляд на прошлогодние исследования в области ИИ

Отчет разбит на такие блоки:

• исследования — технические прорывы и возможности;
• промышленность — области коммерческого применения AI и его влияние на бизнес;
• политика — регулирование AI;
• безопасность — выявление и снижение рисков от использования будущих систем AI;
• прогнозы — что по мнению авторов произойдёт в 2023 году, а также проверка прогнозов, которые давались в прошлом году на 2022 год.

Machine Learning
✍️ Яндекс открыл приём заявок на международную научную премию Yandex ML Prize

Это ежегодная премия, которую вручают за достижения в области компьютерного зрения, машинного перевода, распознавания и синтеза речи, анализа данных и генеративных моделей. В совете премии — ведущие российские исследователи в сфере ИИ, среди них — эксперты Yandex Research, Яндекс Погоды и Школы анализа данных. Прием заявок открыт до 21 июня, победителей объявят осенью. Размер премии составит от 500 тысяч рублей.

Кто может участвовать: исследователи, их научные руководители и преподаватели машинного обучения.

Номинации:
▪️ Первая публикация,
▪️ Исследователи,
▪️ Молодые научные руководители,
▪️ Научные руководители,
▪️ Преподаватели ML.

Machine Learning
Новый гайд на Хабре поможет вам понять, как внедрить YandexGPT API в python-приложения

Авторы дают подробное руководство по созданию собственного SDK и делятся своим кодом. В статье также проводится сравнение YandexGPT с ChatGPT: их эффективность на примере конкретной задачи и стоимость.

Machine Learning
🏹 Использование ИИ-инструментов в разработке ПО

Около 37% команд находятся в активном процессе внедрения ИИ-инструментов в практику разработки программного обеспечения.

Все больше европейских инженеров используют различные ИИ‑инструменты при решении своих задач в программных проектах.

Machine Learning
Media is too big
VIEW IN TELEGRAM
Интервью с CTO про машинное обучение и нейросети

Из этого видео вы узнаете, что такое машинное обучение, какие бывают нейронные сети и чем инженер машинного обучения отличается от data scientist.

0:01:14 Про себя
0:42:15 Что такое Machine Learning
0:47:36 В каких областях применяется ML
0:52:16 Что такое модель данных
0:56:55 Градация специалистов в ML
1:05:59 Типы моделей машинного обучения
1:10:26 Про нейросети
1:12:48 Разметка данных
1:13:57 Проблемы в ML
1:19:36 Самообучающиеся модели
1:22:09 Про Искусственный Интеллект
1:27:17 Как стать ML-инженером
1:35:08 Про собеседования
1:37:43 Источники знаний для ML-специалиста

Смотреть это видео на youtube: youtu.be/7bUYEMZVMCE

Machine Learning
🖥 Представлена YandexGPT 3 Lite. Она будет полезна в сценариях, где важна скорость ответа

Яндекс выпустил облегченную версию генеративной модели третьего поколения, которая подойдет разным типам бизнеса для решения рутинных задач в реальном времени. К примеру, будет полезна как чат-бот консультант на сайтах, в качестве подсказки операторам в колл-центрах или как суммаризатор деловых встреч. Новая модель доступна клиентам Yandex Cloud через API. А на Хабре можно прочитать подробнее про ключевые этапы ее обучения и узнать о том, как происходил процесс превращения просто умной модели в модель-ассистента.

Machine Learning
⌨️ Хабр: победители конкурса «Технотекст» в номинации ML

Виктор Юрченко из Яндекса со статьей «Нейронные сети для планирования движения беспилотных автомобилей».

Котенков Игорь из Open Data Science со статьей «Как работает ChatGPT: объясняем на простом русском эволюцию языковых моделей с T9 до чуда».

Мурат Апишев со статьей «О методах позиционного кодирования в Transformer».

Machine Learning
Роль искусственного интеллекта в развитии стартапов в 2023 году

Сегодня свыше 50% российских компаний используют искусственный интеллект (ИИ) в своей работе, а еще 20% готовы внедрить нейросети в свою деятельность. От этой тенденции не отстают и стартапы, которые активно применяют инструменты ИИ, оптимизируя с их помощью рутинные задачи.

Machine Learning
Яндекс прочтёт вслух 13000 книг: как работает новый виртуальный рассказчик в Букмейте

В этой статье разработчик технологии синтеза речи Яндекса рассказывает, с какими сложностями они с командой столкнулись, когда пытались внедрить технологию в книжный сервис.

Оказалось, что модель не знала, как правильно произносить редкие и необычные реплики и термины, из литературных произведений. Чтобы это исправить, нейросеть обучали на длинных текстах, содержащих множество повествований и описаний.

Machine Learning
📚 Яндекс выложил свою библиотеку YaFSDP в опенсорс

С её помощью можно ускорить обучение больших языковых моделей с открытым исходным кодом до 25% и тратить до 20% меньше ресурсов графических процессоров, которые требуются для такого обучения. Библиотека была разработана в процессе обучения YandexGPT 3, а сейчас стала доступной для компаний, разработчиков и исследователей со всего мира.

Machine Learning
Media is too big
VIEW IN TELEGRAM
Машинное обучение без навыков программирования

Существует множество инструментов для работы с моделями машинного обучения. Самыми популярными являются Python, R, TensorFlow, Keras, PyTorch. Но все они подразумевают навыки программирования.

Тем не менее, существуют и инструменты, позволяющие строить и обучать модели машинного обучения без знаний программирования. Их можно использовать для проверки гипотез, в образовательных целях или для лучшего понимания, как работает машинное обучение на практике.

В этом видео автор познакомит вас с некоторыми из таких инструментов:

00:45 Orange
04:19 KNIME
04:42 Weka
06:45 Playgroung.Tensorflow
10:03 Teachable Machine

Смотреть это видео на youtube: youtu.be/RM8-NwtJ6eg

Machine Learning
ОПРОС📍 Какого вы пола?
Anonymous Poll
80%
Мужского
20%
Женского
Новые методы сжатия больших языковых моделей от Яндекса и IST Austria

Яндекс выложил в опенсорс новые методы сжатия больших языковых моделей, с помощью которых размер нейросети можно уменьшить до 8 раз, сохранив при этом качество ответов на 95%.

Решение представлено двумя инструментами: благодаря первому происходит само сжатие нейросети, где снижается потребление памяти, нужной для работы модели. Второй исправляет ошибки, которые возникают в процессе уменьшения моделей.

Статья о новом решении включена в программу конференции ICML.

Machine Learning
Как устроена Nemotron-4 340b от NVIDIA?

NLP-специалисты подробно разобрали одну из самых крупных открытых LLM моделей. Выясним, как проходили её обучения и тестирования и можно ли её поставить в один ряд с OpenAI GPT-4.

Machine Learning