Machine Learning | Нейронные сети, ИИ, Big Data
7.72K subscribers
628 photos
48 videos
14 files
735 links
Всё о Machine Learning простым языком.

Сотрудничество: @max_excel
Download Telegram
✍️ Как сократить потребление оперативной памяти нейросети в 5 раз: рассказываем о генерации субтитров в Яндекс Браузере

Сейчас нейросеть из браузера может создавать субтитры буквально к любым русскоязычным видео в интернете: от видеохостингов и социальных сетей до страниц телеканалов и загруженных в облачные хранилища роликов.

Но перед этим нужно было решить важную задачу: уменьшить потребление оперативной памяти нейросетью в разы и встроить её в браузер. Оптимизация буферов (450+ Мб) и моделей (200+ Мб) позволили дойти отметки в 150 Мб. Ещё удалось значительно уменьшить место на диске, которое занимала модель, не потеряв в качестве по сравнению с серверным решением.

За основу взята архитектура VGGTransformer. Нейросеть обучили на блочное применение: предсказание работает с помощью скользящего окна длиной 5 секунд со сдвигом 600 мс.

Подробнее о разработке — в статье на Хабре.

Machine Learning
🙀 Стоит ли бояться искусственного интеллекта?

Джон Леннокс затронул критические вопросы, связанные с искусственным интеллектом, и то, как будущее искусственного интеллекта влияет на христианское видение реальности.

Machine Learning
🔎 Яндекс выпустил датасет с 500 тыс. русскоязычных отзывов на организации

С помощью датасета можно производить, например, лингвистический анализ и анализ тональности текста. Датасет опубликован на Гитхабе. Также читайте подробную статью от разработчиков на Хабре.

Machine Learning
🪩 Идём на онлайн ML Party — 25 октября Яндекс организовывает митап для ML-специалистов.

Будут вещать про алгоритм обучения генеративных моделей с подкреплением, проект на стыке технологий ML и ecom-продукта, нейросетевую генерацию объявлений и этапы задачи матчинга предложений на товары.

На событии прозвучат три технических доклада от Фёдора Лебедя, разработчика отдела NLP группы YandexGPT Alignment, Максима Мачула, руководителя службы качества контента в Поиске по товарам, и Алексея Березникера, руководителя команды генерации рекламы.
Чтобы получить ссылку на трансляцию, нужно зарегистрироваться.

Machine Learning
This media is not supported in your browser
VIEW IN TELEGRAM
О создании детализированных Яндекс Карт: как в приложении появилась разметка, что такое «растишка» и зачем команде сервиса астроном

В этом выпуске подкаста Yet Another Podcast гости рассказывают, что такое высокодетализированные карты, как для их создания использовались нейросети и Unity, а также отвечают на распространенные вопросы пользователей.

Machine Learning
🙌 В Петербурге открылось образовательное пространство ШАДа

У Школы анализа данных Яндекса появилась новая площадка в офлайне — помимо основной программы занятий для студентов, тут начнут делиться экспертизой c ML-комьюнити. В планах — открытые лектории, интенсивы и воркшопы от экспертов Яндекса и ведущих преподавателей Школы. Можно будет участвовать в соревнованиях по ML и алгоритмам, а также работать вместе с ШАДовцами над учебными проектами в области DS, инфраструктуры больших данных и ИИ в прикладных науках.

Machine Learning
EdgeЦентр позволяет надежно защитить серверы и рабочую сеть!
На телеграм-канал стоит подписаться всем, кто хочет:
- получать исчерпывающие консультации о способах ускорить работу сайта;
- быть в курсе тенденций рынка облачных решений;
- узнавать о новейших системах защиты от DDoS-атак.
А еще их эксперты помогут сформировать по-настоящему безопасную рабочую сеть для любой организации.
Подписываемся на telegram-канал EdgeЦентр уже сейчас!

Реклама | ООО “ЭджЦентр” | ИНН 7704848336 |erid LjN8KEjx1
🏆 Премию Yandex ML Prize-2023 вручили за исследования в области распознавания и синтеза речи, компьютерного зрения и информационного поиска.

Всего лауреатами стали 11 перспективных ученых. В частности, отмеченные исследования позволят в будущем генерировать высокодетализированную компьютерную графику, а в медицине — изучать развитие клеток живых организмов или на ранних стадиях диагностировать редкие заболевания. В числе лауреатов премии есть и резиденты совместной программы Яндекса, МФТИ и НИУ ВШЭ Yandex Research ML Residency.

Machine Learning
💻 Яндекс составил интерактивную карту с актуальными техническими навыками для ML-специалистов

Там можно посмотреть, какие навыки связаны между собой (чем ближе они на карте, тем теснее связаны), или изучить, к каким инструментам особенно вырос интерес в прошлом году. Ещё можно кликнуть на навык и увидеть дополнительную информацию: описание, динамику интереса с 2010 года, а также список навыков-альтернатив, которые могут заменить выбранный навык при решении тех или иных задач.

На основе карты сделали такой чек-лист. Отмечайте, что используете в работе чаще всего.

Machine Learning
#вакансия #job #vacancy #remote #parttime #преподаватель #educator #ML #AI #DS #Medicine

Время делиться знаниями!

Компания: OTUS – образовательная платформа. За более чем 6 лет работы мы создали более 170 авторских курсов для IT-специалистов разного уровня от Junior до Senior. Практически на каждом нашем курсе есть вступительное тестирование для наших студентов, плюс более 650 преподавателей-практиков из крупнейших компаний. Мы учимся друг у друга, советуемся, помогаем, делимся опытом и обсуждаем новости как в преподавании, так и в IT.

Вакансия: преподаватель онлайн-курса «Искусственный интеллект в медицине»

Эта вакансия будет интересна для экспертов с практическим опытом в области AI, Machine Learning, Data Science по направлению анализа медицинских данных. Можно без опыта преподавания. Мы с удовольствием поможем Вам освоить Best Practices преподавания: для этого у нас есть вводный курс по преподаванию и пробные уроки с методистом.

Преподаватель раскрывает тему урока с помощью теории и примеров из практики.

Условия:
удаленное сотрудничество, занятость part-time.
стандартное занятие длится 1,5 часа с 20:00 до 21:30 по МСК.
уроки проводятся в онлайн формате в Zoom.
на занятиях используется презентация с теорией и практические примеры, чтобы раскрыть тему урока.
наши методисты помогают освоить лучшие инструменты и практики преподавания.

Еще Вы сможете:
внести свой вклад в развитие IT.
структурировать свой опыт и знания.
развивать личный бренд.
прокачать софт-скиллы.
получать от 3000 до 5000 руб. за проведение одного вебинара (полтора часа), плюс отдельно оплачивается разработка материалов к лекциям на выбранные темы, проведение открытых уроков и другие активности.

Бонусы:
наши курсы со скидкой/бесплатно.
возможность приглашать в свою команду на работу лучших выпускников.
воркшопы и конференции для наших преподавателей.

Подробнее в telegram: @ElenaAlias
YandexGPT в Браузере, которая умеет пересказывать видеоролики

В этой статье автор подробно рассказывает нам о процессе обучения модели YandexGPT суммаризации видео любой длины, делится первыми экспериментами, сравнением форматов LLM и показывает пайплайн решения.

Machine Learning
📂 Об экономии ресурсов: как сделать модель эффективнее с помощью квантизации.

В этой статье ML-разработчик Яндекса рассказал о том, как работает квантизация, дал подробное представление типов данных, которые можно встретить в квантизованных нейросетевых моделях, и рассмотрел современные методы квантизации.

Machine Learning
🤖 Ускорение инференса LLM: инсайды от разработчика YandexGPT

Речь пойдёт о методах дистилляции и квантизации (включая SmoothQuant и GPT-Q), а также о дополнительных способах для редких случаев (Speculative Decoding и Continuous Batching). Также автор раскрывает на практике, с какими сложностями сталкиваются команды при внедрении LLM в реальные продукты, и рассказывает, как найти оптимум между скоростью и качеством, используя фронт Парето.

Machine Learning
Дайджест полезных текстов про ML и дата-аналитику.

Представляем подборку очень свежих и нужных каждому ML-специалисту текстов, ML/AI/Data-сервисов и даже пару кейсов. Контент очень редкий и годный, обязательно к прочтению.

Ссылка на статью - *тык*

Machine Learning
👊 Что такое утечки данных в машинном обучении и как с ними бороться

Ошибочное попадание информации из тестового датасета в обучающий – проблема нередкая. И последствия неприятные: модель выдаст нереалистично высокие показатели эффективности, а в реальных условиях будет работать совсем не так. Команда VK Cloud перевела статью о том, как это предотвратить (несколько способов с примерами).

Machine Learning
👀 YandexART обновилась до версии 1.3 и перешла на технологию латентной диффузии

Читаем статью от старшего разработчика из команды компьютерного зрения Яндекса и разбираемся, почему отказались от каскадной диффузии и как YandexART 1.3 обучили лучше понимать запросы пользователей

Machine Learning
🙂 Бросаем взгляд на прошлогодние исследования в области ИИ

Отчет разбит на такие блоки:

• исследования — технические прорывы и возможности;
• промышленность — области коммерческого применения AI и его влияние на бизнес;
• политика — регулирование AI;
• безопасность — выявление и снижение рисков от использования будущих систем AI;
• прогнозы — что по мнению авторов произойдёт в 2023 году, а также проверка прогнозов, которые давались в прошлом году на 2022 год.

Machine Learning
✍️ Яндекс открыл приём заявок на международную научную премию Yandex ML Prize

Это ежегодная премия, которую вручают за достижения в области компьютерного зрения, машинного перевода, распознавания и синтеза речи, анализа данных и генеративных моделей. В совете премии — ведущие российские исследователи в сфере ИИ, среди них — эксперты Yandex Research, Яндекс Погоды и Школы анализа данных. Прием заявок открыт до 21 июня, победителей объявят осенью. Размер премии составит от 500 тысяч рублей.

Кто может участвовать: исследователи, их научные руководители и преподаватели машинного обучения.

Номинации:
▪️ Первая публикация,
▪️ Исследователи,
▪️ Молодые научные руководители,
▪️ Научные руководители,
▪️ Преподаватели ML.

Machine Learning
Новый гайд на Хабре поможет вам понять, как внедрить YandexGPT API в python-приложения

Авторы дают подробное руководство по созданию собственного SDK и делятся своим кодом. В статье также проводится сравнение YandexGPT с ChatGPT: их эффективность на примере конкретной задачи и стоимость.

Machine Learning