Highload — медіа для розробників
4.16K subscribers
5.6K photos
277 videos
18 files
6.48K links
Розповідаємо про людей, які створюють код, та про код, який вони пишуть.

Зв'язатися із редакцією можна тут: news@highload.today. А щодо розміщення реклами, будь ласка, пишіть на specials@highload.today.

Наш чат https://t.me/highloadchatt
Download Telegram
​​Youtube comments processing – сервис для анализа комментариев на YouTube

Проект Галины Симонец нацелен как на обычных пользователей, которые смотрят видео на YouTube, так и на бизнес, который работает с этой площадкой, – профессиональных блогеров или компании, продвигающие свои продукты.

Суть проекта – извлечение ценных знаний из комментариев под видео на YouTube с помощью машинного обучения. Речь идет в том числе о выявлении кластеров среди комментаторов (в зависимости от мнения, которое они высказывают), анализе тональности, обнаружении ботов, а также, например, комментариев, нацеленных на разжигание ненависти. Блогерам и бизнесу такой анализ должен быть полезен для понимания своей аудитории, а тем, кто просто смотрит видео, может быть интересно узнать процент негативных комментариев у любимого блогера.

Проект пока на первом этапе разработки. Уже реализована предобработка русскоязычного текста с использованием техник Natural Language Processing, проведено исследование методов классификации для обработки естественного языка на тестовых отзывах, разработан модуль для выгрузки комментариев по ссылке. Использовались Python-библиотеки для обработки естественного языка и работающие с моделями машинного обучения: Stanza, Sklearn, Urllib.parse, Wikiruwordnet, NLTK, Pandas, Numpy.

Монетизировать проект предполагается за счет платной подписки или продажи дополнительных услуг по анализу комментариев в дополнение к бесплатным пакетам.

Ссылка на проект: https://github.com/halynavs/youtube_comments_processing

Проголосовать за этот проект можно на странице https://highload.today/top-30-pet-proektov-igry-memy-boty-baraholki-svetofor-i-alkotester/

#YCP #YouTube #Python #machinelearning