Youtube comments processing – сервис для анализа комментариев на YouTube
Проект Галины Симонец нацелен как на обычных пользователей, которые смотрят видео на YouTube, так и на бизнес, который работает с этой площадкой, – профессиональных блогеров или компании, продвигающие свои продукты.
Суть проекта – извлечение ценных знаний из комментариев под видео на YouTube с помощью машинного обучения. Речь идет в том числе о выявлении кластеров среди комментаторов (в зависимости от мнения, которое они высказывают), анализе тональности, обнаружении ботов, а также, например, комментариев, нацеленных на разжигание ненависти. Блогерам и бизнесу такой анализ должен быть полезен для понимания своей аудитории, а тем, кто просто смотрит видео, может быть интересно узнать процент негативных комментариев у любимого блогера.
Проект пока на первом этапе разработки. Уже реализована предобработка русскоязычного текста с использованием техник Natural Language Processing, проведено исследование методов классификации для обработки естественного языка на тестовых отзывах, разработан модуль для выгрузки комментариев по ссылке. Использовались Python-библиотеки для обработки естественного языка и работающие с моделями машинного обучения: Stanza, Sklearn, Urllib.parse, Wikiruwordnet, NLTK, Pandas, Numpy.
Монетизировать проект предполагается за счет платной подписки или продажи дополнительных услуг по анализу комментариев в дополнение к бесплатным пакетам.
Ссылка на проект: https://github.com/halynavs/youtube_comments_processing
Проголосовать за этот проект можно на странице https://highload.today/top-30-pet-proektov-igry-memy-boty-baraholki-svetofor-i-alkotester/
#YCP #YouTube #Python #machinelearning
Проект Галины Симонец нацелен как на обычных пользователей, которые смотрят видео на YouTube, так и на бизнес, который работает с этой площадкой, – профессиональных блогеров или компании, продвигающие свои продукты.
Суть проекта – извлечение ценных знаний из комментариев под видео на YouTube с помощью машинного обучения. Речь идет в том числе о выявлении кластеров среди комментаторов (в зависимости от мнения, которое они высказывают), анализе тональности, обнаружении ботов, а также, например, комментариев, нацеленных на разжигание ненависти. Блогерам и бизнесу такой анализ должен быть полезен для понимания своей аудитории, а тем, кто просто смотрит видео, может быть интересно узнать процент негативных комментариев у любимого блогера.
Проект пока на первом этапе разработки. Уже реализована предобработка русскоязычного текста с использованием техник Natural Language Processing, проведено исследование методов классификации для обработки естественного языка на тестовых отзывах, разработан модуль для выгрузки комментариев по ссылке. Использовались Python-библиотеки для обработки естественного языка и работающие с моделями машинного обучения: Stanza, Sklearn, Urllib.parse, Wikiruwordnet, NLTK, Pandas, Numpy.
Монетизировать проект предполагается за счет платной подписки или продажи дополнительных услуг по анализу комментариев в дополнение к бесплатным пакетам.
Ссылка на проект: https://github.com/halynavs/youtube_comments_processing
Проголосовать за этот проект можно на странице https://highload.today/top-30-pet-proektov-igry-memy-boty-baraholki-svetofor-i-alkotester/
#YCP #YouTube #Python #machinelearning