🤖 Практическое руководство по NLP: изучаем классификацию текстов с помощью библиотеки fastText
Источник
Источник
Библиотека программиста
🤖 Практическое руководство по NLP: изучаем классификацию текстов с помощью библиотеки fastText
Рассматриваем практическое применение supervised NLP модели fastText для обнаружения сарказма в новостных заголовках.
От перцептронов до AlexNet и OpenAI. Эволюция и проблемы ML
Интересная статья от Yandex Research, в которой исследователи разбирают историю обучаемых алгоритмов, объясняют проблему «черного ящика» и рассказывают, как улучшают интерпретируемость работы ML-моделей.
О том, что уже известно о «внутренностях» ИИ и почему работу нейросетей нельзя измерять только их эффективностью, читайте по ссылке.
Интересная статья от Yandex Research, в которой исследователи разбирают историю обучаемых алгоритмов, объясняют проблему «черного ящика» и рассказывают, как улучшают интерпретируемость работы ML-моделей.
О том, что уже известно о «внутренностях» ИИ и почему работу нейросетей нельзя измерять только их эффективностью, читайте по ссылке.
nplus1.ru
Внимание, черный ящик
Как и зачем исследовать логику нейросетей
👍6
Forwarded from SQLpedia | Базы данных
Telegraph
SQL в науке о данных
Введение SQL (язык структурированных запросов) — язык программирования, используемый для запроса и управления данными в реляционных базах данных. Реляционные базы данных состоят из наборов двумерных таблиц. Каждая из этих таблиц содержит фиксированное количество…
👍4
Как организовать потоковую обработку данных. Часть 2!
В первой части Евгений Ненахов из центра Big Data МТС Digital рассказал об основных компонентах методологии, а сейчас — о том, как ими пользоваться.
Из новой статьи вы узнаете:
➖ где хранить конфигурации
➖ как настроить Kafka и Spark Streaming
➖ как снизить нагрузку на GC и многое другое
О том, как создать универсальный инструмент потоковой обработки данных и построить с его помощью мощную систему стриминга, способную обрабатывать 7 млн событий в пике, читайте в блоге МТС на Хабре.
В первой части Евгений Ненахов из центра Big Data МТС Digital рассказал об основных компонентах методологии, а сейчас — о том, как ими пользоваться.
Из новой статьи вы узнаете:
➖ где хранить конфигурации
➖ как настроить Kafka и Spark Streaming
➖ как снизить нагрузку на GC и многое другое
О том, как создать универсальный инструмент потоковой обработки данных и построить с его помощью мощную систему стриминга, способную обрабатывать 7 млн событий в пике, читайте в блоге МТС на Хабре.
Хабр
Как организовать потоковую обработку данных. Часть 1
Привет, Хабр! Меня зовут Евгений Ненахов, я работаю в центре Big Data МТС Digital . В этой статье я расскажу о том, как мы создали универсальный инструмент потоковой обработки данных и построили с его...
👍4
Forwarded from SQLpedia | Базы данных
Telegraph
Руководство по анализу данных с SQL
Данные — это новое топливо цифровой эры. Однако с ростом их количества появляется необходимость извлекать из них смысл. В результате этого появилось множество профессий, связанных с управлением данными и их анализом для принятия более разумных бизнес-решений.…
🔥4👍1
🤖Самая большая BERT-подобная модель на русском, которая поместится на ваш компьютер
RuLeanALBERT — нейросеть, показывающую сравнимые с другими открытыми моделями и где-то даже близкие к state-of-the-art результаты на бенчмарках по пониманию русского языка. В статье исследователей Yandex Research можно прочитать о подробностях обучения, которые они реализовали в открытом коде.
RuLeanALBERT — нейросеть, показывающую сравнимые с другими открытыми моделями и где-то даже близкие к state-of-the-art результаты на бенчмарках по пониманию русского языка. В статье исследователей Yandex Research можно прочитать о подробностях обучения, которые они реализовали в открытом коде.
👍7❤2
Forwarded from BApedia | Бизнес-анализ
This media is not supported in your browser
VIEW IN TELEGRAM
Джун помогает сеньорам
😁31👍5🔥1