Data Secrets
78.8K subscribers
6.42K photos
664 videos
20 files
2.7K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
DBSCAN: интересный алгоритм кластеризации

DBSCAN (Density-based spatial clustering of applications with noise), как следует из названия, оперирует плотностью данных. На вход он просит матрицу близости и два параметра — радиус епсилон-окрестности и количество соседей. Так сразу и не поймёшь, что это за параметры и как из выбрать. И кроме того, причем тут плотность и когда вообще применять DBSCAN? Давайте разберёмся.

😻 #train #math
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
19👍7🆒3
Драматичное продолжение истории про AI Act и прочее регулирование

Топ-менеджеры крупнейших ИИ-компаний, включая OpenAI, Google DeepMind и Anthropic, подняли тревогу, сравнивая риски своих технологий с ядерной войной и пандемиями.

В открытом письме, состоящем из одного предложения, они заявили, что минимизация угрозы искусственного интеллекта должна быть глобальным приоритетом. Под этим обращением поставили подписи более 350 ключевых участников отрасли ИИ, включая руководителей компаний и ведущих исследователей.

Верим-верим

😻 #news
Please open Telegram to view this post
VIEW IN TELEGRAM
😁13🤔9👍3🤪1
Not stonks 🤕

😻 #memes
Please open Telegram to view this post
VIEW IN TELEGRAM
🤓44👏8👨‍💻84🐳2😨1
Как работает BERT?

Модель BERT (Bidirectional Encoder Representations from Transformers) была представлена в статье от исследователей из Google AI Language. Она вызвала нешуточный ажиотаж в сообществе, и эту модель до сих пор все очень любят. Разбираемся, как она работает, и как ее использовать для своих задач.

Вот, кстати, ссылка на исходный код

😻 #NN
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
29🔥8👍5
Китайские исследовали сделали систему, которая помогает читателю с незнакомыми словами

Даже те, кто хорошо знает английский, спотыкаются при чтении: не хватает словарного запаса. Для решения проблемы резерчеры из Университета Цинхуа придумали систему, которая наблюдает за тем, как пользователь читает текст, и подсказывает значение незнакомых слов.

Для оценки системы участников попросили прочитать слова из теста на определение уровня словарного запаса, и система определила незнакомые для них слова с точностью 98,09%. Общая эффективность системы, конечно, зависела от контекста и качества веб-камеры, но результаты, тем не менее, радуют.

😻 #news #NN
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍383
Функция transform из pandas

Эта функция (грубо говоря) сочетает в себе аггрегацию и фильтрование. Однако понять ее сразу не очень просто: лучше посмотрим на пример.

😻 #python
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥41👍208🤔1