DenoiseLAB
486 subscribers
1.33K photos
159 videos
3 files
1.57K links
Блог DenoiseLAB (машинное обучение, аналитика)

Информация в канале служит только для ознакомления и не является призывом к действию. Не нарушайте законы РФ и других стран. Мы не несем отвественность за ваши действия или бездействия.
Download Telegram
https://github.com/yandex/geo-reviews-dataset-2023 - Яндекс выкладывает в открытый доступ крупнейший русскоязычный датасет отзывов об организациях, опубликованных на Яндекс Картах.

✔️500 000 уникальных отзывов
✔️Только отзывы на организации в России
✔️Доступны на Яндекс Картах
✔️Опубликованы с января по июль 2023 года
✔️Датасет не содержит коротких односложных отзывов
✔️Тексты очищены от персональных данных (номеров телефонов, адресов почты)
Please open Telegram to view this post
VIEW IN TELEGRAM
🇨🇳 В Китае ученые создают новое поколение секс-роботов на базе китайских LLM по типу 👩‍💻ChatGPT

Как стало известно SCMP, китайские ученые и инженеры решили использовать большие языковые модели (LLM) специально для секс-роботов с целью создания 💑"интерактивных компаньонов", имеющих искусственный интеллект.

В Шэньчжэне крупный производитель секс-кукол компания Starpery Technology начала обучать свою собственную большую языковую модель, чтобы усовершенствовать свой продукт и наделить его ИИ, дабы куклы могли имитировать человеческий голос, общаться и 🍓понимать желания собственника.

По мнению разработчиков, секс-куклы с "беспрецедентными возможностями" в интимном плане - в мужском или женском обличии - скоро появятся на полках магазинов.
Please open Telegram to view this post
VIEW IN TELEGRAM
✔️✔️✔️Запилил быстрый отчет для клиента по рабочей задаче скоринговых данных в банковской системе.

Кейс, в целом проходной, реализован на CatBoost'e с минимальной аналитикой.

Управились очень оперативно, с правками, дополнениями и прочими моментами. Визуализация базовая без изысков так как кейс типовой, со стороны бизнеса все показано и даны рекомендации завернуть все докер или апишку.
Please open Telegram to view this post
VIEW IN TELEGRAM
☄️☄️☄️https://github.com/google-ai-edge/model-explorer/wiki/4.-API-Guide - очень модная тулза для оценки работы модели, вернее ее визуализации, достаточно мощный и расширенный функционал, есть подробная документация по установке и настройке, пригодится всем кто изучает сети, разбирает их по кусочкам.
Please open Telegram to view this post
VIEW IN TELEGRAM
https://www.techopedia.com/news/metas-new-camerabuds-earphones-with-ai-powered-cameras - какая тонкая работа, учитывая биологию уха, и колличество там точек можно будет собирать большинство данных уже не только о человеке, но и по каждому органу в отдельности. Вау...
Ребят всем привет!!! Мы были на соревнованиях по генерации текста и его камуфлированию. То есть стояли следующие задачи:
1/ Получить текст и оценить его степень генерации по 100 шкале
2/ Перефразирвовать его и "очеловечить", причем можно использовать все возможные варианты и что бы не "спалила" проверяющая система.

За хакатон было просмотрено большое колличество материала. Из 11 комманды нормально, растем !!! Дошли до финала не все из было больше, причем наше решение было очень неплохое. У лидера было процент по текстам 50%-40%, у нас 40%

https://zavodit.ru/ru/calendar/event/57 (2 кейс AnomalyDetection)

https://github.com/evgeniy-gordeev/AI-GEN-detector/tree/master
https://huggingface.co/models?p=13&sort=trending&search=paraphrase
https://huggingface.co/sentence-transformers/paraphrase-TinyBERT-L6-v2
https://huggingface.co/s-nlp/ruRoberta-large-paraphrase-v1
https://huggingface.co/Ashishkr/paraphrase_diversity_ranker
https://github.com/RasaHQ/paraphraser
https://huggingface.co/aiknowyou/mt5-base-it-paraphraser
https://huggingface.co/PM-AI/sts_paraphrase_xlm-roberta-base_de-en
2🔥2
Причем мы предложили очень неплохое решение, на следующие неделе напиши статью на хабр с разбором кейса.