DenoiseLAB
486 subscribers
1.33K photos
159 videos
3 files
1.57K links
Блог DenoiseLAB (машинное обучение, аналитика)

Информация в канале служит только для ознакомления и не является призывом к действию. Не нарушайте законы РФ и других стран. Мы не несем отвественность за ваши действия или бездействия.
Download Telegram
☀️☀️☀️Заняли 12 место, из 26 команд, у лидера баллов 92 у нас 82. Если бы завернули все в докер и написали бы бекенд/фронт, то точно в пятерку бы вошли. Если оценивать чисто по задаче ML, то ее решили и даже предложили улучшение. Резюме, бек и фронт надо готовить заранее. Просто оформить красиво.

https://www.zavodit.ru/ru/calendar/event/54
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3
☄️☄️☄️В первом квартале этого года выручка компании, занимающей практически монопольное положение в производстве процессоров для вычислений на основе искусственного интеллекта, составила 26 миллиардов долларов, что на 262 процента больше, чем в прошлом году. Чистая прибыль показала еще более взрывной рост: на 628 процентов по сравнению с предыдущим годом, до 14,9 миллиарда долларов. Эти результаты побудили основателя и генерального директора Nvidia Дженсена Хуанга заявить вчера, что «следующая промышленная революция началась».

🔥🔥🔥Такой бурый рост, обеспечен только благодаря ИИ и активному внедрению его во все сферы. Рост обеспечен только за счет крупных китов типа Microsoft. Все как по классике: Если все ринулись искать золото, продавай лопаты.

✔️✔️✔️https://www.agenzianova.com/en/news/nvidia-triples-revenues-thanks-to-the-boom-in-artificial-intelligence/
Please open Telegram to view this post
VIEW IN TELEGRAM
☄️В открытом доступе появилась безцензурная модель Mistral-7B-v0.3

Основные новшества модели :

✔️ Модель использует лицензию Appache 2.0;
✔️Расход токенов стал меньше;
✔️ Словарь расширен до 33 тысяч слов;
✔️ Теперь у нейронки есть собственный API.

Кто хотел заюзать нейросеть без цензуры — ваш выход.

Переходим по ссылке ➡️ тут.

#Нейросети #Модели #NLP
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
📈📈📈Качество обработки сетей с каждым днем становится все лучше и лучше, сети демонстрируют все более уверенное движение к вполне натурным вещам, однако, реальность пока никто не отменял )))

🅰️🔤🔤Чем-то напоминает фильм матрица ))), так же все плывет, ну или эти фильтры из запретграмма ;)) ахаха

😬😬😬P.S. Отражение в зеркале
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥Adversarial Robustness Toolbox (ART) - это библиотека Python для обеспечения безопасности машинного обучения. ART находится в Linux Foundation AI & Data Foundation (LF AI & Data). Она предоставляет инструменты, позволяющие разработчикам и исследователям защищать и оценивать модели и приложения машинного обучения от таких угроз со стороны противника, как уклонение, отравление, извлечение и вывод.

🔥ART поддерживает все популярные фреймворки машинного обучения (TensorFlow, Keras, PyTorch, MXNet, scikit-learn, XGBoost, LightGBM, CatBoost, GPy и т. д.), все типы данных (изображения, таблицы, аудио, видео и т. д.) и задачи машинного обучения (классификация, обнаружение объектов, распознавание речи, генерация, сертификация и т. д.).

✔️https://github.com/Trusted-AI/adversarial-robustness-toolbox
Please open Telegram to view this post
VIEW IN TELEGRAM
☄️https://openai.com/index/openai-board-forms-safety-and-security-committee/ - OpenAI начала тестирование обучение своей новой модели GPT-5, однако, для выпуска ее в массы, был создан специальный комитет по безопасности в который вошли технические и политические эксперты OpenAI:

✔️Александр Мадри (глава отдела готовности);
✔️Лилиан Венг (глава отдела систем безопасности);
✔️Джон Шульман (глава отдела науки выравнивания);
✔️Мэтт Найт (глава отдела безопасности);
✔️Якуб Пачоцки (главный научный сотрудник).

🌐То есть все чаще уже ставится во главу угла не только насколько модель может выполнить, возложенные на нее функции, а насколько она безопасна, в целом и может выдать корректные ответы и не склонная ко множеству противоправных действий, умышленного или не умышленного характера.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥Прикол дня )))

🔤Оказывается, смена VPN влияет на то, что будет работать ChatGPT или нет на локальной машине ;)).

🔤Например, если вы сидите через Европу, например Австрия, то требуется пройти регистрацию и верификацию, обязательно указать все свои явки и пароли.

☝️А если вы сидите через, например Азербайджан, то модель работает без всякой регистрации и авторизации. Да, только, конечно дается в пользование модель ChatGPT - 3.5 и 4 версия идет как подписка, но все же.

⁉️Почему такая предвзятость или это какой-то клон ???
Please open Telegram to view this post
VIEW IN TELEGRAM
👍https://github.com/MMuttalib1326/Data-Leakage - очень маленький, но показательный тест, почему утекают данные, и как на это ведут себя метрики качества. Здесь сравнивается две модели, и в качестве метрики качества берется rmse, при этом показано, что при их относительном равенстве на train и test это не вызывает особых подозрений, однако данная модель не считается валидной.
Please open Telegram to view this post
VIEW IN TELEGRAM
☄️https://arxiv.org/pdf/2405.05990 - подробное описание SCA (Special Character Attaks) атаки на большие языковые модели. Приводится подробный механизм действия, сравниваются различные наборы данных и последовательностей, которые потенциально могут быть незаметны для модели.

📉Приводится две новые типы метрик Count и SAR, отражающие взаимодействие модели с данными. Проведено достаточно большое колличество тестов на большинстве современных моделях (Llama-2-Chat-7B, Llama-2-Chat-13B, Llama-2-Chat-70B, ChatGLM, Falcon, Llama-3-8B, Gemini, ERNIEBot, Llama-3-8B) и показано, что они все уязвимы к данному типу атак.
Please open Telegram to view this post
VIEW IN TELEGRAM
☄️Yandex Cloud тестирует технологию генеративного ответа для бизнеса. Это технология, которая работает в сервисе Нейро. Она поможет давать ответ на вопрос пользователя, собранный на базе всей информации с собственного сайта. Это в будущем сможет работать, например, в чат-ботах для автоматизации техподдержки или других целей.

🔥Сейчас технология будет обкатываться в закрытой бете по заявкам сайтов, в том числе у нескольких крупных информационных порталов, а потом, видимо, станет доступна всем.
Please open Telegram to view this post
VIEW IN TELEGRAM
😂😂😂Заявка на хакатон от одной из комманд ))) ахахаахха
😁2
Media is too big
VIEW IN TELEGRAM
❤️‍🔥❤️‍🔥❤️‍🔥Вышла браузерная игра anichat, на базе ИИ, в которой можно флиртовать с тянкой. Причем, даже уже есть рейтинг, топовых игроков, которые по всякому пытаются расположить ее к себе. Так же есть рейтинг, анти-флиртовальщиков по мнению модели. Конечно, ничто не заменит реального общения с дамой, но теперь это возвели в ранг соревнований. Что из этого получится я не знаю... Но интересно ;))
☄️https://arxiv.org/html/2405.06823v2 - отличная статья с полным разбором PLeak (Prompt Leaking Attacks against Large Language Model Applications) атаки на LLM. Рассматривается полный механизм данной атаки, ее реализация и показывается, что она состоит из двух подходов:

✔️ Offline AQ Optimization (Во-первых, пространство поиска для состязательного запроса огромно, поскольку каждый из его токенов может быть любым токеном в большом словаре, что может легко привести к локальному оптимуму. Поэтому PLeak разбивает поиск на более мелкие шаги и постепенно оптимизирует. Более того, начальные лексемы подсказки для «теневой» системы имеют большее
значение, чем последние. Исходя из этого сначала оптимизирует AQs для реконструкции t лексем подсказок «теневой» системы в наборе теневых данных Ds, а затем постепенно увеличивается размер реконструкции шаг за шагом, пока не сможем реконструировать все подсказки для «теневой» системы. Во-вторых, PLeak использует градиентный метод поиска для повышения эффективности на каждом шаге оптимизации);

✔️ Target System Prompt Reconstruction (Восстановление подсказки целевой системы: (i) восстановление исходного ответа после обфускации и (ii) извлечение подсказки целевой системы);

Даная атака позволяет вытащить структуру подсказок которой оперирует модель.
Please open Telegram to view this post
VIEW IN TELEGRAM