DenoiseLAB – Telegram

DenoiseLAB

486 subscribers

1.33K photos

159 videos

3 files

1.57K links

Блог DenoiseLAB (машинное обучение, аналитика)

Информация в канале служит только для ознакомления и не является призывом к действию. Не нарушайте законы РФ и других стран. Мы не несем отвественность за ваши действия или бездействия.

Download Telegram

About

Blog

Apps

Platform

486 subscribers

☄️

https://arxiv.org/html/2405.06823v2 - отличная статья с полным разбором PLeak (Prompt Leaking Attacks against Large Language Model Applications) атаки на LLM. Рассматривается полный механизм данной атаки, ее реализация и показывается, что она состоит из двух подходов:

✔️ Offline AQ Optimization (Во-первых, пространство поиска для состязательного запроса огромно, поскольку каждый из его токенов может быть любым токеном в большом словаре, что может легко привести к локальному оптимуму. Поэтому PLeak разбивает поиск на более мелкие шаги и постепенно оптимизирует. Более того, начальные лексемы подсказки для «теневой» системы имеют большее
значение, чем последние. Исходя из этого сначала оптимизирует AQs для реконструкции t лексем подсказок «теневой» системы в наборе теневых данных Ds, а затем постепенно увеличивается размер реконструкции шаг за шагом, пока не сможем реконструировать все подсказки для «теневой» системы. Во-вторых, PLeak использует градиентный метод поиска для повышения эффективности на каждом шаге оптимизации);

✔️ Target System Prompt Reconstruction (Восстановление подсказки целевой системы: (i) восстановление исходного ответа после обфускации и (ii) извлечение подсказки целевой системы);

Даная атака позволяет вытащить структуру подсказок которой оперирует модель.

Please open Telegram to view this post

VIEW IN TELEGRAM

47 viewsedited 17:29

https://codenrock.com/contests/ekf-ai-challenge#/

EKF AI Challenge - это уникальное событие на стыке инженерных и цифровых технологий! Компания EKF - отечественный производитель электрооборудования и лидер цифровых решений! Компания успешно масштабируется в импортозамещении и ведет разработки ПО под собственным брендом – умный дом EKF Connect Home и IIoT EKF Connect Industry для эффективного управления электроснабжением на любых объектах ⚡️

🔧 Задача на хакатоне: Автоматизация формирования прайс-листа для электрических схем

🔍 Что нужно сделать:

Разработайте инновационное решение (алгоритм или нейронную сеть), которое автоматически создает прайс-лист на основе электрических схем, созданных инженерами-электриками. Ваше решение должно уметь подбирать необходимые элементы (проводники, переключатели, защитные устройства, датчики и т.д.) из предоставленной номенклатурной базы.

EKF AI Challenge

Разработайте решение для автоматизации формирования коммерческого предложения на основе электрических схем. Ваше решение поможет подбирать элементы из номенклатурной базы и создавать готовые предложения. Станьте частью инноваций вместе с EKF, лидером в э…

59 viewsedited 18:52

✔️

https://fineproxy.org/ru/wiki/generative-adversarial-networks-gans/ - очень простое объясние что такое генеративные адверсиальные сети. Вот мне нравится когда вот так очень просто и буквально на пальцах все рассказывают. В двух словах, что это и какой механизм.

Please open Telegram to view this post

VIEW IN TELEGRAM

Генеративные адверсариальные сети (ГАС) - Глоссарий FineProxy

Генеративные адверсарные сети (ГАС) - это особый класс алгоритмов искусственного интеллекта (ИИ), используемых в машинном обучении без надзора, реализованный в виде

69 views10:21

https://rucode.net/conf2024/?utm_source=stepik&utm_medium=email&utm_campaign=rucode2024conf&utm_content=20240531_anons1_button

56 views10:32

☄️

https://neurohive.io/ru/gotovye-prilozhenija/model-nvidia-dreureka-obuchaet-robotov-bystree-chem-ljudi/ - Модель NVIDIA DrEureka обучает роботов быстрее, чем люди, все это говорит, о том, что наши алгоритмы и наше представление об обучении роботов и машину в целом слабо укладывается в "их" парадигму.

✔️Исходя из этого, обучение моделей машинного обучение и роботизированной техники скоро уйдет на руки моделям, так как количество правил, норм, и подходов в задействовании обучения здесь больше чем может охватить человек. Вопрос стоит уже не только об обучении машины, сколько о разработке модели для обучения других моделей. Такие модели будут множится и появляться очень быстро и в целом они создадут барьер, между человеком и машиной. Опять же еще более остро встанет вопрос о безопасности сие конструкции.

❤️‍🔥Это к вопросу о машинной психологии, она там "другая", от слова совсем.

Please open Telegram to view this post

VIEW IN TELEGRAM

Neurohive - Нейронные сети

Модель NVIDIA DrEureka обучает роботов быстрее, чем люди

DrEureka превосходит стандартные системы обучения на 34% по скорости движения робота в реальных условиях и на 20% - по пройденному им расстоянию.

59 viewsedited 08:53

🔥

https://github.com/OpenPipe/OpenPipe/tree/main/examples/classify-recipes - тонкая настройка LLAma-2, очень много расписано всяких полезных фишек:

✔️Продемонстрированно, как сгенерировать примерный набор данных по GPT-4, сохранить его с помощью OpenPipe, а затем экспортировать в формат, подходящий для обучения модели;

✔️Обучена модель Llama 2 7B на наборе данных;

✔️Проведена оценка модели;

✔️Также есть скрипт для сравнения затрат и задержек завершения между нашей точно настроенной моделью, GPT-3.5 и GPT-4.

Please open Telegram to view this post

VIEW IN TELEGRAM

OpenPipe/examples/classify-recipes at main · OpenPipe/OpenPipe

Turn expensive prompts into cheap fine-tuned models - OpenPipe/OpenPipe

❤1

54 viewsedited 06:03

This media is not supported in your browser

VIEW IN TELEGRAM

✔️Видео сгенерено sora-моделью, в общем и целом, не отличимо от реальности, для большинства обывателей, один минус, руль двигается неестественно плавно, и в целом динамика не такая, как на реальных гонках. Но все равно выглядит круто.

Please open Telegram to view this post

VIEW IN TELEGRAM

53 views06:49

☄️

☄️

☄️

https://boosty.to/denoise_lab/posts/b60ecaa3-e86b-4a8c-be6b-48672388d332?share=post_link - сделал полный разбор большой языковой модели Phi-4-Mini-128k. Полностью объяснены все параметры модели, и подробно все методы и классы модели. Представлены все ссылки на статьи и официальные репозитории. Подписывайтесь, буду рад видеть всех!

Please open Telegram to view this post

VIEW IN TELEGRAM

Полный разбор Phi-3-Mini-128k - DenoiseLAB | Boosty

Полный разбор Phi-3-Mini-128k - exclusive content from DenoiseLAB, subscribe and get access first!

53 viewsedited 07:54

😬

😬

😬Неожиданный результат )))

⁉️

⁉️

⁉️По работе пришлось пользоваться YandexGPT и активное его тестировать, спустя какое-то время пришел чек на 400 р. Мда... )))) Печалька..., хотя даже о подписке и речи не шло. Я не против подписки, но не тогда когда бот заваливается и выпадает в ошибку, причем на не самом длинном промпте... Бот, упал в ошибку, то есть обработчик ошибок... ну как бы... не совсем рабочий.

Please open Telegram to view this post

VIEW IN TELEGRAM

52 viewsedited 09:29

✔️

https://github.com/togethercomputer/RedPajama-Data - открытый набор данных для обучения больших языковых моделей. Набор включает более 100 Б текстовых документов, полученных из 84 снимков CommonCrawl и обработанных с помощью конвейера CCNet.

Please open Telegram to view this post

VIEW IN TELEGRAM

GitHub - togethercomputer/RedPajama-Data: The RedPajama-Data repository contains code for preparing large datasets for training…

The RedPajama-Data repository contains code for preparing large datasets for training large language models. - togethercomputer/RedPajama-Data

57 views11:01

✔️

https://clarifai.com/databricks/drbx/models/dbrx-instruct - современная, эффективная, открытая LLM от Databricks, способная обрабатывать входные данные длиной до 32K токенов. Модель отлично справляется с широким набором задач на естественном языке, таких как: резюмирование текста, ответы на вопросы, извлечение информации и кодирование.

Please open Telegram to view this post

VIEW IN TELEGRAM

dbrx-instruct model | Clarifai - The World's AI

DBRX-Instruct is a state-of-the-art, efficient, open LLM by Databricks, capable of handling input length up to 32K tokens. The model excels at a broad set of

59 views12:01

https://habr.com/ru/companies/sberbank/news/819057/

Для пользователей GitVerse стало доступно российское «зеркало» Docker Hub

Пользователям стал доступен новый сервис в составе платформы GitVerse — «зеркало» заблокированного для российских пользователей Docker Hub. Разработчики могут продолжать пользоваться...

65 views13:51

💣

💣

💣

https://cyberorda.com/MlSecOps/# - невероятный блог по взлому LLM и вопросам безопасности LLM в целом, просто бомба, ракета просто, просто круто.

Please open Telegram to view this post

VIEW IN TELEGRAM

64 viewsedited 14:02

https://github.com/RiccardoBiosas/awesome-MLSecOps - полностью джентельменский набор для MLSecOps в реальнои продакшене, здесь собрано множество инструментов Open Source Security Tools, Commercial, DATA, ML code security:
✔️ModelScan,
✔️NB Defense,
✔️Garak,
✔️Adversarial Robustness Toolbox
✔️MLSploit и много чего еще другого супер полезного.

Please open Telegram to view this post

VIEW IN TELEGRAM

GitHub - RiccardoBiosas/awesome-MLSecOps: A curated list of MLSecOps tools, articles and other resources on security applied to…

A curated list of MLSecOps tools, articles and other resources on security applied to Machine Learning and MLOps systems. - RiccardoBiosas/awesome-MLSecOps

137 viewsedited 15:14

Вот почему так, вот берешь любую книгу где написано Professional и там просто Эверест страниц ))))

86 views20:52

This media is not supported in your browser

VIEW IN TELEGRAM

🌐

🌐

🌐Концепт здания около Лахта-Центра, вообще мощь, очень круто.

Please open Telegram to view this post

VIEW IN TELEGRAM

85 views14:20

https://events.yandex.ru/events/bdui-conf-22-06-24/event/index?m-message-key-id=2386907810057879552&m-message-click-id=8308800b-b14b-4f31-a657-da1b18a49d62&utm_source=letter&utm_medium=yfd&utm_campaign=bdui_2024&utm_content=mobile&utm_term=1006

Yandex BDUI Conf

Yandex BDUI Conf — первая конференция от Яндекса и Яндекс Маркета для всех, кому интересны BDUI/SDUI.

60 views15:33

https://zapier.com/blog/best-llm/#grok - Список самых модных сетей в 2024 году.

The best large language models (LLMs) in 2026

There are dozens of major LLMs, and hundreds that are arguably significant for some reason or other. These are 14 of the best LLMs available now.

60 views07:32

https://github.com/RiccardoBiosas/awesome-MLSecOps

GitHub - RiccardoBiosas/awesome-MLSecOps: A curated list of MLSecOps tools, articles and other resources on security applied to…

A curated list of MLSecOps tools, articles and other resources on security applied to Machine Learning and MLOps systems. - RiccardoBiosas/awesome-MLSecOps

60 views07:36

https://lumalabs.ai/dream-machine - Sora больше не нужна, теперь есть Luma

55 views06:52