ML&|Sec Feed

InterpretML позволяет интерпретировать и объяснить работу конкретных ML-пайплайнов

— pip install interpret

Цель InterpretML — сделать ML более понятным, чтобы работать с какими-то алгоритмами и пайплайнами, как с чёрным ящиком.
Поддерживает обучение специальных интерпретируемых моделей (glassbox), а также объяснение существующих конвейеров ML (blackbox).

🖥

GitHub

🟡

Доки

@data_analysis_ml

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

24 views11:10

ML&|Sec Feed

Forwarded from Анализ данных (Data analysis)

🌟

Apache TVM — компиляция ML-моделей для любых аппаратных характеристик

Apache TVM — это фреймворк компилятора ML-приложений с открытым исходным кодом для CPU, GPU и не только.
Цель Apache TVM — дать ML-инженерам возможность оптимизировать и эффективно выполнять вычисления на любом железе.

🖥

GitHub

🟡

Доки

@data_analysis_ml

Please open Telegram to view this post

VIEW IN TELEGRAM

22 views11:10

ML&|Sec Feed

Forwarded from Рестарт

А вот это реально очень полезно — учёные Сбера и лаборатории FusionBrain Института AIRI нашли способ ускорить работу больших языковых нейросетей на 10-15%.

И это все без потери качества. Исследователи изучили устройство 20 известных open source языковых моделей и выяснили, что между эмбеддингами (числовые представления данных) есть высокая линейная зависимость. Как следствие, это позволяет существенно оптимизировать архитектуры.

«Мы, в Сбере, планируем провести тестирование рассмотренной идеи и в случае успеха — тиражировать её на флагманские модели GenAI. Поиск таких смекалок в AI-архитектурах позволяет частично компенсировать вычислительный голод, поэтому продолжим поддержку таких исследований в направлении обучения больших моделей» — рассказал Андрей Белевцев, старший вице-президент, руководитель блока «Технологическое развитие» Сбербанка.

22 views11:10

ML&|Sec Feed

Forwarded from Boris Protoss

https://arxiv.org/abs/2405.12250

arXiv.org

Your Transformer is Secretly Linear

This paper reveals a novel linear characteristic exclusive to transformer decoders, including models such as GPT, LLaMA, OPT, BLOOM and others. We analyze embedding transformations between...

24 views11:10

ML&|Sec Feed

свежий обзор про ml в иб

https://www.tandfonline.com/doi/pdf/10.1080/23311916.2023.2272358

23 views11:11

ML&|Sec Feed

Forwarded from Анализ данных (Data analysis)

⚡️ Новая лекция Ян Лекуна : «Объектно-ориентированный ИИ: на пути к машинам, которые могут учиться, рассуждать и планировать»

Слайды: https://drive.google.com/file/d/1e6EtQPQMCreP3pwi5E9kKRsVs2NbWPrY/view?usp=drivesdk
Видео: https://www.youtube.com/watch?si=UeLf0MhMzjXcSCAb&v=d_bdU3LsLzE&feature=youtu.be

@data_analysis_ml

27 views11:12

ML&|Sec Feed

Channel photo updated

11:15

ML&|Sec Feed

Forwarded from Data Secrets

Nvidia опубликовала веса для своей SOTA модели эмбеддингов NV-Embed-1, а также подробный технический отчет

Итак, NV-Embed – это эмбеддинги на основе Mistral 7B. Вместо обычного усреднения или EOS, которые используют другие методы, здесь для сжатия входов и получения эмбеддингов вводится дополнительный латентный слой внимания.

Обучение: на первом этапе используются QA датасеты, а на втором – размеченные под классификацию, кластеризацию и семантическое сходство. Конечно, как обычно это бывает для эмбеддингов, все учится на contrastive.

Отдельно в отчете отмечено, что большой скачок в качестве дали замешанные с разных тасков батчи (обычно таски смешиваются гомогенно).

По MTEB моделька превосходит все остальные, выбивая почти 70. Идеально для RAG.

27 viewsBoris Protoss, 13:13

ML&|Sec Feed

Forwarded from AISec [x\x feed]🍓🍌🍆 (Artyom Semenov)

41617f22-9aa7-4c71-b7e9-975175d71b52.epub

12.6 MB

25 viewsBoris Protoss, 19:26

ML&|Sec Feed

Forwarded from AISec [x\x feed]🍓🍌🍆 (Artyom Semenov)

30 viewsBoris Protoss, 19:26

ML&|Sec Feed

Forwarded from AISec [x\x feed]🍓🍌🍆 (Artyom Semenov)

Lakera+AI+-+Real+World+LLM+Exploits+(Jan+2024)-min.pdf

4.8 MB

Discover the latest in AI security with Lakera's deep-dive into real-world LLM exploits.

In this document, we present practical challenges and vulnerabilities encountered by the Lakera Red team in the deployment of Large Language Models.

31 viewsBoris Protoss, 20:25

About

Blog

Apps

Platform