DenoiseLAB – Telegram

DenoiseLAB

484 subscribers

1.33K photos

159 videos

3 files

1.57K links

Блог DenoiseLAB (машинное обучение, аналитика)

Информация в канале служит только для ознакомления и не является призывом к действию. Не нарушайте законы РФ и других стран. Мы не несем отвественность за ваши действия или бездействия.

Download Telegram

About

Blog

Apps

Platform

484 subscribers

✅✅✅Отличный курс по MLOps; состоит из 6 модулей, к каждому модулю прилагается подробный Jupyter Notebook со всей нужной теорией и примерами кода.

🔑🔑🔑https://github.com/DataTalksClub/mlops-zoomcamp/tree/main

175 views07:00

👍 1 👎🤔

⚪️⚪️⚪️Marqo - сквозная система поиска векторов как для текста, так и для изображений. Генерация, хранение и поиск векторов осуществляются с помощью единого API. Нет необходимости использовать собственные вставки.

⚪️⚪️⚪️Одного сходства векторов недостаточно для векторного поиска. Для векторного поиска требуется не только база данных векторов, но и развертывание и управление машинным обучением (ML), предварительная обработка и преобразование входных данных, а также возможность изменять поведение поиска без переобучения модели. Marqo содержит все эти элементы, позволяя разработчикам встроить векторный поиск в свое приложение с минимальными усилиями.

✅✅✅https://github.com/marqo-ai/marqo

72 views08:00

LongRAG: Enhancing Retrieval-Augmented Generation with Long-context LLMs

✅Подкатили апдейт для RAG, теперь он умеет и в длинные тексты, вау. Очень круто.

✅Paper: https://arxiv.org/abs/2406.15319
✅Git: https://github.com/TIGER-AI-Lab/LongRAG/?tab=readme-ov-file
✅Site: https://tiger-ai-lab.github.io/LongRAG/
✅Data: https://huggingface.co/datasets/TIGER-Lab/LongRAG

Please open Telegram to view this post

VIEW IN TELEGRAM

LongRAG: Enhancing Retrieval-Augmented Generation with Long-context LLMs

In traditional RAG framework, the basic retrieval units are normally short. The common retrievers like DPR normally work with 100-word Wikipedia paragraphs. Such a design forces the retriever to...

150 views10:08

Дата центры в совокупности потребляют больше энергии, чем Италия, Испания, и даже Австралия.

Это выяснили аналитики из Bloomberg в новой статье на тему потребление энергии системами ИИ.

Как всегда, Bloomberg отличается интересными сравнениями и яркими графиками. Отличное чтиво на воскресенье.

76 viewsedited 14:07

https://developers.sber.ru/kak-v-sbere/one-day-offer/robotics_jule?utm_source=telegram&utm_medium=fix&utm_campaign=ODO_robotics_july_2024_post&utm_content=&utm_term=techcrunchru&erid=LjN8KbH12

developers.sber.ru

Нам нужны Robotics Software Engineers и Backend Developers

68 views14:54

🗣🗣🗣"PyWinAssistant" - это первый фреймворк искусственного узкого интеллекта для Windows 10/11 с открытым исходным кодом (выпущен 31 декабря 2023 года, до выхода документа Microsoft VoT) для искусственного содействия любым пользовательским интерфейсам win32api путем использования визуализации мышления (VoT) и пространственных рассуждений в больших языковых моделях без OCR / обнаружения объектов / сегментации.

🗣🗣🗣Это улучшает качество обобщения и минимизирует общее использование данных LLM и моделей зрения. Он имеет встроенные опции помощи для улучшения использования компьютера человеком, с новым техническим подходом к помощи и тестированию пользовательского интерфейса и пользовательского опыта с помощью пространственной визуализации мышления, правильно обобщает любые подсказки на естественном языке и планирует выполнение правильных действий в ОС с учетом требований безопасности.

🔎🔎🔎https://github.com/a-real-ai/pywinassistant

75 views07:00

👍 1 👎 1 🤔

🖥 SQL генератор

Выпущена Sqlcode 8b на базе Llama-3!

Вероятно, это лучшая на данный момент модель размером <10B для преобразования текста в SQL.

Работает лучше, чем gpt-4-turbo и claude opus для генерации SQL запросов.

▪️Github: https://github.com/defog-ai/sql-eval
▪️Weights: https://huggingface.co/defog/llama-3-sqlcoder-8b/
▪️Demo (optimized for postgres): https://defog.ai/sqlcoder-demo/

81 views08:00

👍 1 👎🤔

https://cybercamp.su/data_security?utm_source=outlook&utm_medium=mail&utm_campaign=ccmeetup&utm_term=base

Митап «Data Security»

Летний онлайн-митап CyberCamp в этом году посвящаем Data Security

75 views12:42

This media is not supported in your browser

VIEW IN TELEGRAM

😂😂😂Когда ты думаешь добавить еще одну фичу в уже и так норм работающую модель, казалось бы что могло пойти не так )))

😁3👍2

81 views14:11

Apple выпустил ИИ-модель MGIE для редактирования изображений

Модель позволяет редактировать изображения при помощи текстовых команд на естественном языке. Доступно как редактирование картинки целиком, так и ее отдельной области. Можно менять яркость, резкость, применять художественные эффекты или менять размер изображения.

https://github.com/apple/ml-mgie

77 views07:00

👍 2 👎🤔

PromptBench - это основанный на Pytorch пакет Python для оценки больших языковых моделей (LLM). Он предоставляет удобные API для исследователей, чтобы проводить оценку LLM.

🖥Code: https://github.com/microsoft/promptbench

🌟Docs: https://promptbench.readthedocs.io/en/latest/

📚Paper: https://arxiv.org/abs/2312.07910v1

⚡️Dataset: https://paperswithcode.com/dataset/mmlu

GitHub - microsoft/promptbench: A unified evaluation framework for large language models

A unified evaluation framework for large language models - microsoft/promptbench

67 views14:25

OpenMathInstruct-1 — это набор данных для настройки математических инструкций, содержащий 1,8 миллиона пар «задача-решение», созданный с использованием лицензированной модели Mixtral-8x7B.

▪️Dataset: https://huggingface.co/datasets/nvidia/OpenMathInstruct-1

▪️Paper: https://huggingface.co/papers/2402.10176

nvidia/OpenMathInstruct-1 · Datasets at Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

56 views14:25

PDD — это новая автоматическая метрика, предназначенная для количественной оценки расхождения в дискурсе между двумя длинными статьями. Он разделяет предложения статьи на несколько ячеек позиций и вычисляет расхождение в структурах дискурса внутри каждой ячейки.

🖥Github: https://github.com/williamlyh/pos_div_metric

📕Paper: https://arxiv.org/pdf/2402.10175v1.pdf

🔥Dataset: https://paperswithcode.com/dataset/recipe1m-1

✨Tasks: https://paperswithcode.com/task/coherence-evaluation

GitHub - williamLyh/pos_div_metric

Contribute to williamLyh/pos_div_metric development by creating an account on GitHub.

65 views14:26

https://arxiv.org/abs/2406.06608 - в документе рассмотрено 58 техник промптинга для текста и 40 для иных модальностей. Все разделено на 6 основных подходов, таких как In-Context Learning (ICL), Zero-Shot, Self-Criticism и др.

Все сопровождается тестами на бенчмарках и, местами, даже доказательствами и строгими определениями. Например, на картинке – дефинишн few-shot промтинга на языке условной вероятности.

Читается легко, встречается много интересных рассуждений и деталей. Однозначно рекомендуем.

The Prompt Report: A Systematic Survey of Prompt Engineering Techniques

Generative Artificial Intelligence (GenAI) systems are increasingly being deployed across diverse industries and research domains. Developers and end-users interact with these systems through the...

67 views11:45

SQL в Фокусе: Полное Руководство. 100 ключевых Вопросов с собеседований. Часть 1.

https://uproger.com/sql-v-fokuse-polnoe-rukovodstvo-s-100-klyuchevymi-voprosami-chast-1/

UPROGER | Программирование

SQL в Фокусе: Полное Руководство. 100 ключевых Вопросов с собеседований. Часть 1.

В этой статье мы разберем основные и продвинутые аспекты языка SQL через 100 ключевых вопросов. Независимо от того, являетесь ли вы начинающим или опытным разработчиком баз данных, здесь вы найдете интересные и полезные аспекты для себя.

Советую посмотреть…

53 views11:47

SQL в Фокусе: Полное Руководство. 100 ключевых Вопросов с собеседований. Часть 2.

https://uproger.com/sql-v-fokuse-polnoe-rukovodstvo-100-klyuchevyh-voprosov-s-sobesedovanij-chast-2/

UPROGER | Программирование

SQL в Фокусе: Полное Руководство. 100 ключевых Вопросов с собеседований. Часть 2.

Добро пожаловать во вторую часть нашего увлекательного путеводителя миром SQL! Если вы уже ознакомились с первой частью и узнали много интересного о языке структурированных запросов, то готовьтесь к новой порции знаний. Мы продолжаем исследование SQL через…

55 views11:47

#AD #Pentest #Kerberos

Страшный сон всех доменных администраторов, позволяет быстро и просто подняться в домене:

https://github.com/CICADA8-Research/RemoteKrbRelay

GitHub - CICADA8-Research/RemoteKrbRelay: Remote Kerberos Relay made easy! Advanced Kerberos Relay Framework

Remote Kerberos Relay made easy! Advanced Kerberos Relay Framework - CICADA8-Research/RemoteKrbRelay

52 views08:02

PromptBench - это основанный на Pytorch пакет Python для оценки больших языковых моделей (LLM). Он предоставляет удобные API для исследователей, чтобы проводить оценку LLM.

🖥Code: https://github.com/microsoft/promptbench

🌟Docs: https://promptbench.readthedocs.io/en/latest/

📚Paper: https://arxiv.org/abs/2312.07910v1

⚡️Dataset: https://paperswithcode.com/dataset/mmlu+

GitHub - microsoft/promptbench: A unified evaluation framework for large language models

A unified evaluation framework for large language models - microsoft/promptbench

68 views08:03

https://www.prometall.info/intrigi/trendi/metallurgi_uchatsya_ii

www.prometall.info

Металлурги учатся ИИ

Искусственный интеллект важен для металлургов, он значительно повышает промышленную безопасность, снижая риски при работе с опасными материалами. Например, системы компьютерного зрения могут предотвратить пролив металлов в электролизном производстве алюминия…

63 views08:04

https://osf.io/preprints/psyarxiv/mp27q - когда файнтюн модели пошел слегка не по плану, упс...

61 views09:24

OpenMathInstruct-1 — это набор данных для настройки математических инструкций, содержащий 1,8 миллиона пар «задача-решение», созданный с использованием лицензированной модели Mixtral-8x7B.

▪️Dataset: https://huggingface.co/datasets/nvidia/OpenMathInstruct-1

▪️Paper: https://huggingface.co/papers/2402.10176

nvidia/OpenMathInstruct-1 · Datasets at Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

55 views07:01