DenoiseLAB

SQL в Фокусе: Полное Руководство. 100 ключевых Вопросов с собеседований. Часть 2.

https://uproger.com/sql-v-fokuse-polnoe-rukovodstvo-100-klyuchevyh-voprosov-s-sobesedovanij-chast-2/

UPROGER | Программирование

SQL в Фокусе: Полное Руководство. 100 ключевых Вопросов с собеседований. Часть 2.

Добро пожаловать во вторую часть нашего увлекательного путеводителя миром SQL! Если вы уже ознакомились с первой частью и узнали много интересного о языке структурированных запросов, то готовьтесь к новой порции знаний. Мы продолжаем исследование SQL через…

55 views11:47

DenoiseLAB

#AD #Pentest #Kerberos

Страшный сон всех доменных администраторов, позволяет быстро и просто подняться в домене:

https://github.com/CICADA8-Research/RemoteKrbRelay

GitHub

GitHub - CICADA8-Research/RemoteKrbRelay: Remote Kerberos Relay made easy! Advanced Kerberos Relay Framework

Remote Kerberos Relay made easy! Advanced Kerberos Relay Framework - CICADA8-Research/RemoteKrbRelay

52 views08:02

DenoiseLAB

PromptBench - это основанный на Pytorch пакет Python для оценки больших языковых моделей (LLM). Он предоставляет удобные API для исследователей, чтобы проводить оценку LLM.

🖥Code: https://github.com/microsoft/promptbench

🌟Docs: https://promptbench.readthedocs.io/en/latest/

📚Paper: https://arxiv.org/abs/2312.07910v1

⚡️Dataset: https://paperswithcode.com/dataset/mmlu+

GitHub

GitHub - microsoft/promptbench: A unified evaluation framework for large language models

A unified evaluation framework for large language models - microsoft/promptbench

68 views08:03

DenoiseLAB

https://www.prometall.info/intrigi/trendi/metallurgi_uchatsya_ii

www.prometall.info

Металлурги учатся ИИ

Искусственный интеллект важен для металлургов, он значительно повышает промышленную безопасность, снижая риски при работе с опасными материалами. Например, системы компьютерного зрения могут предотвратить пролив металлов в электролизном производстве алюминия…

63 views08:04

DenoiseLAB

https://osf.io/preprints/psyarxiv/mp27q - когда файнтюн модели пошел слегка не по плану, упс...

61 views09:24

DenoiseLAB

OpenMathInstruct-1 — это набор данных для настройки математических инструкций, содержащий 1,8 миллиона пар «задача-решение», созданный с использованием лицензированной модели Mixtral-8x7B.

▪️Dataset: https://huggingface.co/datasets/nvidia/OpenMathInstruct-1

▪️Paper: https://huggingface.co/papers/2402.10176

huggingface.co

nvidia/OpenMathInstruct-1 · Datasets at Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

55 views07:01

DenoiseLAB

PDD — это новая автоматическая метрика, предназначенная для количественной оценки расхождения в дискурсе между двумя длинными статьями. Он разделяет предложения статьи на несколько ячеек позиций и вычисляет расхождение в структурах дискурса внутри каждой ячейки.

🖥Github: https://github.com/williamlyh/pos_div_metric

📕Paper: https://arxiv.org/pdf/2402.10175v1.pdf

🔥Dataset: https://paperswithcode.com/dataset/recipe1m-1

✨Tasks: https://paperswithcode.com/task/coherence-evaluation

GitHub

GitHub - williamLyh/pos_div_metric

Contribute to williamLyh/pos_div_metric development by creating an account on GitHub.

61 views07:02

DenoiseLAB

https://cloud.vk.com/events/vebinar-kak-rabotat-s-kubernetes-i-ne-tratit-lishnego/?utm_campaign=kak_rabotat_s_kubernetes_i_ne_tratit_lishnego_2507&utm_medium=email&utm_source=email_inv_2_notopnotcl

Вебинар: Как работать с Kubernetes и не тратить лишнего? | VK Cloud

Приглашаем на вебинар «Как работать с Kubernetes и не тратить лишнего?» от VK Cloud. Расскажем о некоторых принципах экономной работы с Kubernetes и как оптимизировать расходы на уровне кластера, архитектуры, оркестратора и сторонних решений.

62 views10:34

DenoiseLAB

https://selectel.ru/blog/events/create-mlops-cv/?utm_source=telegram&utm_medium=referral&utm_campaign=events_mlops-cv_0724_meetup_today_paid

Академия Selectel

Как построить MLOps-конвейер для CV-проекта в облаке - Академия Selectel

Обсудим особенности запуска в продакшен ML-проектов с точки зрения провайдера инфраструктуры для ML, MLOps-инженера и Data Scientist.

56 views19:01

DenoiseLAB

https://habr.com/ru/companies/bothub/news/829754/

Хабр

DeepL представляет новую модель ИИ, превосходящую GPT-4 в переводе и редактировании

Компания DeepL, известная своими передовыми технологиями машинного перевода, представила новую модель ИИ, которая, по ее утверждению, превосходит даже GPT-4 в качестве перевода и редактирования...

55 views19:19

DenoiseLAB

https://habr.com/ru/companies/bothub/news/829596/

Хабр

Хакеры слили терабайт внутренних данных Disney, протестуя против политики компании в отношении ИИ

Группа хакеров, называющая себя Nullbulge, заявила, что получила доступ к внутренним данным Disney и опубликовала более терабайта информации, включая переписки сотрудников, программный код,...

😢1

62 views19:21

DenoiseLAB

Новый фреймворк предназначенный для диффузионных моделей (например, SD) для создания изображений с любым разрешением и соотношением сторон. В отличие от других методов генерации с заданным разрешениями, которые обрабатывают изображения с последующей обработкой, ResAdapter напрямую генерирует изображения с заданным разрешением.

▪️page: https://res-adapter.github.io
▪️paper: https://arxiv.org/abs/2403.02084
▪️code: https://github.com/bytedance/res-adapter

Machinelearning

Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri

71 views06:55

DenoiseLAB

https://habr.com/ru/companies/bothub/news/829652/

Хабр

Японские СМИ обвиняют AI-поиск в нарушении авторских прав

Японские издатели и редакторы обеспокоены тем, что Google и Microsoft в погоне за развитием искусственного интеллекта забывают об авторском праве. Ассоциация JNPEA выступила с заявлением, в котором...

68 views08:50

DenoiseLAB

Это шедеврально ))))

👍4

73 views13:48

DenoiseLAB

https://arxiv.org/abs/2406.10162

Как мы знаем, один из основных этапов обучения LLM – это RL в каком-то его проявлении. Так вот выяснилось, что если во время RL модель обучать в сложной игровой среде, то она может случайно научиться читерить, вместо того, чтобы учиться выполнять те действия, которые подразумевались разработчиком.

В числе прочего модель может даже взломать собственную ревард-модель (внимание на картинку). Для справки: эта тоже обучаемая модель, которая оценивает текущую политику LLM, они работают как бы в связке. Так вот вместо того, чтобы прилежно учиться по ревард-модели, LLM просто взяла и... натаскала ее так, чтобы та всегда выдавала высший балл.

Также модель может обобщать и другие игровые процессы. Она как будто понимает, что от нее хотят, и тем самым в итоге ломает сам механизм игровой среды.

arXiv.org

Sycophancy to Subterfuge: Investigating Reward-Tampering in Large...

In reinforcement learning, specification gaming occurs when AI systems learn undesired behaviors that are highly rewarded due to misspecified training goals. Specification gaming can range from...

77 views22:55

DenoiseLAB

https://arxiv.org/pdf/2407.13313 - новая попытка чуть более точнее предсказать временные ряды, в целом весьма неплохой подход. Исследуется степень, в которой эффективность выявления связей сочетается с высокой сортируемостью данных, при этом используются имитационные данные на основе моделей SVAR и графиков Эрдеша-Реньи.

69 views08:05

Красивый ролик от Deep Mind о том как идет обучение модели и предсказание. Красиво, но ничего не понятно ))))

🦄1

66 views09:09

DenoiseLAB

Пакет с пакетами ))))

59 views17:06

DenoiseLAB

❓300 Вопросов по Машинному обучению (Machine Learning) - Вопрос_225

🟡 Что такое синтетические данные в рамках машинного обучения ? (Часть_2)

⚪️Ответ:

2. Тестирование и оценка моделей:
- Синтетические данные можно использовать для тестирования моделей в контролируемых условиях. Это позволяет проверять модели на специфических сценариях, которые могут быть сложно воспроизвести в реальном мире.
- Синтетические данные также помогают при оценке устойчивости моделей к различным источникам шума и искажений.

#MachineLearning #SyntheticData #DataGeneration #DataAugmentation #PrivacyPreservation #ModelTesting #BalancedDatasets #TransferLearning #DataScience #ArtificialIntelligence

63 views07:00

👍 2 👎🤔

DenoiseLAB

🔄🔄🔄https://huggingface.co/datasets/proj-persona/PersonaHub - первый датасет на полностью синтетических данных, пока что у нему относятся с осторожность но все же это реальный прорыв. Сейчас ждем долгую адаптацию и тестирование на различных платформах, но все же это прорыв. Данные пока не столь точны, они полны галлюцинаций и вообще весьма сомнительны, но первый кирпичь уже заложен.

57 views07:00

👍 1 👎🤔

DenoiseLAB

❓300 Вопросов по Машинному обучению (Machine Learning) - Вопрос_225

🟡 Что такое синтетические данные в рамках машинного обучения ? (Часть_1)

⚪️Ответ: Синтетические данные - это искусственно созданные данные, которые имитируют характеристики реальных данных. Они широко используются в машинном обучении для решения различных задач:

1. Создание обучающих наборов данных:
- Реальных данных часто недостаточно для эффективного обучения моделей машинного обучения.
- Синтетические данные позволяют увеличить размер обучающей выборки и добавить разнообразия.

#MachineLearning #SyntheticData #DataGeneration #DataAugmentation #PrivacyPreservation #ModelTesting #BalancedDatasets #TransferLearning #DataScience #ArtificialIntelligence

63 views08:00

👍 1 👎🤔

About

Blog

Apps

Platform