DenoiseLAB

🥵

🥵Когда у тебя "лютый" дедлайн, но в целом все идет по плану )))

Please open Telegram to view this post

VIEW IN TELEGRAM

54 viewsedited 12:01

DenoiseLAB

https://ib-bank.ru/secural/regtimes?utm_medium=email&utm_source=Unisender&utm_campaign=v10.09

51 views12:21

DenoiseLAB

https://cedrusdata.timepad.ru/event/2754553/?mindbox-message-key=8546706200166137856&mindbox-click-id=71c18275-503e-4501-adb3-a8b84ca4042c&utm_refcode=98429aa730f2c62446a05263859fd0605ff2eb24

cedrusdata.timepad.ru

Trino Meetup #2: Trino в Тинькофф, и как ускорить чтение из Data Lake с помощью кэширования / События на TimePad.ru

Обсудим, как Тинькофф использует Trino в своей аналитической платформе, и рассмотрим различные способы ускорения работы с озерами данных с помощью кэширования на примере решений Alluxio, Starburst Warp Speed (ex-Varada) и CedrusData.

Митап организован компанией…

47 views14:03

DenoiseLAB

❓200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_205

🔠Что такое SpanBERT ? (Часть_2)

SpanBERT был разработан для улучшения предварительного обучения, так как многие задачи обработки естественного языка (NLP) требуют логического вывода о отношениях между двумя или более интервалами текста.

Например, в задачах извлечения ответов на вопросы (extractive question answering) определение того, что "Denver Broncos" является типом "NFL team", критически важно для ответа на вопрос "Какой NFL команде выиграл Супербоул 50?"

https://boosty.to/denoise_lab/donate - поддержать наш канал.

#DeepLearning #NeuralNetworks #NaturalLanguageProcessing #SequenceModeling #ModelArchitecture #LongRangeDependencies #TextGeneration

49 views07:00

👍 1 👎🤔💬

DenoiseLAB

❓200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_205

🔠Что такое SpanBERT ? (Часть_3)

SpanBERT показал значительные улучшения в задачах выбора интервалов, таких как ответы на вопросы и разрешение кореференций, и достиг новых результатов в этих задачах. Например, с теми же данными обучения и размером модели, как у BERT-large, SpanBERT получил 94,6% F1 на SQuAD 1.1 и 88,7% F1 на SQuAD 2.0 соответственно.

Также SpanBERT достиг нового лучшего результата на задаче разрешения кореференций OntoNotes (79,6% F1) и показал хорошую производительность на бенчмарке TACRED для извлечения отношений

https://boosty.to/denoise_lab/donate - поддержать наш канал.

#DeepLearning #NeuralNetworks #NaturalLanguageProcessing #SequenceModeling #ModelArchitecture #LongRangeDependencies #TextGeneration

57 views08:00

👍 2 👎🤔💬

DenoiseLAB

https://www.ptsecurity.com/ru-ru/research/webinar/pt-ngfw-za-steklom-ehtap-4-zheleznyj-vypusk/?utm_source=timepad&utm_medium=email&utm_campaign=pt_ngfw_webinar_22_02_2024

ptsecurity.com

Вебинары Positive Technologies

Мы продолжаем в прямом эфире рассказывать о создании самого производительного российского межсетевого экрана. В предыдущих выпусках говорили о том, как пишем код. Но для большинства межсетевой экран — это не программа, а законченное решение, конечная производительность…

63 views10:04

DenoiseLAB

WAQI - мировой индекс качества воздуха. Мониторится в режиме реального времени.

https://waqi.info/

waqi.info

World's Air Pollution: Real-time Air Quality Index

How polluted is the air today? Check out the real-time air pollution map, for more than 80 countries.

61 views18:50

DenoiseLAB

🅰️

🅰️Часто по работе приходится сталкиваться с генерацией "липовых" почтовых ящиков для не самых нужных функций. Вот собрал список вам, может тоже окажется полезным.

• Jaz mail
• InstAddr
• Erine.email
• Maildrop
• Mailsac
• Anonbox
• Inboxes
• Mailcatch
• Mailpro
• Tempmail
• Emailfake
• Tempr.email
• Email Generator
• Yopmail
• One Off
• Moakt
• 33Mail
• 10-минутная почта
• Emaildrop
• FakeMail
• Tempinbox
• TemporaryMail
• Mailinator
• Dispostable
• GuerrillaMail
• Email On Deck
• Crazy Mailing
• Mohmal
• Trash-mail

Please open Telegram to view this post

VIEW IN TELEGRAM

m.kuku.lu

InstAddr - Instant Email Address

Multipurpose free email addresses. Any number of addresses at one time, no limits. No need to register either.

48 views22:04

DenoiseLAB

🔤Последнее время читаю вот эту книжку, в целом написано неплохо, но больше напоминает, чью-то диссертацию с кучей отсылок и рассуждений на разные темы. В целом есть много хороших рецептов по работе с моделями и настройке гиперпарамметров.

🔤К чему это все, сейчас начинаю пополнять бусты и выкладывать готовый код, так как его накопилось уже просто уйма, там и готовые модели и анализ, так что открываем серию "готовый код в прод". Следите за обновлениями, и начинаем постить на регулярной основе.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍1

50 viewsedited 06:15

DenoiseLAB

🔤На текущий момент я занят разбором вот этого сервиса: https://gpt.h2o.ai/, "перелапачиваю" просто тонну информации для статьи, скоро она выйдет на Хабре, будет и анонс и полное раскрытие таска.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍1

42 views06:21

DenoiseLAB

❓200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_206

Как SpanBERT использует новый подход к обучению границ интервалов (Span-Boundary Objective, SBO)? (Часть_1)

SpanBERT использует новый подход к обучению границ интервалов (Span-Boundary Objective, SBO) для улучшения представления и предсказания интервалов текста. В отличие от стандартного подхода BERT, который маскирует случайные токены, SpanBERT маскирует случайные непрерывные интервалы (spans) текста.

Это позволяет модели учиться предсказывать весь маскированный интервал, используя только контекст, в котором он появляется, без необходимости полагаться на индивидуальные представления токенов внутри него.

https://boosty.to/denoise_lab/donate - поддержать наш канал.

#DeepLearning #NeuralNetworks #NaturalLanguageProcessing #SequenceModeling #ModelArchitecture #LongRangeDependencies #TextGeneration

45 views07:00

👍 1 👎🤔💬

DenoiseLAB

❓200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_206

Как SpanBERT использует новый подход к обучению границ интервалов (Span-Boundary Objective, SBO)? (Часть_2)

SpanBERT также использует дополнительную вспомогательную цель обучения — SBO. Этот новый подход предназначен для предсказания всего маскированного интервала, используя только представления токенов на границе интервала. Это позволяет модели сосредоточиться на контексте, который окружает интервал, и улучшает ее способность предсказывать интервалы текста.

https://boosty.to/denoise_lab/donate - поддержать наш канал.

#DeepLearning #NeuralNetworks #NaturalLanguageProcessing #SequenceModeling #ModelArchitecture #LongRangeDependencies #TextGeneration

49 views08:00

👍 1 👎🤔💬

DenoiseLAB

Незаменимая нейронка для SQL-запросов. Text2sql легко превратит ваш текст в готовый запрос. А если не понимаете, что происходит в запросе — просто закиньте его в специальный раздел и прога подробно его объяснит.

Главная фича — нейронка умеет фиксить ошибки в уже готовых SQL-запросах. Также есть возможность загрузить схему своей базы данных, чтобы ИИ лучше генерила ответы.

Cохраняем себе здесь.

—

@ai_for_web — самые полезные AI-инструменты для веб-мастера

@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.

Text to SQL with AI, in seconds

Save time by letting AI write your SQL code for you. Effortlessly generate optimized SQL queries using your native language.

63 views12:26

DenoiseLAB

❓200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_206

Как SpanBERT использует новый подход к обучению границ интервалов (Span-Boundary Objective, SBO)? (Часть_2)

SpanBERT также отличается от BERT тем, что использует один непрерывный сегмент текста для каждого обучающего примера, вместо двух, как это делает BERT. Это означает, что SpanBERT не использует цель предсказания следующего предложения BERT, что позволяет сосредоточиться на задачах выбора интервалов, таких как ответы на вопросы.

https://boosty.to/denoise_lab/donate - поддержать наш канал.

#DeepLearning #NeuralNetworks #NaturalLanguageProcessing #SequenceModeling #ModelArchitecture #LongRangeDependencies #TextGeneration

49 views07:00

👍 1 👎🤔💬

DenoiseLAB

❓200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_206

🔠Какие еще задачи можно решать с помощью SpanBERT, помимо выбора интервалов?

SpanBERT, помимо задач выбора интервалов, также показывает сильные результаты в следующих задачах обработки естественного языка (NLP):

- Извлечение ответов на вопросы (Question Answering, QA): SpanBERT достигает 94.6% F1 на SQuAD 1.1 и 88.7% F1 на SQuAD 2.0, что является значительным улучшением по сравнению с BERT.

- Разрешение кореференций (Coreference Resolution): SpanBERT устанавливает новый стандарт на задаче разрешения кореференций OntoNotes с 79.6% F1, что является значительным улучшением.

https://boosty.to/denoise_lab/donate - поддержать наш канал.

#DeepLearning #NeuralNetworks #NaturalLanguageProcessing #SequenceModeling #ModelArchitecture #LongRangeDependencies #TextGeneration

46 views08:00

👍 1 👎🤔💬

DenoiseLAB

❓200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_206

🔠Какие еще задачи можно решать с помощью SpanBERT, помимо выбора интервалов? (Часть_2)

- Извлечение отношений (Relation Extraction): На бенчмарке TACRED SpanBERT показывает сильную производительность, что свидетельствует о его эффективности в задачах, связанных с распознаванием и интерпретацией отношений между сущностями в тексте 124.

- GLUE: SpanBERT также демонстрирует улучшения на GLUE, что является набором задач NLP, охватывающих различные аспекты понимания естественного языка, включая классификацию текста, извлечение ответов на вопросы и другие

https://boosty.to/denoise_lab/donate - поддержать наш канал.

#DeepLearning #NeuralNetworks #NaturalLanguageProcessing #SequenceModeling #ModelArchitecture #LongRangeDependencies #TextGeneration

47 views07:00

👍 2 👎🤔💬

DenoiseLAB

❓200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_207

🔠 Какие результаты достигает SpanBERT в задачах извлечения ответов на вопросы (Question Answering, QA)?

- На SQuAD v1.1 SpanBERT достигает F1 score в 91.98, что является улучшением по сравнению с базовым показателем BERT, который составляет 85.49.
- В сравнении с Google BERT, SpanBERT увеличивает F1 score на 3.3%.

Эти результаты показывают, что SpanBERT эффективно улучшает производительность по сравнению с другими моделями BERT, особенно в задачах, где требуется точное выделение и интерпретация текстовых интервалов.

https://boosty.to/denoise_lab/donate - поддержать наш канал.

#DeepLearning #NeuralNetworks #NaturalLanguageProcessing #SequenceModeling #ModelArchitecture #LongRangeDependencies #TextGeneration

51 views08:00

👍 1 👎🤔💬

DenoiseLAB

https://www.computerworld.com/article/3712700/italian-watchdog-says-chatgpt-breached-data-privacy-norms.html

Опять скандал вокруг Open AI, теперь они перешли на заимствование контента )) в грубой форме. Судебные иски вырастают перед их дверьми со скоростью ветра.

На этот раз вляпалась итальянская компания Garante (фирма занимается исследованием соблюдений правил ЕС о конфиденциальности данных различными компаниями и их платформами искусственного интеллекта.), которая обвиняет OpenAI в нарушении норм конфиденциальности данных, установленных ЕС.

OpenAI не ответил на запросы Garante, но получил 30 дней на ответ и подготовку аргументов в свою защиту. Предвидя такой оборот, Garante собрала целевую группы, для окончательного вынесения решения по этому делу. Более того, это далеко не первый случай подобной практики. OpenAI просто забирает контент отовсюду не выплачивая никаких компенсаций правообладателям.

Computerworld

Italian watchdog says ChatGPT breached data privacy norms

Italian watchdog, Garante, which assesses AI platform compliance with EU regulations, has given OpenAI 30 days to respond.

46 views17:48

DenoiseLAB

Mozilla сокращает штат и переориентируется на внедрение «надежного ИИ в Firefox»

Mozilla планирует сократить инвестиции в ряд продуктов, включая VPN, Relay и Online Footprint Scrubber. Mozilla также закроет Hubs, виртуальный 3D-мир, запущенный в 2018 году и сократит инвестиции в свой экземпляр mozilla.social Mastodon. Увольнения коснутся примерно 60 сотрудников.

👉 Как сообщается во внутреннем меморандуме компании, Mozilla сосредоточится на внедрении «надежного ИИ в Firefox». Для этого будут объединены команды, работающие над Pocket, Content и AI/Ml.

В последние годы Mozilla начала расширять свой портфель продуктов, в то время как ее флагманский продукт, браузер Firefox, продолжал терять долю рынка. И хотя организацию часто подвергали за это резкой критике, ее руководство утверждало, что диверсификация портфеля продуктов необходима для обеспечения выживания Mozilla в долгосрочной перспективе. В конце концов, Firefox обеспечивал подавляющую часть доходов Mozilla, но это также означало, что организация по существу зависела от сделок с Google.

Теперь похоже, что Mozilla может снова собирается переориентироваться на Firefox, что наверняка порадует многих поклонников браузера.

55 views19:41

DenoiseLAB

❓200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_208

🔠 Какие библиотеки и инструменты могут использоваться для создания и настройки генераторов фичей?

- Featuretools: Featuretools — это библиотека, которая автоматически генерирует новые признаки из ваших данных. Она может автоматически создавать временные признаки, агрегировать данные и многое другое.

- Category Encoders: Это библиотека для кодирования категориальных переменных в числовые значения, которая предлагает различные методы, такие как OneHotEncoder, OrdinalEncoder и TargetEncoder.

- Statsmodels: Эта библиотека предоставляет статистические модели и методы для работы с временными рядами, что может быть полезно при создании временных признаков.

https://boosty.to/denoise_lab/donate - поддержать наш канал.

#DeepLearning #NeuralNetworks #NaturalLanguageProcessing #SequenceModeling #ModelArchitecture #LongRangeDependencies #TextGeneration

56 views07:00

👍 1 👎🤔💬

About

Blog

Apps

Platform