Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Forwarded from Proglib.academy | IT-курсы

2.3K views07:09

✍️ Что такое косинусное сходство (cosine similarity) и какие альтернативные методы существуют?

Cosine similarity используется для оценки сходства двух векторов. В сущности, это косинус угла между двумя векторами. Значения cosine similarity варьируются от -1 до 1. Однако для большинства задач с положительными векторами (например, текстовые данные, векторы признаков), значения лежат в диапазоне от 0 до 1. При этом:

▪️ 1 означает полное совпадение (вектора направлены в одну и ту же сторону).
▪️ 0 указывает на отсутствие сходства (вектора перпендикулярны друг другу).
▪️ -1 указывает на полную противоположность (вектора направлены в противоположные стороны).

Как ещё можно оценивать сходство векторов? Вот некоторые способы:

▫️Евклидово расстояние;
▫️Манхэттенское расстояние;
▫️Расстояние Чебышева.

Подробнее о них и о том, как они применимы в LLM, читайте в статье 👈

2.4K views18:10

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

🧠 Наконец-то ИИ начали применять правильно...

2.3K views07:24

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

👾 Подборка материалов по машинному обучению и анализу данных

🔹An Illustrated Guide to Superlearning
Под Superlearning здесь имеется в виду метод объединение множества отдельных алгоритмов для создания единой модели.

🔹Evaluating and enhancing probabilistic reasoning in language models
В этой статье исследователи Google изучают, способны ли LLM к вероятностному мышлению.

🔹Обзор платформы Kaggle для начинающих: от состязаний до менторской программы

🔹Sabotage Evaluations for Frontier Models
Исследователи из Anthropic пытались понять, могут ли LLM вводить пользователей в заблуждение и манипулировать системами оценок.

2.3K views13:40

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Forwarded from Библиотека задач по Data Science | тесты, код, задания

У нас есть модель линейной регрессии с регуляризацией. Какое влияние оказывает увеличение lambda на смещение и дисперсию?

Anonymous Quiz

18%

Увеличивает смещение, увеличивает дисперсию

47%

Увеличивает смещение, уменьшает дисперсию

22%

Уменьшает смещение, увеличивает дисперсию

13%

Уменьшает смещение, уменьшает дисперсию

426 voters2.0K views18:09

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

🧑‍💻 Статьи для IT: как объяснять и распространять значимые идеи

Напоминаем, что у нас есть бесплатный курс для всех, кто хочет научиться интересно писать — о программировании и в целом.

Что: семь модулей, посвященных написанию, редактированию, иллюстрированию и распространению публикаций.

Для кого: для авторов, копирайтеров и просто программистов, которые хотят научиться интересно рассказывать о своих проектах.

👉Материалы регулярно дополняются, обновляются и корректируются. А еще мы отвечаем на все учебные вопросы в комментариях курса.

2.1K views20:04

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

💻 Внимание: это компьютер, на котором разрабатывался Jupyter

Реддитор рассказал, что является родственником одного из первоначальных разработчиков Jupyter Notebooks и Jupyter lab. Он нашёл этот ПК, когда разбирал кладовку дома.

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

2.0K views07:14

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Forwarded from Библиотека нейросетей | ChatGPT, Midjourney, DeepSeek, Sora

⚡️Разыгрываем флагманский смартфон

«Библиотека программиста» разыгрывает один из трех смартфонов на выбор:
🔹Samsung Galaxy S24 Ultra на 1 ТБ
🔹Xiaomi 14 Ultra на 512 ГБ
🔹iPhone 16 Pro Max на 512 ГБ

🔥 А еще 99 участников розыгрыша получат скидку 50% на наш курс Базовые модели ML и приложения!
Промокод будет действителен до 20 ноября.

Условия просты:
→ подписаться на Библиотека нейротекста
→ подписаться на Библиотека нейрозвука
→ подписаться на Библиотека нейрокартинок
→ нажать на кнопку «Участвовать» под этим постом

Итоги появятся 30 октября в 20:00 по московскому времени в нашем канале Библиотека программиста. Затем мы свяжемся с победителем, который сам выберет смартфон. Тем, кто получит промокод, мы вышлем его в течение недели после окончания розыгрыша.

⚠️ Убедитесь, что вам можно написать в личные сообщения или следите за результатами — если мы не сможем с вами связаться, то не сможем и отправить приз. Доставить мы можем только в города России и Беларуси.

1.5K views09:04

Участвовать (272)

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Forwarded from Библиотека мобильного разработчика | Android, iOS, Swift, Retrofit, Moshi, Chuck

😭💰⬆️ Shut up and give my money: как просить повышения зарплаты

Рассказываем, когда и как правильно поднимать вопрос о повышении зарплаты. Проверенные тактики, аргументы и советы.

Углубляемся в вопрос и рассказываем, на основании чего просить повышения и какие аргументы использовать, а главное — какие доводы точно не подойдут.

📖 Читать статью
📖 Зеркало

2.0K views18:06

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

🖥

Что там с драйверами NVIDIA?

Вчера пользователи из РФ стали жаловаться на то, что не могут скачать драйвера для видеокарт с сайта NVIDIA. При попытке сделать это появлялось сообщение о запрете доступа: «Access Forbidden. This request has been blocked by Edgecast WAF». С VPN всё работало без ограничений. О схожих проблемах говорили пользователи из Беларуси.

🎉 Сегодня появилась информация о том, что возможность скачивать драйвера из РФ вернулась. VPN при этом включать не надо. Вероятно, проблема объясняется сбоем.

💬

А у вас нормально скачиваются драйвера?

👍 — да, всё ок
🤔 — кажется, нет

Please open Telegram to view this post

VIEW IN TELEGRAM

2.2K views07:01

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

🚀⬆️ Оптимизируй свой AI: разоблачение 6 мифов о работе с векторами в Pgvector

Шесть заблуждений, которые мешают тебе использовать всю мощь векторных баз данных в AI. Развенчав эти мифы, ты сможешь раскрыть истинный потенциал векторов и значительно повысить эффективность твоих AI-проектов.

👉

Читать статью

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

11.7K views11:05

About

Blog

Apps

Platform