Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.7K subscribers
2.25K photos
113 videos
64 files
4.67K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
Как рассчитать точность прогноза, используя матрицу ошибок?

В матрице ошибок есть значения для общего количества данных, истинных значений и прогнозируемых значений.
#вопросы_с_собеседований
👍6
Если вы собираетесь переходить в сферу Data Science, вам обязательно стоит начать вспоминать или изучать с нуля вышмат.

Начать с бесплатного демо-доступа можно здесь – https://proglib.io/w/d3978686

Сейчас лучшее время для начала обучения, потому что только до 31 июля у Proglib Academy скидка 33% на любой тариф – https://proglib.io/w/3925c76a

🔹 Доступ к курсу – бессрочный

🔹 Преподаватели – кандидаты физико-математических наук

Оставить заявку на консультацию или купить со скидкой 33% – https://proglib.io/w/3925c76a
👍2👾1
Облачная платформа Nvidia DGX теперь доступна и предлагает мгновенный доступ к генеративной инфраструктуре искусственного интеллекта

Nvidia объявила о широкой доступности Nvidia DGX Cloud, предоставляя компаниям доступ к тысячам графических процессоров в Oracle Cloud Infrastructure и собственным облачным серверам.

Читать статью
👍4
Психология ChatGPT

Сообщение в блоге исследователя продуктов из Microsoft, который исследует алгоритмические предубеждения ChatGPT.

Читать статью
😁1
Очередной #дайджест по Python:

✍️ python-mastery: продвинутое владение Python
Курс по продвинутому программированию на Python, основанный на упражнениях, который был протестирован несколько сотен раз в рамках корпоративного обучения на протяжении более десяти лет.

✍️ Как Netflix выполняет отказоустойчивость всего за 7 минут
Netflix сократил время, необходимое для реагирования на сбой, с 45 минут до семи без каких-либо дополнительных затрат. В этой статье рассказывается о том, как они осуществляют горячую замену процессов и резервируют вычислительное время, чтобы обеспечить быстрое реагирование на сбои.

✍️ Вкус итерации в Python
Любой объект, реализующий интерфейс итератора, можно использовать в цикле for, но как это работает? В этой статье показано, как используется протокол итератора и как можно писать собственные совместимые объекты.

✍️ Практическое руководство по метапрограммированию в Python
Эта статья представляет собой общий обзор различных типов метапрограммирования, доступных в Python, включая декораторы, метаклассы, встроенные ключевые слова самоанализа и динамическую генерацию кода.

✍️ Практическое руководство по метапрограммированию в Python
Эта статья представляет собой общий обзор различных типов метапрограммирования, доступных в Python, включая декораторы, метаклассы, встроенные ключевые слова самоанализа и динамическую генерацию кода.
👍61
Разбираем особенности алгоритмов CatBoost и LightGBM: какой от них профит

Статья про особенности алгоритмов CatBoost и LightGBM. Для чего они нужны, в чём их фишки и как они облегчают нам работу с данными.

Читать статью
👍5
В каких задачах оглупел ChatGPT и как это исправить

В относительно короткой истории программного обеспечения немало примеров, когда разработчикам удавалось настолько ухудшить продукты, что теми переставали пользоваться. Например, Windows ME (2000) или RealPlayer. Возможно, сейчас на эти старые «грабли» наступила и компания OpenAi. В результате последних обновлений ChatGPT-4 стал работать объективно хуже, что подтверждается не только жалобами на Reddit, но и результатами научного исследования специалистов из Стэнфордского университета в Беркли.

Читать статью
👍72
Forwarded from Библиотека программиста | программирование, кодинг, разработка
🐍 Самоучитель по Python для начинающих. Часть 25: Основы анализа данных с Pandas

Покажем основные приемы работы с DataFrame и Series, которые нужно знать начинающему дата-аналитику. В конце статьи – 10 мини-проектов по анализу и визуализации многомерных данных.

🔗 Основной сайт
🔗 Зеркало
🔥3
Кто еще не подписан на наш главный канал — очень рекомендуем!

В «Библиотеке программиста» вас ждут фундаментальные IT-темы, Git, рынок труда, главные новости и, конечно же, мемы😎

Вот вам топ недавних постов:
🔍про коммиты в ветках Git
🔍новость о создании сверхразумного ИИ
🔍подборка инфографик на фундаментальные темы
🔍дайджест нейросетей для разработки

👉Подписаться👈
1
Что такое аугментация данных? Можете привести примеры?

Под аугментацией данных понимается увеличение выборки данных для обучения через модификацию существующих данных. Компьютерное зрение — одна из областей, где очень полезно увеличение объема данных. Есть много модификаций, которые мы можем сделать с изображениями:

— Изменить размер
— Горизонтально или вертикально перевернуть
— Добавить шум
— Деформировать
— Изменить цвета
#вопросы_с_собеседований
👍7
🐍🎸 Курс Django. Часть 1: Django — что это? Обзор и установка фреймворка, структура проекта

Рассмотрим особенности, принцип работы, плюсы и минусы Django. Покажем, как установить фреймворк в виртуальное окружение, создать, настроить и запустить первый проект.

🔗 Основной сайт
🔗 Зеркало
👍41
Что мы знаем о LLM (учебник)

Если оставить в стороне безумие толпы, стоит задуматься о том, что мы конкретно знаем о LLM на данный момент и как эти идеи вызвали недавний энтузиазм про ИИ. Это поможет оценить актуальность текущих исследований и возможности.

Читать статью
👍4🔥1
Нейронные сети, графы и эмерджентность

Автор пробует осветить некоторые интересные области науки, с которыми он сталкивался в контексте работы с нейронными сетями, и найти между ними взаимосвязь. Данная статья не претендует на истину в последней инстанции и является всего лишь попыткой посмотреть на нейронные сети под другим углом.

Читать статью
4👍1
Очередной #дайджест по Python:

✍️ Монетизация фреймворков
Маленькая заметка о монетизации aiogram.

✍️ Протоколы в Python
Обучающий материал о протоколах, сравнение абстрактных базовых классов и протоколов, подтипизация на практике.

✍️ Книга по Open Source процессору спутниковой интерферометрии PyGMTSAR (Python InSAR)
Необычная статья от харизматичного автора.

✍️ Аналитика небольших данных: как совместить Excel, Python и SQL с помощью инструментов с открытым исходным кодом

✍️ Пример уменьшения размерности данных с помощью линейных и нелинейных методов в Python
По мере того, как данные растут и становятся более сложными, извлекать информацию становится все труднее, а визуализация становится более накладной. Методы уменьшения размерности данных решают эту проблему, предоставляя меньшее количество измерений (столбцов) при сохранении наиболее важной информации. Мы можем потерять некоторые детали, но получить более простое представление данных, которое легче обрабатывать и сравнивать.
🔥3👍1
Про какой учебный проект вы рассказывали/показывали его на первом собеседовании?
#интерактив
Комплексные приложения для работы с данными с SQL и Jupyter

Этот всеобъемлющий курс дает пошаговое введение в создание приложений для работы с данными с использованием блокнотов Python, SQL и Jupyter. Он даже включает в себя введение в визуализацию с использованием plotly и других.

Читать курс
В чем разница между машинным обучением с учителем и без учителя?

Для обучения с учителем требуются данные, помеченные для обучения. Например, чтобы провести классификацию (задача обучения с учителем), вам нужно сначала пометить данные, которые вы будете использовать для обучения модели, для классификации данных по помеченным группам; в то же время обучение без учителя не требует явной маркировки данных.
#вопросы_с_собеседований
👍1
Более простой метод обучения управлению роботом

Исследователи из Массачусетского технологического института и Стэнфорда создали метод машинного обучения, который может создать контроллер для робота, дрона или автономного транспортного средства, более эффективный, чем другие методы.

Читать статью
👍3
Forwarded from Библиотека программиста | программирование, кодинг, разработка
📖 ТОП-10 книг, без которых не обойтись ни одному программисту

Мы подготовили для вас подборку из 10 книг, без которых не обойтись ни одному профессионалу в IT. Эти книги станут для вас настольными на долгие годы.

🔗 Основной сайт
🔗 Зеркало
👍31