Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.8K subscribers
2.25K photos
112 videos
64 files
4.66K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
🧑‍💻 Статьи для IT: как объяснять и распространять значимые идеи

Напоминаем, что у нас есть бесплатный курс для всех, кто хочет научиться интересно писать — о программировании и в целом.

Что: семь модулей, посвященных написанию, редактированию, иллюстрированию и распространению публикаций.

Для кого: для авторов, копирайтеров и просто программистов, которые хотят научиться интересно рассказывать о своих проектах.

👉Материалы регулярно дополняются, обновляются и корректируются. А еще мы отвечаем на все учебные вопросы в комментариях курса.
👍2
AI21 Labs привлекает 155 миллионов долларов для ускорения генеративного искусственного интеллекта для предприятий

Израильская компания AI21 Labs, лидер LLM, закрыла финансирование серии C на сумму 155 миллионов долларов, чтобы ускорить рост своих текстовых генеративных услуг искусственного интеллекта для предприятий.

Читать статью
👍1
Что такое нормальное распределение?

График колокола, также известный как нормальное распределение, представляет собой распределение, в котором большинство наблюдений сосредоточены в центре, а по мере удаления от центра количество наблюдений уменьшается. Статистически значимым является то, что при нормальном распределении 68% данных попадают в пределы одного стандартного отклонения от среднего значения, 95% данных — в пределы двух стандартных отклонений, а 99.7% данных — в пределы трех стандартных отклонений от среднего.
#вопросы_с_собеседований
👍12👾3
Как выбрать GPU для машинного обучения

Машинное обучение позволяет компьютерам извлекать данные, находить закономерности и принимать решения на их основе в различных отраслях. Например, в медицине его используют для анализа рентгеновских снимков и МРТ. Автономные транспортные средства с их помощью строят маршруты, а в финансисты прогнозируют рыночные тенденции.

Центральные процессоры не подходят для таких сложных задач из-за отсутствия возможности параллельной обработки данных, длительного времени обучения и ограниченной пропускной способности. Поэтому организации все чаще приобретают графические процессоры или арендуют облачные сервисы с GPU.

В этом материале рассказали, на какие параметры графических ускорителей стоит обращать внимание, если планируете работать с машинным обучением.

Читать статью
👍4🔥2
👨‍💻 9 мифов об IT и найме айтишников

Развеиваем мифы об ИТ-специалистах, их зарплате, востребованности и процессе найма.

🔗 Читать статью
🔗 Зеркало
👍2
Монитор с какой диагональю чаще всего используете на работе?
#интерактив
👍1
Создание изображения в Python

Чтобы создать новое изображение с помощью библиотеки Python Pillow PIL, используйте метод Image.nеw().

В этом примере мы создаем новое изображение в режиме RGB с размером (200, 200).

Мы не будем указывать цвет, поэтому методы new() считают значение цвета по умолчанию 0 – для каналов RGB будет черным цветом.

Подробнее с методом можно ознакомиться здесь.
#код
👍3
Очередной #дайджест по Python:

✍️ Как мы заинжектили кнопку на Behance
Как появился python‑модуль behance‑py, который, если верить статистике с pepy.tech, имеет более 5 тысяч установок и расширение для Chrome, о котором более подробно в статье.

✍️ “Ну и долго мне ещё до магазина?” Или пара слов о геоинформационном анализе с помощью Python
В статье раскрыли тему обработки пространственных данных средствами Python библиотеки estaty.

✍️ Борьба с несбалансированными данными
Почему несбалансированные данные — это такая большая проблема?

✍️ Головоломки на Python: Увлекательный Путь к Мастерству в Программировании
В этой статье автор представляет серию увлекательных головоломок, разработанных для развития навыков программирования на Python.
👍1
Что должен знать каждый разработчик о вычислениях на графическом процессоре

Большинство программистов хорошо разбираются в процессорах и последовательном программировании, поскольку пишут код для процессоров, но многие из них менее знакомы с внутренней работой графических процессоров и с тем, что делает их такими особенными.

Читать статью
🔥2
Китайский стартап в области искусственного интеллекта Zhipu привлекает финансирование в размере 300 миллионов долларов

Китайский разработчик искусственного интеллекта Zhipu с начала года привлек от инвесторов более 2,5 млрд юаней, или 342 млн долларов.

Читать статью
👍3🤯3
Как разработать модель машинного обучения для прогнозирования того, купит ли клиент продукт или нет?

Для разработки модели машинного обучения, которая прогнозирует вероятность покупки продукта клиентом, необходимо обучить модель на данных, содержащих информацию о клиентах, которые уже совершили покупку. После успешного обучения модель можно применять для предсказания поведения новых клиентов в отношении данного продукта.
#вопросы_с_собеседований
👍1
🤖 Напоминаем, что у нас есть еженедельная email-рассылка, посвященная последним новостям и тенденциям в мире искусственного интеллекта.

В ней:
● Новости о прорывных исследованиях в области машинного обучения и нейросетей
● Материалы о применении ИИ в разных сферах
● Статьи об этических аспектах развития технологий
● Подборки лучших онлайн-курсов и лекций по машинному обучению
● Обзоры инструментов и библиотек для разработки нейронных сетей
● Ссылки на репозитории с открытым исходным кодом ИИ-проектов
● Фильмы, сериалы и книги

👉Подписаться👈
👍1👏1
Должен ли дата-инженер использовать Pandas в своем рабочем коде? [Реддит]

Pandas — фантастическая библиотека для чтения наборов данных на ходу и выполнения ежедневных задач по анализу данных. Однако целесообразно ли использовать его в нашем рабочем коде на Python?

Читать статью
👍2