Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.8K subscribers
2.25K photos
111 videos
64 files
4.65K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
Как выбрать GPU для машинного обучения

Машинное обучение позволяет компьютерам извлекать данные, находить закономерности и принимать решения на их основе в различных отраслях. Например, в медицине его используют для анализа рентгеновских снимков и МРТ. Автономные транспортные средства с их помощью строят маршруты, а в финансисты прогнозируют рыночные тенденции.

Центральные процессоры не подходят для таких сложных задач из-за отсутствия возможности параллельной обработки данных, длительного времени обучения и ограниченной пропускной способности. Поэтому организации все чаще приобретают графические процессоры или арендуют облачные сервисы с GPU.

В этом материале рассказали, на какие параметры графических ускорителей стоит обращать внимание, если планируете работать с машинным обучением.

Читать статью
👍4🔥2
👨‍💻 9 мифов об IT и найме айтишников

Развеиваем мифы об ИТ-специалистах, их зарплате, востребованности и процессе найма.

🔗 Читать статью
🔗 Зеркало
👍2
Монитор с какой диагональю чаще всего используете на работе?
#интерактив
👍1
Создание изображения в Python

Чтобы создать новое изображение с помощью библиотеки Python Pillow PIL, используйте метод Image.nеw().

В этом примере мы создаем новое изображение в режиме RGB с размером (200, 200).

Мы не будем указывать цвет, поэтому методы new() считают значение цвета по умолчанию 0 – для каналов RGB будет черным цветом.

Подробнее с методом можно ознакомиться здесь.
#код
👍3
Очередной #дайджест по Python:

✍️ Как мы заинжектили кнопку на Behance
Как появился python‑модуль behance‑py, который, если верить статистике с pepy.tech, имеет более 5 тысяч установок и расширение для Chrome, о котором более подробно в статье.

✍️ “Ну и долго мне ещё до магазина?” Или пара слов о геоинформационном анализе с помощью Python
В статье раскрыли тему обработки пространственных данных средствами Python библиотеки estaty.

✍️ Борьба с несбалансированными данными
Почему несбалансированные данные — это такая большая проблема?

✍️ Головоломки на Python: Увлекательный Путь к Мастерству в Программировании
В этой статье автор представляет серию увлекательных головоломок, разработанных для развития навыков программирования на Python.
👍1
Что должен знать каждый разработчик о вычислениях на графическом процессоре

Большинство программистов хорошо разбираются в процессорах и последовательном программировании, поскольку пишут код для процессоров, но многие из них менее знакомы с внутренней работой графических процессоров и с тем, что делает их такими особенными.

Читать статью
🔥2
Китайский стартап в области искусственного интеллекта Zhipu привлекает финансирование в размере 300 миллионов долларов

Китайский разработчик искусственного интеллекта Zhipu с начала года привлек от инвесторов более 2,5 млрд юаней, или 342 млн долларов.

Читать статью
👍3🤯3
Как разработать модель машинного обучения для прогнозирования того, купит ли клиент продукт или нет?

Для разработки модели машинного обучения, которая прогнозирует вероятность покупки продукта клиентом, необходимо обучить модель на данных, содержащих информацию о клиентах, которые уже совершили покупку. После успешного обучения модель можно применять для предсказания поведения новых клиентов в отношении данного продукта.
#вопросы_с_собеседований
👍1
🤖 Напоминаем, что у нас есть еженедельная email-рассылка, посвященная последним новостям и тенденциям в мире искусственного интеллекта.

В ней:
● Новости о прорывных исследованиях в области машинного обучения и нейросетей
● Материалы о применении ИИ в разных сферах
● Статьи об этических аспектах развития технологий
● Подборки лучших онлайн-курсов и лекций по машинному обучению
● Обзоры инструментов и библиотек для разработки нейронных сетей
● Ссылки на репозитории с открытым исходным кодом ИИ-проектов
● Фильмы, сериалы и книги

👉Подписаться👈
👍1👏1
Должен ли дата-инженер использовать Pandas в своем рабочем коде? [Реддит]

Pandas — фантастическая библиотека для чтения наборов данных на ходу и выполнения ежедневных задач по анализу данных. Однако целесообразно ли использовать его в нашем рабочем коде на Python?

Читать статью
👍2
Подрядчики, которых называют специалистами по данным, но которые не могут сделать то, что я от них ожидаю [Reddit]

Меня наняли в качестве старшего члена уже существовавшей команды по анализу данных. Сейчас я руковожу еще несколькими членами команды (которые были там до меня). Все они являются подрядчиками, и их дневная ставка ВЫСОКАЯ. Все они являются учеными-данными и имеют высшее образование. Я старше. Я выполнял множество технических ролей и не совсем уверен, какова моя официальная должность. Я могу заниматься наукой о данных, но на самом деле я просто создаю вещи. В прошлом я занимался разработкой данных, MLOps, DevOps, Cloud и т. д. Я мастер на все руки, но не мастер ни в чем. ...

Читать далее
👍3😁2
🍏Представлены процессоры Apple M3. На что они способны в работе с ИИ?

Презентация прошла сегодня ночью. Обычно Apple не говорит много об искусственном интеллекте, но на этот раз сообщила кое-что интересное. Так, мы узнали, что новый нейронный процессор (Neural Engine) внутри чипсетов M3 стал на 60% быстрее, чем в линейке M1, а данные при обработке хранятся на девайсе, что обеспечивает их защиту. Также Apple подчеркнула, что MacBook теперь оснащены 128 ГБ унифицированной памяти, и это позволяет работать с ещё более крупными Transformer-моделями, содержащими миллиарды параметров.

Цены на новые MacBook Pro с процессорами M3 начинаются с $1600.
🔥102👍2
🤖 25 бесплатных AI-инструментов для разработчиков
ИИ-помощники способны заменить GitHub Copilot, проверить код и даже сделать UX/UI-дизайн. Мы сделали подборку.

🟣 Codeuim
Помогает писать код. Можно опробовать в браузере или установить в качестве расширения в популярные IDE. Поддерживает более 70 языков программирования.
🟣 Codiga
Проверит, проанализирует и отрефакторит ваш код.
🟣 GPT Pilot
Создатели инструмента утверждают, что он позволит ускорить процесс разработки в 20 раз. С помощью GPT Pilot можно пошагово разработать собственное приложение.
🟣 Open Interpreter
Альтернатива официальному плагину Code Interpreter от Open AI. Может управлять браузером Chrome для поиска в интернете.
🟣 GPT-Code-Clippy
А это опенсорсный аналог GitHub Copilot на базе GPT-3.

Ещё 20 инструментов можно найти здесь

О других классных новых инструментах мы писали тут
#дайджест
👍11🔥2👾1
Президент США Джо Байден подписал указ о новых стандартах безопасности искусственного интеллекта. Документ требует, чтобы «разработчики самых мощных систем искусственного интеллекта делились результатами испытаний на безопасность и другой важной информацией с правительством США». Как вы думаете, должно ли государство вмешиваться в область разработки ИИ? Чем это может быть чревато?
😁8👾7👍4