Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.7K subscribers
2.25K photos
113 videos
64 files
4.67K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
Построение горизонтальной гистограммы с помощью seaborn

Слева представлен код для построения гистограммы, справа результат работы нашей программы.
#код
😁6👾2👍1🤯1
Прямой подход

Эмпирические законы масштабирования могут помочь предсказать потерю перекрестной энтропии, связанную с входными данными для обучения, такими как вычисления и данные. Однако, чтобы предсказать, когда ИИ достигнет некоторого субъективного уровня производительности, необходимо разработать способ интерпретации кросс-энтропийной потери модели.

Читать статью
В чем разница между func и func()?

Вопрос должен проверить ваше понимание, что все функции в Python также являются объектами:

def func():
print('Im a function')

func
#=> function __main__.func>
func()
#=> Im a function

func — это представляющий функцию объект, который можно назначить переменной или передать другой функции. Функция func() с круглыми скобками вызывает функцию и возвращает результат.
#вопросы_с_собеседований
👍6
✍️«Библиотека программиста» собирает кейсы использования нейросетей

Какие самые необычные задачи вы выполняли с помощью нейросетей? Может быть, вы просили ИИ пройти тестирование по правилам безопасности или писали с его помощью заявление на увольнение?

Заполняйте форму — лучшие истории появятся в нашей подборке по теме.

👉Ссылка тут👈
Лама с нуля (или как реализовать бумажку без слез)

О реализации значительно уменьшенной версии Llama для обучения TinyShakespeare.

Читать статью
👍6😁1
Функции обработки данных

Этот репозиторий содержит примеры пакетов::functions(), которые обычно используются при обработке данных исследований в области образования.

Открыть репозиторий
👍1
Очередной #дайджест по Python:

🐍 Работа с SQLite в Python (для чайников)
В статье раскрываются все основные аспекты использования SQLite, начиная с установки и создания базы данных, и заканчивая выполнением сложных запросов и управлением транзакциями.

🐍 Обучение YOLOv8s на Google Colab: детектим дорожные знаки
Учимся детектить дорожные знаки, используя YOLOv8.

🐍 Просто добавь команд: как реализовать диалоговый Телеграм бот на основе шаблона
Как быстро создать инфраструктуру для диалогового бота на основе Yandex Serverless Functions и базы данных YDB.

🐍 Разработка событийно-ориентированных микросервисов с помощью Python
О нюансах разработки событийно-ориентированных микросервисов на Python.

🐍 Из пет-проекта в источник дохода: как я создал чат-бот для поиска вакансий
Рассказ о техническом устройстве бота и не только.
3👍2🔥1
Какое мероприятие по разработке вы посещали последним и будете ли на нем в следующий раз?
#интерактив

Кстати, на нашем сайте есть раздел с анонсами мероприятий по программированию.
Самые полезные каналы для программистов в одной подборке!

Сохраняйте себе, чтобы не потерять 💾

🔥Для всех

Библиотека программиста — новости, статьи, досуг, фундаментальные темы
Книги для программистов
IT-мемы

☕️Java

Библиотека джависта — полезные статьи по Java, новости и обучающие материалы
Библиотека Java для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Библиотека задач по Java — код, квизы и тесты
Вакансии для java-разработчиков

👾Data Science

Библиотека Data Science — полезные статьи, новости и обучающие материалы
Библиотека Data Science для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Библиотека задач по Data Science — код, квизы и тесты
Вакансии по Data Science, анализу данных, аналитике, искусственному интеллекту

🧠C++

Библиотека C/C++ разработчика — полезные статьи, новости и обучающие материалы по C++
Библиотека C++ для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Библиотека задач по C++ — код, квизы и тесты
Вакансии по C++

💻Другие профильные каналы

Библиотека фронтендера
Библиотека шарписта
Библиотека Go разработчика
Библиотека мобильного разработчика
Библиотека хакера
Библиотека питониста
Библиотека devops’a
Библиотека тестировщика
Библиотека пхпшника

💼Каналы с вакансиями

Вакансии по питону, Django, Flask
Вакансии по фронтенду, джаваскрипт, React, Angular, Vue
Вакансии по C#, .NET, Unity
Вакансии по Go
Вакансии по PHP, Symfony, Laravel
Вакансии по DevOps & SRE
Вакансии для мобильных разработчиков
Вакансии по QA тестированию
InfoSec Jobs — вакансии по информационной безопасности
1🔥1
«Библиотека программиста» в поиске контент-менеджера для ведения телеграм-каналов

Ищем человека, который грамотно пишет, разбирается в контенте и в одной из этих трех тем:
👉Data Science
👉Frontend
👉мобильная разработка

Мы предлагаем частичную занятость и полностью удаленный формат работы — можно совмещать с основной и находиться в любом месте🌴

Подробнее о вакансии и форма для отклика — по ссылке.

Ждем вас в команде!
👍4
Враждебные атаки на выровненные LLM

Документ Deep CS о том, как полноценно пользоваться LLM моделями и обходить ограничения, когда модель отказывается отвечать.

Читать исследование
👍2
Что такое pickle?

Pickle — это модуль сериализации и десериализации объектов в Python.

В примере на картинке мы сериализуем и десериализуем список словарей.
Больше вопросов с собеседований в нашем канале.
#вопросы_с_собеседований
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
🔍Новые каналы по Data Science

Напоминаем про наши новые каналы по Data Science, в которых мы готовимся к собеседованиям проверяем себя на практических задачках — специально для специалистов по Data Science и тех, кто хочет ими стать👨‍🏫

Подписывайтесь:
👉Библиотека собеса по Data Science — тут мы готовимся к интервью
👉Библиотека задач по Data Science — тут решаем задачи, проходим тесты и изучаем код
👍2
Исчерпывающий список моделей генеративного ИИ с открытым исходным кодом в 2023 году

В этом посте рассмотрены самые последние модели генеративного ИИ с открытым исходным кодом, которые демонстрируют постоянно расширяющиеся области применения ИИ: LLaMa, BLOOM, MPT-30B и другие полезные нейронки, о которых вы наверняка не слышали.

Читать статью
🔥1
Catboost

CatBoost — это быстрая, масштабируемая и высокопроизводительная библиотека градиентного бустинга на деревьях решений, используемая для ранжирования, классификации, регрессии и других задач машинного обучения для Python, R, Java, C++. Поддерживает вычисления на CPU и GPU.

В этом примере мы импортируем CatBoostClassifier из catboost и создаем экземпляр классификатора с определенными параметрами. Затем мы обучаем модель на тренировочных данных и метках с помощью метода fit. После обучения мы можем использовать методы predict и predict_proba для получения предсказаний классов и вероятностей соответственно.

Результат работы кода будет зависеть от входных данных. В этом примере используются случайные данные для обучения и тестирования. В реальных ситуациях данные будут отличаться.
#код
👍11
«Библиотека программиста» ищет девушек, работающих в IT — разработке, тестировании, информационной безопасности и других направлениях

Мы проводим новое исследование, посвященное специфике работы женщин в IT — от сложностей и недостатков в работе до гендерных стереотипов.

Пройдите короткий опрос — он анонимный и займет не более 10 минут вашего времени.

Ссылка тут.
👍3
RT-2: Новая модель воплощает видение и язык в действие

DeepMind представила Robotic Transformer 2, новую модель видения-языка-действия (VLA), которая учится как на веб-данных, так и на данных робототехники, и переводит эти знания в обобщенные инструкции для управления роботом.

Читать статью
👍2
Очередной #дайджест по Python:

🐍 Простая нейронная сеть без библиотек и матриц. Обучение с учителем
Автор простым языком описывает свой опыт создания нейросети.

🐍 Гиперпараметрический поиск и оптимизация моделей
При создании моделей машинного обучения существует одна важная составляющая, которая часто остается за кадром, но имеет решающее значение для достижения высокой производительности и точности — это гиперпараметры.

🐍 Как дообучить LLaMA бесплатно и без программирования: как создать тупого друга
В статье показано, как дообучить нейросеть на своих личных диалогах, чтобы создать виртуальную копию чьей-либо личности.

🐍 15+ небанальных ресурсов для начинающего/продолжающего Python-разработчика
Ссылки на не самые известные ресурсы, но довольно полезные.

🐍 Основы парсинга на Python: от Requests до Selenium
Как парсить данные веб-сайтов с помощью Python? Пособие подойдет новичкам и продолжающим.
5👍21