Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.7K subscribers
2.25K photos
113 videos
64 files
4.66K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
🔍 Model Explorer — визуализация архитектуры языковых моделей (LLM)

Этот инструмент помогает понимать, отлаживать и оптимизировать модели машинного обучения. Он позволяет визуализировать большие графы в интуитивной иерархической форме. Впрочем, как отмечают создатели Model Explorer, инструмент хорошо работает и для небольших моделей. Помимо прочего, это можно использовать и для подготовки презентаций (просто посмотрите на прикреплённое к посту видео).

🔗 Ссылка на GitHub-репозиторий Model Explorer
🔗 Читать о возможностях инструмента подробнее
🥰4👍32🔥1
🤯 Итоги недели в мире ИИ и обзоры новых сервисов

У нас вышла новая статья на 📰 по мотивам еженедельной рассылки про последние новости и тенденции в мире ИИ.

Ниже — небольшая выдержка из статьи, а целиком читайте здесь 👈

💬 Новости

🔘Искусственный интеллект помог учёным расшифровать фонетический алфавит кашалотов. Кашалоты общаются с помощью последовательностей щелчков, называемых кодами. Оказалось, что коды имеют структуру.
🔘Канадский стартап Upend запустил ИИ-поисковик, который использует рекордное среди аналогичных сервисов количество LLM — почти 100 — и поддерживает загрузку файлов.
🔘ИИ также помог учёным обнаружить 27000 астероидов, незамеченных на старых изображениях, полученных с телескопов.

🛠 Инструменты

🔘SendFame — создаёт видеоролики со знаменитостями, произносящими заданный текст.
🔘AI Photo Editor — отредактирует фото до неузнаваемости: изменит стиль, добавит детали, заменит фон.
🔘Dreamwave — на основе 5+ изображений сделает серию профессиональных портретов – индивидуальных или групповых.
🔘Profile Picture Maker — генерирует высококачественные фото для профиля (в любом нужном стиле) на основе селфи.

Вы можете подписаться на email-рассылку здесь
Please open Telegram to view this post
VIEW IN TELEGRAM
4
🤔 Как попасть в Data Science, если у вас нет выдающегося резюме?

Старший специалист Elsevier и автор Telegram-канала New Yorko Times Юрий Кашницкий дал несколько рекомендаций начинающим дата-сайентистам. Как же найти работу, если у вас нет/мало опыта?

▪️По мнению Кашницкого, самый простой способ — попробовать попасть в отрасль через знакомых.
▪️Если нетворкинг и общение с людьми — не ваше, то следует постараться набрать хоть какой-то опыт хоть где-то. Кашницкий советует искать сторонние доступные проекты. Например, у Hugging Face есть подобные. К ним может подключиться любой желающий. Кроме того, можно найти команду для прикладного проекта в рамках курса (например, подобное было в курсе ods.ai по MLOps).
▪️Если у вас нет опыта именно в Data Science, но есть опыт в разработке или аналитике, то можно попробовать поучаствовать в DS-проектах на текущей работе.
▪️Кашницкий также рекомендует хорошо оформить резюме.

По его мнению, в поиске работы не помогут набивание титулов типа Kaggle Competitions Master и получение множества сертификатов.
👏9👍2
🎤 Как не облажаться с докладом на IT-конференции

Готовитесь к докладу на IT-конференции? Не хотите оказаться в роли «того самого» докладчика, на которого все жалуются в кулуарах? Узнайте, как не облажаться и сделать свой доклад полезным и запоминающимся.

🔗 Читать статью
🔗 Зеркало
6
🧠 Придумали новый язык для параллельных вычислений

Его назвали Bend, и как пишут создатели, он очень похож на Python. С помощью Bend можно писать код для выполнения на многоядерных CPU/GPU без необходимости быть экспертом в C/CUDA и параллельных вычислениях.

В Bend есть такие штуки как неограниченная рекурсия, ветвления, алгебраические типы данных и пр.

🔗 Прочесть о языке подробнее можно на страничке проекта в GitHub
🤔54🥱2
📊 Где изучать Data Science в 2024 году?

Занимаясь наукой о данных, приходится постоянно учиться. Предлагаем вашему вниманию актуальный обзор из 25 новых книг, курсов, видеолекций и блогов для оттачивания мастерства в Data Science.

🔗 Читать статью
🔗 Зеркало
8🔥2😁2👍1
⚡️Proglib запускает канал про ИИ для генерации звука

Там мы будем рассказывать про все существующие нейросети, которые генерируют музыку и голос — с пошаговыми инструкциями, инструментами и лайфхаками.

⭐️генерация голоса и музыки
⭐️замена и перевод речи
⭐️распознавание звуков

👉Подписывайтесь!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2👏1
💬 Как вы считаете: нужно ли уметь писать алгоритмы машинного обучения с нуля, чтобы считаться хорошим дата-сайентистом?

👾 — да
❤️ — необязательно

#интерактив
61👾53👏3🥰2
🧑‍💻 Статьи для IT: как объяснять и распространять значимые идеи

Напоминаем, что у нас есть бесплатный курс для всех, кто хочет научиться интересно писать — о программировании и в целом.

Что: семь модулей, посвященных написанию, редактированию, иллюстрированию и распространению публикаций.

Для кого: для авторов, копирайтеров и просто программистов, которые хотят научиться интересно рассказывать о своих проектах.

👉Материалы регулярно дополняются, обновляются и корректируются. А еще мы отвечаем на все учебные вопросы в комментариях курса.
🖥 Итоги недели в мире Python и обзоры новых инструментов

У нас есть еженедельная рассылка о последних открытиях и тенденциях в мире Python. Мы опубликовали новый выпуск на 📰.

Ниже — небольшая часть выпуска, а целиком читайте здесь 👈

🏛Паттерн проектирования Unit of Work

Новый видеоролик рассказывает о паттерне Unit of Work, который используется для обеспечения согласованности данных при выполнении операций с базами данных.

🎸Как использовать PostgreSQL для управления очередями задач в Django

В этом видео подробно показан процесс настройки Django, создания класса Task и написания воркера.

📨Как отправлять зашифрованные имейлы с помощью собственного SMTP-сервера

Для отправки писем из Python-приложений можно использовать сторонние API или напрямую подключаться к SMTP-серверу. Второй метод пошагово разобран в этой статье.

Вы можете подписаться на email-рассылку здесь
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍1
💻🚀🏰 Как мы создали ИИ-стартап на хакатоне выходного дня в Германии

Инженер ПО рассказал нам о своих выходных на хакатоне в Кельне, где с командой пытался создать AI-стартап всего за два дня. Участники прошли путь от подачи идей в пятницу вечером до демонстрации работающего приложения к воскресенью.

В качестве бонуса автор привёл список основных пунктов, которые необходимо выполнить для создания стартапа.

🔗 Читать статью
🔗 Зеркало
👍21
🖥️🔤 Транскрибация видео и создание субтитров с помощью Whisper, FFmpeg и Python

Следуя нашему пошаговому руководству, вы сможете автоматически транскрибировать аудио и добавлять субтитры к своим видео всего за несколько минут.

🔗 Читать руководство
🔗 Зеркало
👍6👏4🔥3
🧡💛 Туториал по продвинутому использованию Google Colab

Автор туториала — один из инженеров машинного обучения Google. Он расскажет, как использовать:
▪️секреты;
▪️кастомные сниппеты;
▪️Colab AI;
▪️кастомные VM;
▪️kitty mode.

🔗 Ссылка на туториал
👍4🔥3
📊 SQL в Jupyter-ноутбуках

Инструмент JupySQL предлагает расширения к магической команде %%sql. Он позволяет:

▫️выполнять SQL-запросы непосредственно в Jupyter-ноутбуке;
▫️легко конвертировать результаты в датафреймы Pandas;
▫️удобно организовать большие SQL-запросы, разбивая их на управляемые части;
▫️строить графики из больших наборов данных с эффективным управлением памятью.

🔗 Ссылка на GitHub-репозиторий JupySQL
🔗 Ссылка на документацию
👍171👾1