Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.8K subscribers
2.23K photos
111 videos
64 files
4.63K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
🔍 12 лучших ИИ-поисковиков, которые найдут иголку в стоге сена

Умение быстро находить решения сложных задач — один из самых важных навыков разработчика. Но найти по-настоящему полезную информацию в лавинообразном потоке SEO-оптимизированного контента бывает нелегко. На помощь придут ИИ-поисковики: они могут отыскать ответ на самый размытый запрос, а при необходимости — сгенерируют собственное решение.

🔗 Смотреть полную подборку поисковиков
🔗 Зеркало
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍41
Audio
🔉OpenAI создала собственную систему копирования голоса

Компания опубликовала блогпост с рассказом о голосовом движке Voice Engine, который может на основе 15-секундного отрывка записи голоса озвучить любой текст в манере говорящего. Также система способна переводить речь на другие языки.

OpenAI уже предоставила доступ к движку нескольким партнёрам. Вот некоторые примеры его использования:
▫️Помощь в чтении детям и другим людям, не умеющим читать.
▫️Перевод контента.
▫️Поддержка людей с ограниченными возможностями.

🔗 Читать пост OpenAI (там можно найти больше примеров сгенерированной речи)
👍3🥰3
🆕 В 30 раз быстрее: MIT представляет ИИ-инструмент, создающий высококачественные картинки

Диффузия обычно является трудоемким процессом, требующим множества шагов, но исследователи из MIT нашли лучший способ.

🔗Подробнее
🔥6😁1
🆕 DBRX – прорыв в сфере открытых языковых моделей от Databricks

DBRX превосходит GPT-3.5 и конкурирует с Gemini 1.0 Pro в стандартных тестах и лидирует в тестах на MMLU, HumanEval и GSM8K.

🔗Подробнее
1
🐼 Много упражнений по Pandas

Этот репозиторий на GitHub содержит множество ноутбуков с различными задачами, которые помогут изучить/вспомнить Pandas. Вот какие темы охвачены:

▫️фильтрация данных;
▫️группировка;
▫️статистические показатели;
▫️временные ряды и др.

🔗 Изучить репозиторий
🔥12👍31
🐍🛠️ 32 инструмента для Python, которые помогут писать профессиональный код

В статье собрали полезные инструменты для написания чистого, читаемого и безопасного Python-кода: автоформатировщики, линтеры, инструменты проверки типов, фреймворки для юнит-тестирования и генераторы документации.

🔗 Читать статью полностью
🔗 Зеркало
7👍42
🤖✍️ Как работают языковые модели (LLM): простое объяснение через аналогию с кулинарией

Языковые модели (LLM) — это сложные системы искусственного интеллекта, способные генерировать человекоподобные тексты. Но как именно они это делают? В этой статье мы объясним принципы работы LLM, используя простую и понятную аналогию с приготовлением еды.

🔗 Читать статью
🔗 Зеркало
👾83
👀 Обнаружено любимое словечко GPT

Оказалось, что ChatGPT по какой-то причине любит генерировать тексты со словом delve, которое можно перевести с английского как «копаться», «исследовать глубоко».

💩 Это стало ясно благодаря анализу научных статей по медицине, опубликованных на PubMed. В 2023 году подозрительно выросло количество текстов с этим словом — примерно в 5 раз. Похоже, учёным очень нравится ChatGPT.

Над этим уже иронизирует Илон Маск:
Франсуа Шолле: Мы действительно не продумали долгосрочные негативные эффекты LLM.
Илон Маск: Попроси LLM исследовать это глубоко.
Please open Telegram to view this post
VIEW IN TELEGRAM
12😁5
😪 Это должно было быть первоапрельской шуткой...
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁201🤔1😢1🥱1
🔥 Вышел, вероятно, один из лучших роликов с объяснением Transformers

На отличном канале 3Blue1Brown опубликовали очередное видео из серии про глубокое обучение. На этот раз авторы отвечают на вопрос «Что такое GPT» и дают визуальное введение в Transformers.

👍 Рекомендуем к просмотру. Канал 3Blue1Brown ещё ни разу не подводил.

🔗 Ссылка на ролик
17👍2🔥2👏1
💩 Подборка полезных команд для работы в Jupyter-ноутбуках

💩ИИ-помощник в ноутбук — Jupyter AI
Точно работает в JupyterLab. Сначала нужно установить расширение:
pip install 'jupyter-ai>=1.0,<2.0' # если вы используете JupyterLab 3
pip install jupyter-ai # если вы используете JupyterLab 4

Затем следует установить переменную окружения с API-ключом OpenAI:
%env OPENAI_API_KEY=ваш_ключ

В конце концов можно вставить следующий код:
%reload_ext jupyter_ai
%%ai chatgpt
generate a function for sum of two numbers


💩Красивый вывод LaTeX формул
%%latex
$$c = \sqrt{a^2 + b^2}$$


💩Выполнение SQL-запросов
Эта магическая команда становится доступной после установки и настройки расширения ipython-sql. Вот последовательность команд:
pip install ipython-sql
%load_ext sql
%sql postgresql://username:password@hostname:port/database_name
%sql SELECT * FROM my_table LIMIT 5;


💩Запуск Python-файлов прямо в ноутбуке
%run hello.py


💩Запись содержимого ячейки в Python-файл
%%writefile app.py

def sum_of_numbers(a, b):
return a + b

c = sum_of_numbers(3, 2)
print(c)
Please open Telegram to view this post
VIEW IN TELEGRAM
👍272😁1
💬 Как изменился ваш информационный пузырь за год?

Помните свои информационные предпочтения год назад? Многое изменилось! Социальные сети, мессенджеры, YouTube, подкасты — все эти каналы ежедневно борются за наше внимание. У каждого из нас за год сформировался свой уникальный информационный рацион. Пройдите наш опрос и расскажите, как изменились ваши вкусы в медиапотреблении.

👉 Пройти опрос

Опрос займёт у вас примерно 4 минуты.
😁62
🔥 Язык для машинного обучения Mojo стал открытым

Создатели Mojo объявили, что теперь проект опенсорсный, и каждый может внести свой вклад в разработку.

👀 Помимо предоставления исходного кода, команда также открыла историю изменений стандартной библиотеки, выпустила ночные сборки компилятора Mojo, предоставила публичную систему непрерывной интеграции и разрешила пулл-реквесты на GitHub.

🔗 Ссылка на репозиторий Mojo
🔥162👍2