berezkin.zip
34.6 MB
Ю.Е. Березкин, Е.Н. Дувакин
Тематическая классификация и распределение фольклорно-мифологических мотивов по ареалам
Аналитический каталог
В качестве бэкапа делаю архив сайта http://www.ruthenia.ru/folklore/berezkin/
Ранее на Stepik столкнулся, что часть работы фольклориста стала недоступна.
#nlp #datasets #folklore
Тематическая классификация и распределение фольклорно-мифологических мотивов по ареалам
Аналитический каталог
В качестве бэкапа делаю архив сайта http://www.ruthenia.ru/folklore/berezkin/
Ранее на Stepik столкнулся, что часть работы фольклориста стала недоступна.
#nlp #datasets #folklore
Моя статья о нейросетевой языковой модели GPT-3, в которой обобщаются многочисленные примеры использования и ограничения алгоритма.
https://proglib.io/p/avtodopolnenie-dlinoy-v-tysyachu-slov-chto-izvestno-o-neyrosetevoy-modeli-gpt-3-2020-11-21
https://proglib.io/p/avtodopolnenie-dlinoy-v-tysyachu-slov-chto-izvestno-o-neyrosetevoy-modeli-gpt-3-2020-11-21
Библиотека программиста
🤖💬 Автодополнение длиной в тысячу слов. Что известно о нейросетевой модели GPT-3
О том, что умеет (и чего не может) языковая модель GPT-3, которую называют прорывом в задачах обработки естественного языка.
Перевел подробный туториал о том, как с помощью DVC и Git эффективно хранить датасеты и модели машинного обучения, чтобы перемещаться между разными их версиями посредством пары команд.
https://proglib.io/p/git-dlya-data-science-kontrol-versiy-modeley-i-datasetov-s-pomoshchyu-dvc-2020-12-02
https://proglib.io/p/git-dlya-data-science-kontrol-versiy-modeley-i-datasetov-s-pomoshchyu-dvc-2020-12-02
Библиотека программиста
💽 Git для Data Science: контроль версий моделей и датасетов с помощью DVC
Подробный туториал о том, как с помощью DVC и Git эффективно хранить датасеты и модели машинного обучения, чтобы перемещаться между разными их версиями посредством пары команд.
Перевел туториал о MySQL коннекторе для Python https://proglib.io/p/python-i-mysql-prakticheskoe-vvedenie-2021-01-06
#python #databases #sql #mysql
#python #databases #sql #mysql
Библиотека программиста
🐍🐬 Python и MySQL: практическое введение
Рассмотрим на практическом примере, как из кода Python делать SQL-запросы к MySQL-серверу: CREATE, SELECT, UPDATE, JOIN и т. д.
📊 Туториал: визуализация данных в вебе с помощью Python и Dash
В этом руководстве рассмотрим, как с помощью Python и библиотеки Dash создать, оформить и опубликовать на хостинге интерактивное веб-приложение с результатами анализа данных.
https://proglib.io/p/tutorial-vizualizaciya-dannyh-v-vebe-s-pomoshchyu-python-i-dash-2021-01-11
#python #data_science #dash #web
В этом руководстве рассмотрим, как с помощью Python и библиотеки Dash создать, оформить и опубликовать на хостинге интерактивное веб-приложение с результатами анализа данных.
https://proglib.io/p/tutorial-vizualizaciya-dannyh-v-vebe-s-pomoshchyu-python-i-dash-2021-01-11
#python #data_science #dash #web
Библиотека программиста
📊 Туториал: визуализация данных в вебе с помощью Python и Dash
В этом руководстве мы рассмотрим, как с помощью Python и библиотеки Dash создать, оформить и опубликовать на хостинге интерактивное веб-приложение с результатами анализа данных.
Рассмотрим на примерах, в чем польза вложенных функций Python и как их применять для инкапсуляции кода, замыканий и декораторов.
https://proglib.io/p/kak-v-python-primenyayutsya-vlozhennye-funkcii-2021-02-09
#python
https://proglib.io/p/kak-v-python-primenyayutsya-vlozhennye-funkcii-2021-02-09
#python
Библиотека программиста
🐍 Как в Python применяются вложенные функции
Рассмотрим на примерах, в чем польза вложенных функций Python и как их применять для инкапсуляции кода, замыканий и декораторов.
Перевел статью Педро Прегейру Python & APIs: A Winning Combo for Reading Public Data
https://proglib.io/p/python-i-api-prevoshodnoe-kombo-dlya-avtomatizacii-raboty-s-publichnymi-dannymi-2021-02-26
https://proglib.io/p/python-i-api-prevoshodnoe-kombo-dlya-avtomatizacii-raboty-s-publichnymi-dannymi-2021-02-26
Библиотека программиста
✨ Python и API: превосходное комбо для автоматизации работы с публичными данными
Использование API — один из тех «магических» навыков, которые открывают мир новых возможностей, а Python — отличный инструмент, чтобы таким навыком овладеть.
Написал статью про арены, пулы и блоки. Если сочетание этих трех слов вам ни о чем не говорит, пора узнать, как устроена работа с памятью в Python.
🐍 Помнить всё. Как работает память в Python
https://proglib.io/p/pomnit-vse-kak-rabotaet-pamyat-v-python-2021-03-14
#python #memory #allocators
🐍 Помнить всё. Как работает память в Python
https://proglib.io/p/pomnit-vse-kak-rabotaet-pamyat-v-python-2021-03-14
#python #memory #allocators
Библиотека программиста
🐍 Помнить всё. Как работает память в Python
Арены, пулы и блоки. Если сочетание этих трех слов вам ни о чем не говорит, пора узнать, как устроена работа с памятью в Python.
🎞 Как с помощью Python делать красивые математические анимации
Перевел для proglib статью с примерами, как использовать навыки Python, чтобы сделать красивые математические анимации в духе YouTube-канала 3Blue1Brown.
https://proglib.io/p/kak-s-pomoshchyu-python-delat-krasivye-matematicheskie-animacii-2021-04-14
#python #manim #animations #3Blue1Brown
Перевел для proglib статью с примерами, как использовать навыки Python, чтобы сделать красивые математические анимации в духе YouTube-канала 3Blue1Brown.
https://proglib.io/p/kak-s-pomoshchyu-python-delat-krasivye-matematicheskie-animacii-2021-04-14
#python #manim #animations #3Blue1Brown
Библиотека программиста
🎞️ Как с помощью Python делать красивые математические анимации
Показываем на примерах, как использовать навыки Python, чтобы сделать красивые математические анимации в духе YouTube-канала 3Blue1Brown.
DatasetGAN: эффективная фабрика разметки данных с минимальными человеческими усилиями
https://vk.com/@python_ds-datasetgan-effektivnaya-fabrika-razmetki-dannyh-s-minimalnym
#data_science #deep_learning #computer_vision
https://vk.com/@python_ds-datasetgan-effektivnaya-fabrika-razmetki-dannyh-s-minimalnym
#data_science #deep_learning #computer_vision
VK
DatasetGAN: эффективная фабрика разметки данных с минимальными человеческими усилиями
Кто и что сделал? Исследователи компании Nvidia представили DatasetGAN — алгоритм для разметки крупных наборов данных с изображениями выс..
UART в вопросах и ответах за 5 минут
https://zen.yandex.ru/media/id/5b1596ca7800199f3b5b8cb8/uart-v-voprosah-i-otvetah-za-5-minut-60ae6c7a4c412a10ce4a82aa
https://zen.yandex.ru/media/id/5b1596ca7800199f3b5b8cb8/uart-v-voprosah-i-otvetah-za-5-minut-60ae6c7a4c412a10ce4a82aa
Дзен | Блогерская платформа
UART в вопросах и ответах за 5 минут
Для тех, кому лень читать или хочется посмотреть, как всё это выглядит вживую, я записал материал в форме видео. Что означает название? UART — сокращение от Universal Asynchronous Receiver-Transmitter. По-русски универсальный асинхронный приемник-передатчик.…
Перевел подробный туториал о том, как шаг за шагом создать сайт с бэкендом на Django, фронтендом на Vue и связкой между ними на GraphQL. Для всех любителей Python и современной веб-разработки.
https://proglib.io/p/polnyy-fullstek-pishem-sayt-na-django-vue-i-graphql-2021-07-22
#django #vue #graphql
https://proglib.io/p/polnyy-fullstek-pishem-sayt-na-django-vue-i-graphql-2021-07-22
#django #vue #graphql
Библиотека программиста
🔩 Полный фуллстек: пишем сайт на Django, Vue и GraphQL
Шаг за шагом пишем сайт с бэкендом на Django, фронтендом на Vue и связкой между ними на GraphQL. Для всех любителей Python и современной веб-разработки.
Кратко о том, как работать с файлами Excel из Python, и наоборот — запускать Python-код изнутри Excel (последнее — бегло).
https://vk.com/@python_ds-kak-rabotat-s-excel-failami-iz-python
#python #excel #spreadsheets
https://vk.com/@python_ds-kak-rabotat-s-excel-failami-iz-python
#python #excel #spreadsheets
VK
Как работать с Excel-файлами из Python?
Если вам нужно работать с табличными файлами из Python, а формат зависит только от вас, то по возможности используйте не xls-, xlsx-файлы..
На YouTube выложен курс Калифорнийского университета Berkeley из 66 занятий про проектированию, визуализации и пониманию глубоких нейронных сетей https://www.youtube.com/playlist?list=PLuv1FSpHurUevSXe_k0S7Onh6ruL-_NNh
#data_science #courses #deep_learning
#data_science #courses #deep_learning
Курс freeCodeCamp по Deep Learning на базе PyTorch. 9.5 часов на YouTube + множество практических заданий, все ссылки на код и другие файлы в описании к видео.
Разбираются:
- База Pytorch
- Классификация изображений
- Обучение на GPU
- Сверточные нейронные сети
- Аугментация и регуляризация данных
- Обучение генеративно-состязательных нейронных сетей
https://www.youtube.com/watch?v=GIsg-ZUy0MY
#pytorch #deep_learning #course
Разбираются:
- База Pytorch
- Классификация изображений
- Обучение на GPU
- Сверточные нейронные сети
- Аугментация и регуляризация данных
- Обучение генеративно-состязательных нейронных сетей
https://www.youtube.com/watch?v=GIsg-ZUy0MY
#pytorch #deep_learning #course
YouTube
PyTorch for Deep Learning - Full Course / Tutorial
In this course, you will learn how to build deep learning models with PyTorch and Python. The course makes PyTorch a bit more approachable for people starting out with deep learning and neural networks.
💻 Code:
https://jovian.ml/aakashns/01-pytorch-basics…
💻 Code:
https://jovian.ml/aakashns/01-pytorch-basics…
Несколько интересных статей и переводов по #data_science и #python из недавних постов на Хабре:
— «Triton: Open Source язык для ядер Deep Learning» перевод статьи про трудности обработки данных на GPU и проект Triton от OpenAI https://habr.com/ru/company/skillfactory/blog/579380/?utm_source=telegram.me&utm_medium=social&utm_campaign=neskolko-interesnyh-statey-i-perevodov. В оригинале статьи вёрстка более корректная: https://openai.com/blog/triton/?utm_source=telegram.me&utm_medium=social&utm_campaign=neskolko-interesnyh-statey-i-perevodov
— Про собеседования ML-инженера в компании-гиганты с примерами для разных этапов: https://habr.com/ru/post/579410/?utm_source=telegram.me&utm_medium=social&utm_campaign=neskolko-interesnyh-statey-i-perevodov. Статью хорошо дополняют комментарии.
— Пяток книжек по статистике и анализу данных, которые я и сам рекомендую: https://habr.com/ru/company/skypro/blog/579278/?utm_source=telegram.me&utm_medium=social&utm_campaign=neskolko-interesnyh-statey-i-perevodov
— Пара статей про «Python-культуру» в российских компаниях: https://habr.com/ru/company/it_people/blog/576410/?utm_source=telegram.me&utm_medium=social&utm_campaign=neskolko-interesnyh-statey-i-perevodov (Provectus) и https://habr.com/ru/company/it_people/blog/569868/?utm_source=telegram.me&utm_medium=social&utm_campaign=neskolko-interesnyh-statey-i-perevodov (Тинькофф)
Присылайте, если было что-то еще интересное.
— «Triton: Open Source язык для ядер Deep Learning» перевод статьи про трудности обработки данных на GPU и проект Triton от OpenAI https://habr.com/ru/company/skillfactory/blog/579380/?utm_source=telegram.me&utm_medium=social&utm_campaign=neskolko-interesnyh-statey-i-perevodov. В оригинале статьи вёрстка более корректная: https://openai.com/blog/triton/?utm_source=telegram.me&utm_medium=social&utm_campaign=neskolko-interesnyh-statey-i-perevodov
— Про собеседования ML-инженера в компании-гиганты с примерами для разных этапов: https://habr.com/ru/post/579410/?utm_source=telegram.me&utm_medium=social&utm_campaign=neskolko-interesnyh-statey-i-perevodov. Статью хорошо дополняют комментарии.
— Пяток книжек по статистике и анализу данных, которые я и сам рекомендую: https://habr.com/ru/company/skypro/blog/579278/?utm_source=telegram.me&utm_medium=social&utm_campaign=neskolko-interesnyh-statey-i-perevodov
— Пара статей про «Python-культуру» в российских компаниях: https://habr.com/ru/company/it_people/blog/576410/?utm_source=telegram.me&utm_medium=social&utm_campaign=neskolko-interesnyh-statey-i-perevodov (Provectus) и https://habr.com/ru/company/it_people/blog/569868/?utm_source=telegram.me&utm_medium=social&utm_campaign=neskolko-interesnyh-statey-i-perevodov (Тинькофф)
Присылайте, если было что-то еще интересное.
На YouTube-канале Karpov Courses выходит серия с собеседованиями по ML-позициям https://www.youtube.com/watch?v=WKYPQtqE-m0&list=PLBRXq5LaddfzDBjg6soIwJJA2klXXs6ni
Валерий Бабушкин проводит тестовые собеседования с аналитиками данных. Далее в компании пары дата сайнтистов разбирает ошибки. Местами слишком неспешно, но реалистично.
#data_science #hr
Валерий Бабушкин проводит тестовые собеседования с аналитиками данных. Далее в компании пары дата сайнтистов разбирает ошибки. Местами слишком неспешно, но реалистично.
#data_science #hr
YouTube
ML System Design с Валерием Бабушкиным | Выпуск 2 | Собеседование | karpov.courses
Курс HARD ML: https://bit.ly/2WyzaWX
Промокод SYSTEMDESIGN даёт 10% скидки на курс.
Первая часть собеседования ML Design System меньше, чем за месяц, стала самым популярным видео на нашем YouTube-канале.
В новом выпуске участник столкнулся совсем с другой…
Промокод SYSTEMDESIGN даёт 10% скидки на курс.
Первая часть собеседования ML Design System меньше, чем за месяц, стала самым популярным видео на нашем YouTube-канале.
В новом выпуске участник столкнулся совсем с другой…
Коротко для новичков: что такое Kaggle
Как указано на сайте ODS https://ods.ai/, Data Science соревнование — это «коллективное решение бизнес задачи в игровой форме, в кратчайшие сроки, с целью выявления лучшего решения. Это повод окунуться в предметную область и понять, как задача бизнеса переводится на язык прикладной математики».
📊 Kaggle https://www.kaggle.com/ — самая известная платформа Data Science соревнований. Любая компания может объявить на ней конкурс с денежным призом и описанием специфичной задачи анализа данных, а участники найдут решение.
💽 Логика простая: даже крутейший отдел дата сайентистов не сравнится по разнообразию идей с крупным коммьюнити, каким является Kaggle. А так компания добивается результата за небольшой срок и при ограниченных вложениях денег. Особенно, если данные и вся сопутствующая информация хорошо подготовлены. Плюс реклама компании в IT-среде.
🤖 Аналитики могут искать решение по одиночке или в команде. Kaggle проверяет не само решение, а то, насколько хорошо предлагаемая модель научилась предсказывать по имеющимся данным скрытые от нее значения. Например, находить координату объекта по фотографии, которая содержит этот объект. Чья модель предсказывает лучше, у того и выше место в рейтинге.
🏅 За позиции в рейтинге участники получают медали — золотые, серебряные, бронзовые. Их также дают за датасеты, публичные Jupyter-блокноты, участие в обсуждениях. Последние, кстати, не очень ценятся. Медали складываются в звания: Expert — Master — Grandmaster. Может помочь при прохождении технических интервью.
🏎️ Один из главных подвохов — некоторые задачи требуют значительных вычислительных ресурсов, которые могут очень отличаться у разных участников. Kaggle чуть выравнивает шансы, предоставляя возможности запуска Jupyter-блокнотов на графических (GPU) и тензорных (TPU) ускорителях. Аналогично тому, как это работает в Google Colab, то есть с лимитом вычислений в границах временного интервала.
🎓 Ещё здесь есть множество мини-курсов. Но мне их текущий формат не очень нравится — тесты выглядят натянуто.
Главное: Kaggle — это среда, в которой можно почерпнуть и попробовать на бизнес-задачах свежие идеи из мира Data Science.
#kaggle #novice #data_science
Как указано на сайте ODS https://ods.ai/, Data Science соревнование — это «коллективное решение бизнес задачи в игровой форме, в кратчайшие сроки, с целью выявления лучшего решения. Это повод окунуться в предметную область и понять, как задача бизнеса переводится на язык прикладной математики».
📊 Kaggle https://www.kaggle.com/ — самая известная платформа Data Science соревнований. Любая компания может объявить на ней конкурс с денежным призом и описанием специфичной задачи анализа данных, а участники найдут решение.
💽 Логика простая: даже крутейший отдел дата сайентистов не сравнится по разнообразию идей с крупным коммьюнити, каким является Kaggle. А так компания добивается результата за небольшой срок и при ограниченных вложениях денег. Особенно, если данные и вся сопутствующая информация хорошо подготовлены. Плюс реклама компании в IT-среде.
🤖 Аналитики могут искать решение по одиночке или в команде. Kaggle проверяет не само решение, а то, насколько хорошо предлагаемая модель научилась предсказывать по имеющимся данным скрытые от нее значения. Например, находить координату объекта по фотографии, которая содержит этот объект. Чья модель предсказывает лучше, у того и выше место в рейтинге.
🏅 За позиции в рейтинге участники получают медали — золотые, серебряные, бронзовые. Их также дают за датасеты, публичные Jupyter-блокноты, участие в обсуждениях. Последние, кстати, не очень ценятся. Медали складываются в звания: Expert — Master — Grandmaster. Может помочь при прохождении технических интервью.
🏎️ Один из главных подвохов — некоторые задачи требуют значительных вычислительных ресурсов, которые могут очень отличаться у разных участников. Kaggle чуть выравнивает шансы, предоставляя возможности запуска Jupyter-блокнотов на графических (GPU) и тензорных (TPU) ускорителях. Аналогично тому, как это работает в Google Colab, то есть с лимитом вычислений в границах временного интервала.
🎓 Ещё здесь есть множество мини-курсов. Но мне их текущий формат не очень нравится — тесты выглядят натянуто.
Главное: Kaggle — это среда, в которой можно почерпнуть и попробовать на бизнес-задачах свежие идеи из мира Data Science.
#kaggle #novice #data_science