Просто Python | Data science | ML | AI
9.98K subscribers
2.04K photos
38 videos
40 files
2.06K links
Говорим просто о Python, Data Science и машинном обучении!

Связаться: @agencytender

Канал на бирже:
https://telega.in/c/pro100python1

Ссылка для друга:
https://t.me/+Iy7vrYZkpiU3NzJi

РКН: https://rkn.link/ANH
Download Telegram
🎓Python-пакеты для Data Science

CSV - это распространенный формат для хранения табличных данных, а также импорта и экспорта данных. Для обработки CSV-файлов в Python есть встроенный csv-модуль. Например, если вам нужно прочитать данные из CSV-файла, вы можете использовать функцию csv.reader(), которая в основном выполняет итерацию по строкам CSV-файла. Если вы хотите экспортировать данные в формат CSV, функция csv.writer() может справиться с этим.

#CSV #data_science | Просто Python
Please open Telegram to view this post
VIEW IN TELEGRAM
🎓Python-пакеты для Data Science

Codon - это высокопроизводительный компилятор Python, который может даже конкурировать с C/C++ по скорости, с ускорением в 10-100 раз и более (single thread). Он может быть использован в коде Python с помощью декоратора codon.jit или путем вызова обычных функций и библиотек Python из Codon.

#Codon #data_science | Просто Python
Please open Telegram to view this post
VIEW IN TELEGRAM
🎓Python-пакеты для Data Science

Basemap - используется для создания карт. На ее основе сделана библиотека Folium, с помощью которой создают интерактивные карты в интернете.

#basemap #data_science | Просто Python
Please open Telegram to view this post
VIEW IN TELEGRAM
🎥 100 Data Science вопросов мидлу!

На
этот раз мы встретились уже с опытным кандидатом в Data Science. Будем интенсивно задавать разноплановые вопросы!

👀Смотреть в YouTube

#data_science | Просто Python
Please open Telegram to view this post
VIEW IN TELEGRAM
🎓Python-пакеты для Data Science

Gensim – это библиотека с открытым исходным кодом на Python, написанная Радимом Рехуреком, которая используется для тематического моделирования без учителя и обработки естественного языка (NLP). Она предназначена для извлечения семантических тем из документов.

🔹Его можно использовать для построения моделей, которые позволяют эффективно классифицировать документы, понимая статистическую семантику каждого слова.
🔹Он поставляется с алгоритмами обработки текста, такими как Word2Vec, FastText, латентный семантический анализ и т.д., которые изучают статистические закономерности одновременного появления в документе, чтобы отфильтровать ненужные слова и построить модель, содержащую только значимые функции.
🔹Предоставляет средства ввода-вывода и считыватели, которые могут импортировать и поддерживать широкий спектр форматов данных.
🔹Он поставляется с простыми и интуитивно понятными интерфейсами, которыми легко могут пользоваться новички. Кривая обучения API также довольно низкая, что объясняет, почему многим разработчикам нравится эта библиотека.

#Gensim #data_science | Просто Python
Please open Telegram to view this post
VIEW IN TELEGRAM
🖥 11 шагов на пути к работе дата-сайентиста

Получить работу в области науки о данных, МО и ИИ сложно. Эти 11 шагов помогут стратегически подойти к решению этой проблемы (спойлер: Kaggle не относится к их числу).

🧠Читать статью

#data_science | Просто Python
Please open Telegram to view this post
VIEW IN TELEGRAM
🖥 Как собрать данные для DS-проекта с помощью Python: 3 шага

Начните
свой проект по науке о данных с создания Python-скрипта, используя библиотеку Selenium для извлечения данных. Предлагаем узнать, как это выполнить в 3 шага.

🧠Читать статью

#data_science | Просто Python
Please open Telegram to view this post
VIEW IN TELEGRAM
🎓Python-пакеты для Data Science

SimpleITK - это комплексный инструментарий для анализа изображений, который поддерживает различные операции фильтрации, а также сегментацию изображений и регистрацию.

Плюсы

Документация для SimpleITK хороша и обширна для руководств высокого уровня и инструкций по созданию наборов инструментов и примеров для приложений SimpleIKT

Минусы

Основные функции ITK, такие как структура пространственных объектов, наборы точек и структура сетки, отсутствуют в SimplITK

#SimpleITK #data_science | Просто Python
Please open Telegram to view this post
VIEW IN TELEGRAM
🖥 Как писать идеальные конспекты по науке о данных

Предлагаем несколько практических советов по написанию конспектов при изучении науки о данных. Следуя им, вы сможете эффективно понимать и усваивать сложнейшие концепции, которые пригодятся в дальнейшей работе.

🧠Читать статью

#Data_Science | Просто Python
Please open Telegram to view this post
VIEW IN TELEGRAM
🖥  Разведочный анализ данных в одной строке кода

В программировании важно уметь пользоваться инструментами, которые обеспечивают удобное выполнение сложных функций. Сегодня познакомимся с разведочным анализом данных и полезной библиотекой sweetviz.

🧠Читать статью

#sweetviz #data_science | Просто Python
Please open Telegram to view this post
VIEW IN TELEGRAM
🎥  Data Scientist, Data Analyst и Data Engineer: в чём разница? | Профессии в Data Science

Чем отличаются Data Scientist, Data Analyst и Data Engineer? Эти профессии часто путают, но на самом деле между этими специализациями достаточно четкие различия. Чем занимается каждый из этих специалистов? Смотрите ролик, чтобы узнать!

👀Смотреть в  YouTube

#Data_Science  | Просто Python
Please open Telegram to view this post
VIEW IN TELEGRAM
🎓 Python-пакеты для Data Science

Модуль Requests предоставляет возможность управления HTTP-запросами при помощи языка Python. Инструментарий библиотеки широкий и рассчитан на все случаи взаимодействия с web-приложениями. Код, написанный с применением Requests, не является громоздким, легко читается, а функции и методы наглядно настраиваются под специфические нужды.

Модуль разработан с учетом потребностей современных web-разработчиков и актуальных технологий. Многие операции автоматизированы, а ручные настройки сведены к минимуму.

Для понимания инструментария библиотеки перечислим ее основные возможности:
🔸 поддержка постоянного HTTP-соединения и его повторное использование;
🔸 применение международных и национальных доменов;
🔸 использование Cookie: передача и получение значений в формате ключ: значение;
🔸 автоматическое декодирование контента;
🔸 SSL верификация;
🔸 аутентификация пользователей на большинстве ресурсов с сохранением;
🔸 поддержка proxy при необходимости;
🔸 загрузка и выгрузка файлов;
🔸 стриминговые загрузки и фрагментированные запросы;
🔸 задержки соединений;
🔸 передача требуемых заголовков на web-ресурсы и др.

#Requests #data_science | Просто Python
Please open Telegram to view this post
VIEW IN TELEGRAM