Легкий парсинг документов с Docling!
Docling — это open-source Python-пакет, который превращает любой документ в данные, готовые для LLM!
🟢 OCR для сканированных PDF
🟢 Поддержка PDF, PPTX, DOCX и других → конвертация в Markdown, JSON
🟢 Продвинутый разбор PDF: структура, порядок чтения, таблицы
🟢 Интеграция с LlamaIndex и LangChain
Скоро появится:
➖ Извлечение уравнений и кода
➖ Нативное расширение для LangChain
➖ Извлечение метаданных (заголовки, авторы, ссылки, язык)
Совместим с macOS, Linux и Windows на архитектурах x86_64 и arm64.
⏩ Ознакомиться:
https://github.com/DS4SD/docling
👉 @PythonPortal | #ресурсы
Docling — это open-source Python-пакет, который превращает любой документ в данные, готовые для LLM!
Скоро появится:
Совместим с macOS, Linux и Windows на архитектурах x86_64 и arm64.
https://github.com/DS4SD/docling
Please open Telegram to view this post
VIEW IN TELEGRAM
10 алгоритмов машинного обучения для начинающих
➖ Linear Regression – линейная регрессия (предсказание числовых значений).
➖ Logistic Regression – логистическая регрессия (бинарная классификация).
➖ CART Algorithm – алгоритм дерева решений (классификация и регрессия).
➖ Naïve Bayes – наивный байесовский классификатор (статистический метод).
➖ KNN Algorithm – метод k ближайших соседей (классификация).
➖ Apriori – поиск ассоциаций в данных (например, анализ покупок).
➖ K-Means – метод k-средних (кластеризация).
➖ PCA – метод главных компонент (снижение размерности).
➖ Random Forest Classification – случайный лес (ансамблевый метод).
➖ AdaBoost – алгоритм бустинга (усиление слабых моделей).
Эти алгоритмы охватывают основные задачи машинного обучения: регрессию, классификацию, кластеризацию и снижение размерности.
👉 @PythonPortal | #ресурсы
Эти алгоритмы охватывают основные задачи машинного обучения: регрессию, классификацию, кластеризацию и снижение размерности.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
На сайте roadmap.sh собрана шикарная подборка идей для практики backend-разработки — от простых CLI-приложений вроде трекера задач до сложных систем бронирования и масштабируемых e-commerce платформ
Проекты разбиты по уровням сложности: начинающий, средний, эксперт
Каждый проект снабжен описанием и рекомендациями, что делает обучение увлекательным и продуктивным
👉 https://roadmap.sh/backend/projects
👉 @PythonPortal | #ресурсы
Проекты разбиты по уровням сложности: начинающий, средний, эксперт
Каждый проект снабжен описанием и рекомендациями, что делает обучение увлекательным и продуктивным
Please open Telegram to view this post
VIEW IN TELEGRAM
Перезапустите ядро Jupyter, не теряя переменные
Используйте команду
➖ Это позволяет избежать необходимости явно сохранять данные на диск или использовать сериализацию (pickle).
👉 @PythonPortal | #tips
Используйте команду
store magic
, чтобы сохранять и извлекать переменные даже после перезапуска ядра.Please open Telegram to view this post
VIEW IN TELEGRAM
25 репозиториев Github, которые должен знать каждый разработчик Python
В список включены как официальные репозитории языка Python, так и популярные библиотеки и фреймворки, такие как Requests, Flask, Django, Pandas, NumPy и другие. Каждый репозиторий сопровождается кратким описанием его назначения и возможностей.
➖ Цель статьи — предоставить разработчикам полезные инструменты и ресурсы для повышения эффективности и продуктивности в работе с Python.
📝 Читать: клик
👉 @PythonPortal | #статья
В список включены как официальные репозитории языка Python, так и популярные библиотеки и фреймворки, такие как Requests, Flask, Django, Pandas, NumPy и другие. Каждый репозиторий сопровождается кратким описанием его назначения и возможностей.
Please open Telegram to view this post
VIEW IN TELEGRAM
Создайте своего собственного оператора OpenAI с помощью инструментов с открытым исходным кодом!
Browser Use — это фреймворк с открытым исходным кодом, который позволяет ИИ-агентам использовать браузер всего лишь с несколькими строками Python-кода.
Основные функции:
🟢 100% с открытым исходным кодом
🟢 Интеграция с Gradio для веб-интерфейса
🟢 Работает с Claude, gpt-4o и Llama 3
🟢 Исполнение с участием человека для безопасной работы
Вы просто говорите своему компьютеру, что делать, и Browser Use выполнит задачу.
⏩ Ознакомиться:
https://github.com/browser-use/browser-use
👉 @PythonPortal | #ресурсы
Browser Use — это фреймворк с открытым исходным кодом, который позволяет ИИ-агентам использовать браузер всего лишь с несколькими строками Python-кода.
Основные функции:
Вы просто говорите своему компьютеру, что делать, и Browser Use выполнит задачу.
https://github.com/browser-use/browser-use
Please open Telegram to view this post
VIEW IN TELEGRAM
Книга автора Зеда А. Шоу "Изучение Python 3 сложным путем"
📝 Состоит из 52 тщательно разработанных упражнений, охватывающих темы от работы с командной строкой и структур данных до алгоритмов сортировки, парсинга текста и работы с SQL-базами данных. Каждое упражнение направлено на развитие практических навыков через реализацию проектов, таких как создание блогов, текстовых редакторов и интерпретаторов.
Подход книги основан на активном написании кода и решении реальных задач, что способствует глубокому пониманию и уверенной работе с Python.
📝 Читать бесплатно:
https://learncodethehardway.org/more-python-book/
👉 @PythonPortal | #книги
Подход книги основан на активном написании кода и решении реальных задач, что способствует глубокому пониманию и уверенной работе с Python.
https://learncodethehardway.org/more-python-book/
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Создание бомбардировщика EMAIL с помощью Python.Полное пошаговое руководство ❗️
Автор объясняет, как настроить сервер, выбрать цель, количество писем и отправить их. Всё это упаковано в классы, чтобы было удобнее. Программа ещё красиво оформлена цветным текстом.
↔️ В общем, это туториал по созданию спам-программы, но использовать такое не стоит — это незаконно и неэтично.
⏩ Источник:
https://youtu.be/9R0Zg3MCpUo?si=Aq5GydeZzmEu2G1e
👉 @PythonPortal | #видео
Автор объясняет, как настроить сервер, выбрать цель, количество писем и отправить их. Всё это упаковано в классы, чтобы было удобнее. Программа ещё красиво оформлена цветным текстом.
https://youtu.be/9R0Zg3MCpUo?si=Aq5GydeZzmEu2G1e
Please open Telegram to view this post
VIEW IN TELEGRAM
Zauberzeug NiceGUI 🗒
➖ Это Python-фреймворк для создания веб-интерфейсов с простым синтаксисом. Он позволяет разрабатывать веб-приложения, дашборды и GUI с минимальным количеством кода, используя знакомые конструкции Python.
🟢 Позволяет быстро создавать интерфейсы без необходимости изучать HTML, CSS и JavaScript.
🟢 Поддерживает события (клики, ввод данных) и обновление интерфейса в реальном времени.
🟢 Работает на популярном Python-фреймворке для веб-приложений.
🟢 Можно использовать с машинным обучением, IoT, дашбордами и другими приложениями.
🟢 Кнопки, графики, формы, таблицы и другие элементы доступны "из коробки".
⏩ Ознакомиться:
https://github.com/zauberzeug/nicegui
👉 @PythonPortal | #ресурсы
https://github.com/zauberzeug/nicegui
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Трюк Python
В верхнем примере для ввода трёх значений используются три отдельных input(), что менее удобно:
❌ Пользователь вводит каждое число по отдельности, что требует больше времени. 😨
☑ Лучший способ
В нижнем примере все значения вводятся одной строкой, разделённой пробелами: это упрощает ввод и делает код более лаконичным.
👉 @PythonPortal | #tips
В верхнем примере для ввода трёх значений используются три отдельных input(), что менее удобно:
В нижнем примере все значения вводятся одной строкой, разделённой пробелами: это упрощает ввод и делает код более лаконичным.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
В Python можно выполнить каталог проекта как скрипт.
🍩 Переименуйте основной файл в
🍩 Запустите команду python
Это кратко и удобно, а также упрощает другим пользователям идентификацию основного файла.🥳
👉 @PythonPortal | #tips
__main__.py
.имя_каталога
.Это кратко и удобно, а также упрощает другим пользователям идентификацию основного файла.
Please open Telegram to view this post
VIEW IN TELEGRAM
Grok 3 уже здесь, и он не прошел тест на "отскакивание шестиугольного шара". 😏
Grok 3 — это новейшая версия чат-бота с искусственным интеллектом, разработанного компанией xAI под руководством Илона Маска.
Маск охарактеризовал Grok 3 как «самый умный ИИ на Земле».🤡
Но однако он не очень хорошо справляется с кодированием
👉 @PythonPortal
Grok 3 — это новейшая версия чат-бота с искусственным интеллектом, разработанного компанией xAI под руководством Илона Маска.
Маск охарактеризовал Grok 3 как «самый умный ИИ на Земле».
Но однако он не очень хорошо справляется с кодированием
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
-Telegram-Voice-Recognition-Bot-main.zip
8.7 MB
Скрипт распознание говорящих 🔥
Скрипт представляет собой Telegram-бота для распознавания говорящих по голосовым сообщениям с использованием нейросетевой модели.
Функции:
🟢 Принимает голосовые сообщения
🟢 Анализирует голос и определяет говорящего
🟢 Показывает список известных говорящих (/speakers)
🟢 Работает на основе MFCC-фич и нейросети, обученной на PyTorch
🤖 ЯП: Python 3.11+
📂 Модули: aiogram, aiohttp, torch
🖥 База данных: -
👉 @PythonPortal | #ресурсы
Скрипт представляет собой Telegram-бота для распознавания говорящих по голосовым сообщениям с использованием нейросетевой модели.
Функции:
Please open Telegram to view this post
VIEW IN TELEGRAM
Это лучшая книга "Introduction to Python Programming" от OpenStax. OpenStax — это некоммерческая организация, которая создает бесплатные учебники высокого качества. 🔥
🟣 Переменные, типы данных и операторы
🟣 Управляющие конструкции (условия, циклы)
🟣 Функции и модули
🟣 Работа с файлами
🟣 Объектно-ориентированное программирование (ООП)
🟣 Основы работы с библиотеками
Она подойдёт для самостоятельного изучения, так как включает примеры кода, упражнения и объяснения концепций простым языком.
📝 Читать бесплатно: тут
👉 @PythonPortal | #книги
Она подойдёт для самостоятельного изучения, так как включает примеры кода, упражнения и объяснения концепций простым языком.
Please open Telegram to view this post
VIEW IN TELEGRAM