Легкий парсинг документов с Docling!
Docling — это open-source Python-пакет, который превращает любой документ в данные, готовые для LLM!
🟢 OCR для сканированных PDF
🟢 Поддержка PDF, PPTX, DOCX и других → конвертация в Markdown, JSON
🟢 Продвинутый разбор PDF: структура, порядок чтения, таблицы
🟢 Интеграция с LlamaIndex и LangChain
Скоро появится:
➖ Извлечение уравнений и кода
➖ Нативное расширение для LangChain
➖ Извлечение метаданных (заголовки, авторы, ссылки, язык)
Совместим с macOS, Linux и Windows на архитектурах x86_64 и arm64.
⏩ Ознакомиться:
https://github.com/DS4SD/docling
👉 @PythonPortal | #ресурсы
Docling — это open-source Python-пакет, который превращает любой документ в данные, готовые для LLM!
Скоро появится:
Совместим с macOS, Linux и Windows на архитектурах x86_64 и arm64.
https://github.com/DS4SD/docling
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12🔥5❤1🌭1
10 алгоритмов машинного обучения для начинающих
➖ Linear Regression – линейная регрессия (предсказание числовых значений).
➖ Logistic Regression – логистическая регрессия (бинарная классификация).
➖ CART Algorithm – алгоритм дерева решений (классификация и регрессия).
➖ Naïve Bayes – наивный байесовский классификатор (статистический метод).
➖ KNN Algorithm – метод k ближайших соседей (классификация).
➖ Apriori – поиск ассоциаций в данных (например, анализ покупок).
➖ K-Means – метод k-средних (кластеризация).
➖ PCA – метод главных компонент (снижение размерности).
➖ Random Forest Classification – случайный лес (ансамблевый метод).
➖ AdaBoost – алгоритм бустинга (усиление слабых моделей).
Эти алгоритмы охватывают основные задачи машинного обучения: регрессию, классификацию, кластеризацию и снижение размерности.
👉 @PythonPortal | #ресурсы
Эти алгоритмы охватывают основные задачи машинного обучения: регрессию, классификацию, кластеризацию и снижение размерности.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17🔥5❤4
This media is not supported in your browser
VIEW IN TELEGRAM
На сайте roadmap.sh собрана шикарная подборка идей для практики backend-разработки — от простых CLI-приложений вроде трекера задач до сложных систем бронирования и масштабируемых e-commerce платформ
Проекты разбиты по уровням сложности: начинающий, средний, эксперт
Каждый проект снабжен описанием и рекомендациями, что делает обучение увлекательным и продуктивным
👉 https://roadmap.sh/backend/projects
👉 @PythonPortal | #ресурсы
Проекты разбиты по уровням сложности: начинающий, средний, эксперт
Каждый проект снабжен описанием и рекомендациями, что делает обучение увлекательным и продуктивным
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13🔥8❤6
Перезапустите ядро Jupyter, не теряя переменные
Используйте команду
➖ Это позволяет избежать необходимости явно сохранять данные на диск или использовать сериализацию (pickle).
👉 @PythonPortal | #tips
Используйте команду
store magic
, чтобы сохранять и извлекать переменные даже после перезапуска ядра.Please open Telegram to view this post
VIEW IN TELEGRAM
🔥12❤5👀2
25 репозиториев Github, которые должен знать каждый разработчик Python
В список включены как официальные репозитории языка Python, так и популярные библиотеки и фреймворки, такие как Requests, Flask, Django, Pandas, NumPy и другие. Каждый репозиторий сопровождается кратким описанием его назначения и возможностей.
➖ Цель статьи — предоставить разработчикам полезные инструменты и ресурсы для повышения эффективности и продуктивности в работе с Python.
📝 Читать: клик
👉 @PythonPortal | #статья
В список включены как официальные репозитории языка Python, так и популярные библиотеки и фреймворки, такие как Requests, Flask, Django, Pandas, NumPy и другие. Каждый репозиторий сопровождается кратким описанием его назначения и возможностей.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11❤7🔥3
Создайте своего собственного оператора OpenAI с помощью инструментов с открытым исходным кодом!
Browser Use — это фреймворк с открытым исходным кодом, который позволяет ИИ-агентам использовать браузер всего лишь с несколькими строками Python-кода.
Основные функции:
🟢 100% с открытым исходным кодом
🟢 Интеграция с Gradio для веб-интерфейса
🟢 Работает с Claude, gpt-4o и Llama 3
🟢 Исполнение с участием человека для безопасной работы
Вы просто говорите своему компьютеру, что делать, и Browser Use выполнит задачу.
⏩ Ознакомиться:
https://github.com/browser-use/browser-use
👉 @PythonPortal | #ресурсы
Browser Use — это фреймворк с открытым исходным кодом, который позволяет ИИ-агентам использовать браузер всего лишь с несколькими строками Python-кода.
Основные функции:
Вы просто говорите своему компьютеру, что делать, и Browser Use выполнит задачу.
https://github.com/browser-use/browser-use
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10🔥3❤2🌚2
Книга автора Зеда А. Шоу "Изучение Python 3 сложным путем"
📝 Состоит из 52 тщательно разработанных упражнений, охватывающих темы от работы с командной строкой и структур данных до алгоритмов сортировки, парсинга текста и работы с SQL-базами данных. Каждое упражнение направлено на развитие практических навыков через реализацию проектов, таких как создание блогов, текстовых редакторов и интерпретаторов.
Подход книги основан на активном написании кода и решении реальных задач, что способствует глубокому пониманию и уверенной работе с Python.
📝 Читать бесплатно:
https://learncodethehardway.org/more-python-book/
👉 @PythonPortal | #книги
Подход книги основан на активном написании кода и решении реальных задач, что способствует глубокому пониманию и уверенной работе с Python.
https://learncodethehardway.org/more-python-book/
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17❤5🔥3🏆1
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍32❤5🔥2🏆1
Media is too big
VIEW IN TELEGRAM
Создание бомбардировщика EMAIL с помощью Python.Полное пошаговое руководство ❗️
Автор объясняет, как настроить сервер, выбрать цель, количество писем и отправить их. Всё это упаковано в классы, чтобы было удобнее. Программа ещё красиво оформлена цветным текстом.
↔️ В общем, это туториал по созданию спам-программы, но использовать такое не стоит — это незаконно и неэтично.
⏩ Источник:
https://youtu.be/9R0Zg3MCpUo?si=Aq5GydeZzmEu2G1e
👉 @PythonPortal | #видео
Автор объясняет, как настроить сервер, выбрать цель, количество писем и отправить их. Всё это упаковано в классы, чтобы было удобнее. Программа ещё красиво оформлена цветным текстом.
https://youtu.be/9R0Zg3MCpUo?si=Aq5GydeZzmEu2G1e
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15🔥3🤔2
Zauberzeug NiceGUI 🗒
➖ Это Python-фреймворк для создания веб-интерфейсов с простым синтаксисом. Он позволяет разрабатывать веб-приложения, дашборды и GUI с минимальным количеством кода, используя знакомые конструкции Python.
🟢 Позволяет быстро создавать интерфейсы без необходимости изучать HTML, CSS и JavaScript.
🟢 Поддерживает события (клики, ввод данных) и обновление интерфейса в реальном времени.
🟢 Работает на популярном Python-фреймворке для веб-приложений.
🟢 Можно использовать с машинным обучением, IoT, дашбордами и другими приложениями.
🟢 Кнопки, графики, формы, таблицы и другие элементы доступны "из коробки".
⏩ Ознакомиться:
https://github.com/zauberzeug/nicegui
👉 @PythonPortal | #ресурсы
https://github.com/zauberzeug/nicegui
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥16👍11❤7
Трюк Python
В верхнем примере для ввода трёх значений используются три отдельных input(), что менее удобно:
❌ Пользователь вводит каждое число по отдельности, что требует больше времени. 😨
☑ Лучший способ
В нижнем примере все значения вводятся одной строкой, разделённой пробелами: это упрощает ввод и делает код более лаконичным.
👉 @PythonPortal | #tips
В верхнем примере для ввода трёх значений используются три отдельных input(), что менее удобно:
В нижнем примере все значения вводятся одной строкой, разделённой пробелами: это упрощает ввод и делает код более лаконичным.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍43🔥11👀6❤5
В Python можно выполнить каталог проекта как скрипт.
🍩 Переименуйте основной файл в
🍩 Запустите команду python
Это кратко и удобно, а также упрощает другим пользователям идентификацию основного файла.🥳
👉 @PythonPortal | #tips
__main__.py
.имя_каталога
.Это кратко и удобно, а также упрощает другим пользователям идентификацию основного файла.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍25🔥9❤5🤯1
Grok 3 уже здесь, и он не прошел тест на "отскакивание шестиугольного шара". 😏
Grok 3 — это новейшая версия чат-бота с искусственным интеллектом, разработанного компанией xAI под руководством Илона Маска.
Маск охарактеризовал Grok 3 как «самый умный ИИ на Земле».🤡
Но однако он не очень хорошо справляется с кодированием
👉 @PythonPortal
Grok 3 — это новейшая версия чат-бота с искусственным интеллектом, разработанного компанией xAI под руководством Илона Маска.
Маск охарактеризовал Grok 3 как «самый умный ИИ на Земле».
Но однако он не очень хорошо справляется с кодированием
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍29😁12🔥2👀2
-Telegram-Voice-Recognition-Bot-main.zip
8.7 MB
Скрипт распознание говорящих 🔥
Скрипт представляет собой Telegram-бота для распознавания говорящих по голосовым сообщениям с использованием нейросетевой модели.
Функции:
🟢 Принимает голосовые сообщения
🟢 Анализирует голос и определяет говорящего
🟢 Показывает список известных говорящих (/speakers)
🟢 Работает на основе MFCC-фич и нейросети, обученной на PyTorch
🤖 ЯП: Python 3.11+
📂 Модули: aiogram, aiohttp, torch
🖥 База данных: -
👉 @PythonPortal | #ресурсы
Скрипт представляет собой Telegram-бота для распознавания говорящих по голосовым сообщениям с использованием нейросетевой модели.
Функции:
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥18❤7👍4🏆3