Python/ django

📝 Редактирование PDF с помощью ИИ 🚀

Nano PDF - это инструмент командной строки для редактирования PDF-документов с использованием естественного языка. Он позволяет вносить изменения в слайды, добавлять новые и сохранять текстовый слой с помощью OCR. Работает на базе модели Gemini 3 Pro Image.

🚀 Основные моменты:
- Редактирование слайдов по текстовым командам
- Генерация новых слайдов в стиле существующих
- Поддержка многопоточной обработки для повышения скорости
- Сохранение текстового слоя с помощью OCR

📌 GitHub: https://github.com/gavrielc/Nano-PDF

#python

❤5🔥3

7.07K views10:00

Python/ django

🎤 Инновационная система распознавания речи Fun-ASR

Fun-ASR — мощная модель распознавания речи, обученная на миллионах часов аудиоданных. Она поддерживает 31 язык и обеспечивает высокую точность в сложных условиях, таких как шумные помещения. Модель адаптирована для профессиональных терминов в таких областях, как образование и финансы.

🚀 Основные моменты:
- Высокая точность распознавания до 93% в шумных условиях.
- Поддержка 31 языка с акцентом на восточноазиатские языки.
- Оптимизация для распознавания диалектов и региональных акцентов.
- Способность распознавать текст песен на фоне музыки.

📌 GitHub: https://github.com/FunAudioLLM/Fun-ASR

@pythonl

#python

❤8🔥8👍1

7.92K views10:01

About

Blog

Apps

Platform