Kosmodev AI
https://github.com/Ivlad003/any2md
Release Notes v0.1.1
Image Extraction Fix
- PDF зображення тепер коректно витягуються — раніше зберігались сирі zlib-дані замість валідних PNG
- Автоматичне визначення формату (PNG/JPEG/GIF/WEBP) по magic bytes
- Підтримка CMYK→RGB конвертації
Розумні динамічні пороги
- Всі захардкоджені числа (відстані, толеранси, пороги) замінені на PageMetrics — автоматично обчислюються з реальних даних документа
(розмір шрифту, міжрядковий інтервал, ширина символів, ширина сторінки)
- Таблиці та параграфи тепер краще розпізнаються на будь-яких PDF, не тільки на конкретних
Покращення таблиць та тексту
- Виправлено злиття розірваних заголовків
- Більше контенту захоплюється в комірках таблиць
- Фільтрація шуму (номери сторінок, timestamps, OneNote артефакти)
- Злиття розірваних слів через дефіс та продовжень параграфів
Image Extraction Fix
- PDF зображення тепер коректно витягуються — раніше зберігались сирі zlib-дані замість валідних PNG
- Автоматичне визначення формату (PNG/JPEG/GIF/WEBP) по magic bytes
- Підтримка CMYK→RGB конвертації
Розумні динамічні пороги
- Всі захардкоджені числа (відстані, толеранси, пороги) замінені на PageMetrics — автоматично обчислюються з реальних даних документа
(розмір шрифту, міжрядковий інтервал, ширина символів, ширина сторінки)
- Таблиці та параграфи тепер краще розпізнаються на будь-яких PDF, не тільки на конкретних
Покращення таблиць та тексту
- Виправлено злиття розірваних заголовків
- Більше контенту захоплюється в комірках таблиць
- Фільтрація шуму (номери сторінок, timestamps, OneNote артефакти)
- Злиття розірваних слів через дефіс та продовжень параграфів
Kosmodev AI
https://github.com/Ivlad003/ai-google-meet-assistant
3 фічі запушено в 10 комітах:
- Agent Mode — новий режим name_only, word-boundary matching, watch канал для live-зміни режиму
- Summary — /api/summary endpoint, панель в UI з copy кнопкою, гард на порожній транскрипт
- WAV fix — graceful shutdown замість abort, reasoning model фікс в chat_once()
- Agent Mode — новий режим name_only, word-boundary matching, watch канал для live-зміни режиму
- Summary — /api/summary endpoint, панель в UI з copy кнопкою, гард на порожній транскрипт
- WAV fix — graceful shutdown замість abort, reasoning model фікс в chat_once()
Kosmodev AI
https://github.com/Ivlad003/ai-google-meet-assistant
Що нового
Jarvis тепер записує відео зустрічі у файл. Запис відбувається автоматично через Playwright (720p,
VP8).
Як увімкнути
Додати в jarvis.config.json:
"record_video": true
Як працює
1. Бот приєднується до зустрічі і записує екран браузера
2. При зупинці (Ctrl+C) — відео фіналізується і ремуксується у MKV через ffmpeg
3. Якщо ffmpeg не встановлено — зберігається як WebM
4. Файл з'являється поряд з аудіо та транскриптом у ~/Library/Application Support/jarvis/sessions/
Що змінилось у shutdown
Раніше Jarvis просто вбивав бота. Тепер — надсилає команду shutdown через WebSocket, бот коректно
завершує запис і виходить сам. Якщо бот не відповів за 10 секунд — примусовий kill.
Jarvis тепер записує відео зустрічі у файл. Запис відбувається автоматично через Playwright (720p,
VP8).
Як увімкнути
Додати в jarvis.config.json:
"record_video": true
Як працює
1. Бот приєднується до зустрічі і записує екран браузера
2. При зупинці (Ctrl+C) — відео фіналізується і ремуксується у MKV через ffmpeg
3. Якщо ffmpeg не встановлено — зберігається як WebM
4. Файл з'являється поряд з аудіо та транскриптом у ~/Library/Application Support/jarvis/sessions/
Що змінилось у shutdown
Раніше Jarvis просто вбивав бота. Тепер — надсилає команду shutdown через WebSocket, бот коректно
завершує запис і виходить сам. Якщо бот не відповів за 10 секунд — примусовий kill.
https://playstext.com
Нові можливості
- AI Переклад тексту — тепер можна перекласти текст на 16 мов перед генерацією аудіо. Працює з усіма
типами введення: текст, URL, PDF
- AI Стиснення тексту — скорочення довгих текстів за допомогою ШІ перед озвучкою. Економить кредити та
час прослуховування
Покращення
- Мобільна версія — виправлено завантаження PDF та генерацію аудіо з телефону
- Аудіоплеєр для спільних посилань — замінено на WaveSurfer.js для стабільного відтворення
- Лічильник прослуховувань — тепер рахується тільки реальне відтворення, а не перегляд сторінки
Виправлення
- Виправлено помилку авторизації, яка спричиняла зациклення входу
- Виправлено завантаження та обробку PDF-файлів
- Покращено стабільність роботи з URL-посиланнями
Нові можливості
- AI Переклад тексту — тепер можна перекласти текст на 16 мов перед генерацією аудіо. Працює з усіма
типами введення: текст, URL, PDF
- AI Стиснення тексту — скорочення довгих текстів за допомогою ШІ перед озвучкою. Економить кредити та
час прослуховування
Покращення
- Мобільна версія — виправлено завантаження PDF та генерацію аудіо з телефону
- Аудіоплеєр для спільних посилань — замінено на WaveSurfer.js для стабільного відтворення
- Лічильник прослуховувань — тепер рахується тільки реальне відтворення, а не перегляд сторінки
Виправлення
- Виправлено помилку авторизації, яка спричиняла зациклення входу
- Виправлено завантаження та обробку PDF-файлів
- Покращено стабільність роботи з URL-посиланнями
❤1