Kosmodev AI
42 subscribers
33 photos
25 videos
5 files
59 links
https://www.youtube.com/@kosmodev_ai
Канал про те, як я пилю різний софт. Тут буде AI, Claude, код і продакшен — а ще мій щоденний біль: модель “майже зробила”, промпт “майже працює”, і баг “майже не мій”.
Download Telegram
Kosmodev AI
https://github.com/Ivlad003/any2md
Release Notes v0.1.1

Image Extraction Fix
- PDF зображення тепер коректно витягуються — раніше зберігались сирі zlib-дані замість валідних PNG
- Автоматичне визначення формату (PNG/JPEG/GIF/WEBP) по magic bytes
- Підтримка CMYK→RGB конвертації

Розумні динамічні пороги
- Всі захардкоджені числа (відстані, толеранси, пороги) замінені на PageMetrics — автоматично обчислюються з реальних даних документа
(розмір шрифту, міжрядковий інтервал, ширина символів, ширина сторінки)
- Таблиці та параграфи тепер краще розпізнаються на будь-яких PDF, не тільки на конкретних

Покращення таблиць та тексту
- Виправлено злиття розірваних заголовків
- Більше контенту захоплюється в комірках таблиць
- Фільтрація шуму (номери сторінок, timestamps, OneNote артефакти)
- Злиття розірваних слів через дефіс та продовжень параграфів
Kosmodev AI
https://github.com/Ivlad003/ai-google-meet-assistant
3 фічі запушено в 10 комітах:

- Agent Mode — новий режим name_only, word-boundary matching, watch канал для live-зміни режиму
- Summary — /api/summary endpoint, панель в UI з copy кнопкою, гард на порожній транскрипт
- WAV fix — graceful shutdown замість abort, reasoning model фікс в chat_once()
Kosmodev AI
https://github.com/Ivlad003/ai-google-meet-assistant
Що нового

Jarvis тепер записує відео зустрічі у файл. Запис відбувається автоматично через Playwright (720p,
VP8).

Як увімкнути

Додати в jarvis.config.json:
"record_video": true

Як працює

1. Бот приєднується до зустрічі і записує екран браузера
2. При зупинці (Ctrl+C) — відео фіналізується і ремуксується у MKV через ffmpeg
3. Якщо ffmpeg не встановлено — зберігається як WebM
4. Файл з'являється поряд з аудіо та транскриптом у ~/Library/Application Support/jarvis/sessions/

Що змінилось у shutdown

Раніше Jarvis просто вбивав бота. Тепер — надсилає команду shutdown через WebSocket, бот коректно
завершує запис і виходить сам. Якщо бот не відповів за 10 секунд — примусовий kill.
😁3
https://playstext.com

Нові можливості

- AI Переклад тексту — тепер можна перекласти текст на 16 мов перед генерацією аудіо. Працює з усіма
типами введення: текст, URL, PDF
- AI Стиснення тексту — скорочення довгих текстів за допомогою ШІ перед озвучкою. Економить кредити та
час прослуховування

Покращення

- Мобільна версія — виправлено завантаження PDF та генерацію аудіо з телефону
- Аудіоплеєр для спільних посилань — замінено на WaveSurfer.js для стабільного відтворення
- Лічильник прослуховувань — тепер рахується тільки реальне відтворення, а не перегляд сторінки

Виправлення

- Виправлено помилку авторизації, яка спричиняла зациклення входу
- Виправлено завантаження та обробку PDF-файлів
- Покращено стабільність роботи з URL-посиланнями
1
😢1
До
Після
🔥1🤔1
🤣2