Liquid AI выпустили LFM2.5-VL-450M - vision-language модель для edge-устройств.
Обрабатывает картинку 512×512 за ~240мс на устройстве, без облака. Хватает на 4 FPS видеопоток с пониманием происходящего, а не просто детекцией.
Главное: один инференс заменяет привычную связку детектор → классификатор → эвристики. Весь multi-stage пайплайн в одном проходе.
В релизе добавили bounding box prediction (81.28 на RefCOCO-M), мультиязычный визуал на 8 языках и function calling.
Крутится на Jetson Orin, Samsung S25 Ultra, AMD 395+ Max.
Веса открыты.
huggingface.co/spaces/LiquidAI/LFM2-VL-WebGPU
Обрабатывает картинку 512×512 за ~240мс на устройстве, без облака. Хватает на 4 FPS видеопоток с пониманием происходящего, а не просто детекцией.
Главное: один инференс заменяет привычную связку детектор → классификатор → эвристики. Весь multi-stage пайплайн в одном проходе.
В релизе добавили bounding box prediction (81.28 на RefCOCO-M), мультиязычный визуал на 8 языках и function calling.
Крутится на Jetson Orin, Samsung S25 Ultra, AMD 395+ Max.
Веса открыты.
huggingface.co/spaces/LiquidAI/LFM2-VL-WebGPU
❤3
The Deck
Открытый, кроссплатформенный, мобильный движок пошаговых карточных игр на Flutter.
🎮 Растущая библиотека самых известных игр для вечеринок
⚡️ Быстрая и безопасная игра с использованием локального сетевого подключения
Основные особенности:
- Работа с колодами карт в программном виде.
- Гибкость в настройке и использовании.
- Поддержка различных сценариев использования.
https://github.com/xajik/thedeck
Открытый, кроссплатформенный, мобильный движок пошаговых карточных игр на Flutter.
🎮 Растущая библиотека самых известных игр для вечеринок
⚡️ Быстрая и безопасная игра с использованием локального сетевого подключения
Основные особенности:
- Работа с колодами карт в программном виде.
- Гибкость в настройке и использовании.
- Поддержка различных сценариев использования.
https://github.com/xajik/thedeck
🧑🏫 Clicky: Ваш AI-наставник рядом с курсором
Clicky — это умный помощник, который помогает учиться, взаимодействуя с вашим экраном. Он может видеть, говорить и указывать на важные элементы, создавая эффект настоящего учителя. Открытый исходный код позволяет разработчикам настраивать и расширять функциональность.
🚀Основные моменты:
- AI-помощник в меню для macOS
- Интеграция с Claude, AssemblyAI и ElevenLabs
- Поддержка голосового ввода и экранного захвата
- Легкость в настройке и расширении функционала
📌 GitHub: https://github.com/farzaa/clicky
#swift
Clicky — это умный помощник, который помогает учиться, взаимодействуя с вашим экраном. Он может видеть, говорить и указывать на важные элементы, создавая эффект настоящего учителя. Открытый исходный код позволяет разработчикам настраивать и расширять функциональность.
🚀Основные моменты:
- AI-помощник в меню для macOS
- Интеграция с Claude, AssemblyAI и ElevenLabs
- Поддержка голосового ввода и экранного захвата
- Легкость в настройке и расширении функционала
📌 GitHub: https://github.com/farzaa/clicky
#swift
Forwarded from Machinelearning
Bytedance опубликовала инфу о проекте DreamLite - компактной диффузионки на 390 млн. параметров, которая сможет работать локально на телефоне.
Под капотом - сильно сжатая версия U-Net (от SDXL), автоэнкодер TinyVAE и текстовый Qwen3-VL-2B.
Для трейна используется схема прогрессивного совместного обучения для стабильности генерации и дистилляция DMD2, которая сокращает инференс до 4 шагов.
В описании заявляют, что на iPhone17 Pro картинка размером 1024х1024 генерится около 3 секунд, а в техотчете - что на Xiaomi 14 создание или редактирование изображение тем же размером займет менее 1 секунды.
На синтетике DreamLite выбивает 0.72 (генерация, GenEval) и 4.11 (редактирование, ImgEdit)
Пока опубликованы только техотчет, репозиторий пустой.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3❤1💯1
Apple Docs MCP дает доступ к официальной документации Apple для разработчиков по языку Swift, фреймворкам, API, SwiftUI, UIKit и видеоматериалам WWDC через Model Context Protocol. Это позволяет реализовать, например, поиск документации по iOS, macOS, watchOS, tvOS и visionOS с помощью ИИ-запросов на естественном языке.
Получайте мгновенный доступ к примерам кода на Swift/Objective-C, справочникам по API и техническим руководствам прямо в Claude, Cursor или любом другом совместимом с MCP ИИ-помощнике.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6
📄 Markdown Preview для macOS 🚀
Приложение для быстрого просмотра Markdown-файлов с нативной поддержкой на macOS. Позволяет загружать
🚀 Основные моменты:
- Нативная рендеринг с использованием
- Поддержка диаграмм Mermaid и математических уравнений.
- Удобное оглавление и панель инспектора для метаданных.
- Быстрый просмотр через системные функции без запуска приложения.
- Возможность открытия в редакторах кода.
📌 GitHub: https://github.com/pluk-inc/md-preview
#swift
Приложение для быстрого просмотра Markdown-файлов с нативной поддержкой на macOS. Позволяет загружать
.md файлы и получать чистый, прокручиваемый предварительный просмотр с оглавлением и поддержкой диаграмм и математических формул.🚀 Основные моменты:
- Нативная рендеринг с использованием
WKWebView.- Поддержка диаграмм Mermaid и математических уравнений.
- Удобное оглавление и панель инспектора для метаданных.
- Быстрый просмотр через системные функции без запуска приложения.
- Возможность открытия в редакторах кода.
📌 GitHub: https://github.com/pluk-inc/md-preview
#swift
GitHub
GitHub - pluk-inc/md-preview: A simple Markdown viewer for reading .md files
A simple Markdown viewer for reading .md files. Contribute to pluk-inc/md-preview development by creating an account on GitHub.
❤3🔥1
Forwarded from Android разработка
Google показала Android 17 - систему, где Gemini встраивают почти в каждый слой
Android 17 выглядит не как обычное обновление с новыми иконками, а как попытка превратить смартфон в полноценного AI-ассистента.
Что обещают внутри:
- ИИ сможет взаимодействовать с приложениями от имени пользователя
- система будет собирать автоматизации под конкретные задачи
- появятся кастомные AI-виджеты
- голосовой ввод научат чистить от пауз, мусора и слов-паразитов
- Gemini Intelligence станет частью повседневных сценариев, а не отдельной кнопкой в приложении
Одна из самых заметных фич - Screen Reactions. Она позволит одновременно записывать экран и себя, а потом накладывать реакцию поверх видео, комментариев или другого контента. По сути, встроенный инструмент для реактов и коротких роликов без стороннего софта.
Отдельно Google анонсировала Googlebook - премиальные компьютеры под ChromeOS и глубокую интеграцию Gemini Intelligence.
Похоже, Google больше не продаёт просто Android и ChromeOS.
Она собирает экосистему, где ИИ становится стандартным интерфейсом между пользователем, приложениями и устройством.
Android 17 выглядит не как обычное обновление с новыми иконками, а как попытка превратить смартфон в полноценного AI-ассистента.
Что обещают внутри:
- ИИ сможет взаимодействовать с приложениями от имени пользователя
- система будет собирать автоматизации под конкретные задачи
- появятся кастомные AI-виджеты
- голосовой ввод научат чистить от пауз, мусора и слов-паразитов
- Gemini Intelligence станет частью повседневных сценариев, а не отдельной кнопкой в приложении
Одна из самых заметных фич - Screen Reactions. Она позволит одновременно записывать экран и себя, а потом накладывать реакцию поверх видео, комментариев или другого контента. По сути, встроенный инструмент для реактов и коротких роликов без стороннего софта.
Отдельно Google анонсировала Googlebook - премиальные компьютеры под ChromeOS и глубокую интеграцию Gemini Intelligence.
Похоже, Google больше не продаёт просто Android и ChromeOS.
Она собирает экосистему, где ИИ становится стандартным интерфейсом между пользователем, приложениями и устройством.
👎9🔥2