Forwarded from Machinelearning
Bytedance опубликовала инфу о проекте DreamLite - компактной диффузионки на 390 млн. параметров, которая сможет работать локально на телефоне.
Под капотом - сильно сжатая версия U-Net (от SDXL), автоэнкодер TinyVAE и текстовый Qwen3-VL-2B.
Для трейна используется схема прогрессивного совместного обучения для стабильности генерации и дистилляция DMD2, которая сокращает инференс до 4 шагов.
В описании заявляют, что на iPhone17 Pro картинка размером 1024х1024 генерится около 3 секунд, а в техотчете - что на Xiaomi 14 создание или редактирование изображение тем же размером займет менее 1 секунды.
На синтетике DreamLite выбивает 0.72 (генерация, GenEval) и 4.11 (редактирование, ImgEdit)
Пока опубликованы только техотчет, репозиторий пустой.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3❤1💯1
Apple Docs MCP дает доступ к официальной документации Apple для разработчиков по языку Swift, фреймворкам, API, SwiftUI, UIKit и видеоматериалам WWDC через Model Context Protocol. Это позволяет реализовать, например, поиск документации по iOS, macOS, watchOS, tvOS и visionOS с помощью ИИ-запросов на естественном языке.
Получайте мгновенный доступ к примерам кода на Swift/Objective-C, справочникам по API и техническим руководствам прямо в Claude, Cursor или любом другом совместимом с MCP ИИ-помощнике.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6
📄 Markdown Preview для macOS 🚀
Приложение для быстрого просмотра Markdown-файлов с нативной поддержкой на macOS. Позволяет загружать
🚀 Основные моменты:
- Нативная рендеринг с использованием
- Поддержка диаграмм Mermaid и математических уравнений.
- Удобное оглавление и панель инспектора для метаданных.
- Быстрый просмотр через системные функции без запуска приложения.
- Возможность открытия в редакторах кода.
📌 GitHub: https://github.com/pluk-inc/md-preview
#swift
Приложение для быстрого просмотра Markdown-файлов с нативной поддержкой на macOS. Позволяет загружать
.md файлы и получать чистый, прокручиваемый предварительный просмотр с оглавлением и поддержкой диаграмм и математических формул.🚀 Основные моменты:
- Нативная рендеринг с использованием
WKWebView.- Поддержка диаграмм Mermaid и математических уравнений.
- Удобное оглавление и панель инспектора для метаданных.
- Быстрый просмотр через системные функции без запуска приложения.
- Возможность открытия в редакторах кода.
📌 GitHub: https://github.com/pluk-inc/md-preview
#swift
GitHub
GitHub - pluk-inc/md-preview: A simple Markdown viewer for reading .md files
A simple Markdown viewer for reading .md files. Contribute to pluk-inc/md-preview development by creating an account on GitHub.
❤3🔥1
Forwarded from Android разработка
Google показала Android 17 - систему, где Gemini встраивают почти в каждый слой
Android 17 выглядит не как обычное обновление с новыми иконками, а как попытка превратить смартфон в полноценного AI-ассистента.
Что обещают внутри:
- ИИ сможет взаимодействовать с приложениями от имени пользователя
- система будет собирать автоматизации под конкретные задачи
- появятся кастомные AI-виджеты
- голосовой ввод научат чистить от пауз, мусора и слов-паразитов
- Gemini Intelligence станет частью повседневных сценариев, а не отдельной кнопкой в приложении
Одна из самых заметных фич - Screen Reactions. Она позволит одновременно записывать экран и себя, а потом накладывать реакцию поверх видео, комментариев или другого контента. По сути, встроенный инструмент для реактов и коротких роликов без стороннего софта.
Отдельно Google анонсировала Googlebook - премиальные компьютеры под ChromeOS и глубокую интеграцию Gemini Intelligence.
Похоже, Google больше не продаёт просто Android и ChromeOS.
Она собирает экосистему, где ИИ становится стандартным интерфейсом между пользователем, приложениями и устройством.
Android 17 выглядит не как обычное обновление с новыми иконками, а как попытка превратить смартфон в полноценного AI-ассистента.
Что обещают внутри:
- ИИ сможет взаимодействовать с приложениями от имени пользователя
- система будет собирать автоматизации под конкретные задачи
- появятся кастомные AI-виджеты
- голосовой ввод научат чистить от пауз, мусора и слов-паразитов
- Gemini Intelligence станет частью повседневных сценариев, а не отдельной кнопкой в приложении
Одна из самых заметных фич - Screen Reactions. Она позволит одновременно записывать экран и себя, а потом накладывать реакцию поверх видео, комментариев или другого контента. По сути, встроенный инструмент для реактов и коротких роликов без стороннего софта.
Отдельно Google анонсировала Googlebook - премиальные компьютеры под ChromeOS и глубокую интеграцию Gemini Intelligence.
Похоже, Google больше не продаёт просто Android и ChromeOS.
Она собирает экосистему, где ИИ становится стандартным интерфейсом между пользователем, приложениями и устройством.
👎9🔥2