Forwarded from Neurogen
FaceFusion Portable by Neurogen v 3.0.0
FaceFusion - это некий "комбайн" из различных нейросетевых моделей для работы с видео и фото. Программа включает в себя:
- Возможность замены лица на фото или видео (DeepFake)
- Синхронизацию губ в видео по аудиодорожке (LipSync)
- Колоризацию старых черно-белых видео и фото (Frame Colorizer)
- Улучшение качества лица на фото или видео (Face enhancer)
- Увеличение разрешения видео или фото (Upscale)
- Возможность изменения возраста лица (Age Modifier)
- Редактор эмоций и выражения лица (expression restorer и face editor)
Данная сборка является универсальной и работает на всех видеокартах (Nvidia, AMD, Intel) поддерживающих DirectX 12. Для работы с портативной версией программы вам необходимо скачать архив по ссылкам ниже:
Яндекс Диск | Мой сервер
После загрузки распакуйте архив и запустите файл start_portable_universal.bat
FaceFusion - это некий "комбайн" из различных нейросетевых моделей для работы с видео и фото. Программа включает в себя:
- Возможность замены лица на фото или видео (DeepFake)
- Синхронизацию губ в видео по аудиодорожке (LipSync)
- Колоризацию старых черно-белых видео и фото (Frame Colorizer)
- Улучшение качества лица на фото или видео (Face enhancer)
- Увеличение разрешения видео или фото (Upscale)
- Возможность изменения возраста лица (Age Modifier)
- Редактор эмоций и выражения лица (expression restorer и face editor)
Данная сборка является универсальной и работает на всех видеокартах (Nvidia, AMD, Intel) поддерживающих DirectX 12. Для работы с портативной версией программы вам необходимо скачать архив по ссылкам ниже:
Яндекс Диск | Мой сервер
После загрузки распакуйте архив и запустите файл start_portable_universal.bat
Мастер-класс для начинающих разработчиков: Парк аттракционов. БСП.
https://github.com/matvey-seregin/amusement-park/
https://github.com/matvey-seregin/amusement-park/
YouTube
Мастер-класс для начинающих разработчиков: Парк аттракционов. БСП. Часть 1
Продолжение серии вебинаров "Парк аттракционов" для тех, кто хочет изучить платформу 1С:Предприятие, посвящённое БСП.
На первом вебинаре начнём с внедрения библиотеки, настройки управления правами доступа. Далее приступим к адаптации имеющихся функций.
…
На первом вебинаре начнём с внедрения библиотеки, настройки управления правами доступа. Далее приступим к адаптации имеющихся функций.
…
Olares — это open-source платформа для создания собственного облака, предназначенная для использования в качестве альтернативы публичным облачным сервисам, таким как AWS!
Она предоставляет инструменты для управления личными данными, хостинга AI-моделей, запуска приложений и защиты файлов, при этом сохраняя контроль над конфиденциальностью и данными. Основные особенности включают поддержку локального хостинга AI, децентрализованные социальные сети, инфраструктуру на базе Kubernetes для многозвенных решений и безопасность уровня корпоративных стандартов. Olares акцентирует внимание на гибкости, владении данными и конфиденциальности с возможностью интеграции различных приложений и инструментов для разработки.
Она предоставляет инструменты для управления личными данными, хостинга AI-моделей, запуска приложений и защиты файлов, при этом сохраняя контроль над конфиденциальностью и данными. Основные особенности включают поддержку локального хостинга AI, децентрализованные социальные сети, инфраструктуру на базе Kubernetes для многозвенных решений и безопасность уровня корпоративных стандартов. Olares акцентирует внимание на гибкости, владении данными и конфиденциальности с возможностью интеграции различных приложений и инструментов для разработки.
GitHub
GitHub - beclab/Olares: Olares: An Open-Source Sovereign Cloud OS for Local AI
Olares: An Open-Source Sovereign Cloud OS for Local AI - beclab/Olares
https://huggingface.co/mistralai/Mistral-Small-3.1-24B-Instruct-2503
Этот документ описывает модель Mistral-Small-3.1-24B-Instruct-2503, улучшенную версию Mistral Small 3. Она имеет следующие ключевые особенности:
Понимание изображений: Модель может анализировать изображения и предоставлять информацию на основе визуального контента.
Длинный контекст: Поддерживает контекст до 128k токенов.
Многоязычность: Поддерживает десятки языков, включая русский.
Ориентированность на агентов: Поддерживает вызов функций и вывод в формате JSON.
Продвинутые рассуждения: Улучшены возможности ведения диалога и рассуждений.
Открытая лицензия: Имеет лицензию Apache 2.0, разрешающую коммерческое и некоммерческое использование.
В документе также приводятся результаты тестов производительности модели в различных задачах, таких как понимание текста, изображений, многоязычность и работа с длинным контекстом. Подчеркивается, что модель подходит для использования в чат-ботах, для вызова функций, для работы с большими документами и для локального использования.
huggingface.co
mistralai/Mistral-Small-3.1-24B-Instruct-2503 · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
Forwarded from Data Secrets
OpenAI начали встраивать MCP от Anthropic в свои продукты
Природа настолько очистилась Model Context Protocol от антропиков стал настолько популярным и так быстро оказался золотым стандартом, что даже OpenAI не устояли и объявили о том, что будут его использовать.
Сейчас они уже встроили MCP в библиотеку Agents SDK (пост о ней). То есть теперь при разработке агентов к ним можно прикручивать серверы MCP и тем самым расширять их скиллы.
Также обещают завести протокол в API и дескотопное приложение (вот это будет особенно круто).
Что такое MCP? Это открытый протокол, который стандартизирует то, как приложения/сайты/базы данных предоставляют контекст LLM. Раньше, чтобы ваша моделька "увидела" и могла постоянно использовать данные из внешнего источника (ну, например, гугл календаря), приходилось каждый раз плясать с бубном и реализовывать все с нуля.
А теперь есть MCP, и он работает как часы со всеми возможными локальными и удаленными источниками данных. Подробнее – в этом и этом постах.
Протокол крут и все его полюбили, потому что он (а) понятный и супер удобный и (б) достаточно безопасный. Смотрите сами: таких MCP уже наплодили миллион для абсолютно всего, вот здесь есть готовые на любой вкус.
Сейчас они уже встроили MCP в библиотеку Agents SDK (пост о ней). То есть теперь при разработке агентов к ним можно прикручивать серверы MCP и тем самым расширять их скиллы.
Также обещают завести протокол в API и дескотопное приложение (вот это будет особенно круто).
Что такое MCP? Это открытый протокол, который стандартизирует то, как приложения/сайты/базы данных предоставляют контекст LLM. Раньше, чтобы ваша моделька "увидела" и могла постоянно использовать данные из внешнего источника (ну, например, гугл календаря), приходилось каждый раз плясать с бубном и реализовывать все с нуля.
А теперь есть MCP, и он работает как часы со всеми возможными локальными и удаленными источниками данных. Подробнее – в этом и этом постах.
Протокол крут и все его полюбили, потому что он (а) понятный и супер удобный и (б) достаточно безопасный. Смотрите сами: таких MCP уже наплодили миллион для абсолютно всего, вот здесь есть готовые на любой вкус.
Forwarded from Data Secrets
Qwen2.5-Omni-7B может принимать на вход видео, аудио, текст и картинки, и отвечать аудио или текстом. То есть с моделькой теперь можно общаться по «видеосвязи». Немного технических деталей:
Метрики для 7В замечательные. Обходит даже Gemini 1.5 Pro.
Веса (лицензия Apache 2.0)
Статья
Попробовать
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
OpenAI добавили поддержку MCP протокола от Anthropic.
MCP штука не новая, но пока была больше в области экспериментов и прототипов.
Однако количество этих прототипов, быстрое развитие и перспективность технологии привели к тому, что OpenAI официально добавил поддержку Model Context Protocol (MCP) в свой Agents SDK.
Сразу после обновления спецификации MCP, Альтман подтвердил это в X, отметив, что поддержка уже доступна в Agents SDK, а скоро появится и в ChatGPT Desktop и Responses API.
MCP — это открытый протокол, который стандартизирует взаимодействие AI-моделей с внешними источниками данных и инструментами. Его часто сравнивают с USB-C для AI: универсальный интерфейс, позволяющий подключать различные инструменты к AI-моделям без необходимости создавать уникальные интеграции для каждого сервиса.
На практике это даст:
- Упрощение разработки AI-решений
- Стандартизация интеграций
- Расширение возможностей AI-агентов (доступ к большему количеству инструментов)
Что нового в обновлении MCP?
Вчерашнее обновление протокола включает несколько важных изменений:
- OAuth 2.1 для авторизации (повышение безопасности)
- Улучшенный HTTP Transport с поддержкой двунаправленного обмена
- JSON-RPC Batching (отправка нескольких запросов одновременно)
- Tool Annotations (метаданные для описания инструментов)
Microsoft выпустила Playwright-MCP сервер, который позволяет AI-агентам автоматизировать взаимодействие с браузером с использованием MCP.
Кто ещё использует MCP?
Помимо гигантов OpenAI и Microsoft, протокол активно внедряется и другими игроками:
Такие компании как Block и Apollo интегрировали MCP в свои системы. Инструменты для разработчиков, включая Replit, Windsurf и Cursor, используют его для улучшения помощи при кодировании. Apify создала MCP-сервер для задач извлечения данных.
Техника:
MCP использует модульную архитектуру на базе JSON-RPC 2.0, разделенную на слои:
- Базовый транспорт
- Управление жизненным циклом
- Серверные возможности (ресурсы, промпты)
- Клиентские возможности (сэмплирование, логирование)
Разработчики могут выбирать компоненты в зависимости от своих задач.
Главный вопрос: становится ли MCP новым индустриальным стандартом?
С поддержкой от Anthropic, LangChain, и теперь Microsoft и OpenAI, по идее, имеет все шансы стать общим языком для агентских интеграций.
MCP документация от Anthropic
GitHub
Примеры от OpenAI
MCP штука не новая, но пока была больше в области экспериментов и прототипов.
Однако количество этих прототипов, быстрое развитие и перспективность технологии привели к тому, что OpenAI официально добавил поддержку Model Context Protocol (MCP) в свой Agents SDK.
Сразу после обновления спецификации MCP, Альтман подтвердил это в X, отметив, что поддержка уже доступна в Agents SDK, а скоро появится и в ChatGPT Desktop и Responses API.
MCP — это открытый протокол, который стандартизирует взаимодействие AI-моделей с внешними источниками данных и инструментами. Его часто сравнивают с USB-C для AI: универсальный интерфейс, позволяющий подключать различные инструменты к AI-моделям без необходимости создавать уникальные интеграции для каждого сервиса.
На практике это даст:
- Упрощение разработки AI-решений
- Стандартизация интеграций
- Расширение возможностей AI-агентов (доступ к большему количеству инструментов)
Что нового в обновлении MCP?
Вчерашнее обновление протокола включает несколько важных изменений:
- OAuth 2.1 для авторизации (повышение безопасности)
- Улучшенный HTTP Transport с поддержкой двунаправленного обмена
- JSON-RPC Batching (отправка нескольких запросов одновременно)
- Tool Annotations (метаданные для описания инструментов)
Microsoft выпустила Playwright-MCP сервер, который позволяет AI-агентам автоматизировать взаимодействие с браузером с использованием MCP.
Кто ещё использует MCP?
Помимо гигантов OpenAI и Microsoft, протокол активно внедряется и другими игроками:
Такие компании как Block и Apollo интегрировали MCP в свои системы. Инструменты для разработчиков, включая Replit, Windsurf и Cursor, используют его для улучшения помощи при кодировании. Apify создала MCP-сервер для задач извлечения данных.
Техника:
MCP использует модульную архитектуру на базе JSON-RPC 2.0, разделенную на слои:
- Базовый транспорт
- Управление жизненным циклом
- Серверные возможности (ресурсы, промпты)
- Клиентские возможности (сэмплирование, логирование)
Разработчики могут выбирать компоненты в зависимости от своих задач.
Главный вопрос: становится ли MCP новым индустриальным стандартом?
С поддержкой от Anthropic, LangChain, и теперь Microsoft и OpenAI, по идее, имеет все шансы стать общим языком для агентских интеграций.
MCP документация от Anthropic
GitHub
Примеры от OpenAI
GitHub
GitHub - microsoft/playwright-mcp: Playwright MCP server
Playwright MCP server. Contribute to microsoft/playwright-mcp development by creating an account on GitHub.
https://docs.mistral.ai/capabilities/document/
Процессор OCR (Optical Character Recognition), основанный на модели mistral-ocr-latest, который позволяет извлекать текст и структурированный контент из PDF-документов.
Основные особенности:
Извлекает текст, сохраняя структуру и иерархию документа.
Сохраняет форматирование, такое как заголовки, абзацы, списки и таблицы.
Возвращает результаты в формате markdown для упрощения разбора и рендеринга.
Обрабатывает сложные макеты, включая многоколоночный текст и смешанный контент.
Обрабатывает документы в масштабе с высокой точностью.
Поддерживает несколько форматов документов, включая PDF, изображения и загруженные документы.
Процессор OCR возвращает как извлеченный текст, так и метаданные о структуре документа, что упрощает работу с распознанным контентом программным способом.
В документе также приведены примеры кода на Python, Typescript и Curl для использования OCR с PDF.
Выводы:
Новый процессор OCR от Mistral AI позволяет эффективно извлекать текст и структурированную информацию из документов.
Процессор поддерживает различные форматы и сложные макеты.
Возвращает результаты в удобном формате markdown.
Предоставлены примеры кода для интеграции в различные приложения.
docs.mistral.ai
OCR and Document Understanding | Mistral AI Large Language Models
Document OCR processor