Михаил Омельченко
4.43K subscribers
739 photos
164 videos
4 files
528 links
Меня зовут Михаил Омельченко.
Я ментор и ex-CTO. 20 лет в IT.

Рассказываю о нейросетях, веб разработке, программировании и IT простым языком.

YouTube - https://www.youtube.com/c/DjangoSchool
Download Telegram
В Google AI Studio появился генератор речи

- Библиотека голосов
- Все звучат по-человечески
- Поддерживаются текстовые эмоции: напишешь смех или кашель – и в озвучке будет это учитываться
- Несколько дикторов в одной записи
- Поддерживается русский язык

Ссылка

#ai #ии #нейросети #gemini
This media is not supported in your browser
VIEW IN TELEGRAM
Быстренько снял видео и озвучил в Google AI Studio. Как пользоваться озвучкой текста.
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Grok + Telegram

xAI и Telegram подписали годовое соглашение, в рамках сотрудничества Телеграм получит 300 млн долларов наличными и акциями от xAI, а также 50% дохода от подписок xAI, проданных через приложение.

Grok встроят в поисковую строку Telegram, запросы можно будет делать из поиска. Авто-резюмирование чатов и документов, «умная» правка текста, модерация групп. Grok будет генерировать стикеры и тексты по запросу.

Подписка на Grok будет оформляется прямо в приложении. 

Произойдет это событие уже этим летом.

#grok #telegram
Please open Telegram to view this post
VIEW IN TELEGRAM
Михаил Омельченко
Мастерство промпт-инжиниринга.pdf
Обновил книгу.
Не большие правки в тексте.
В видеоредакторе Filmora появилась функция для генерации видео по сценарию.

Пишите свою идею. ИИ генерирует сценарий: основной сюжет, визуал, субтитры и звуковые эффекты.
Сценарий, а в будущем видео разделено по сценам.

Есть возможность редактирования текста и загрузки своего изображения на основе которого будет сделана генерация видео.

Готовый результат появляется в видеоредакторе.

Вообще редактор напичкан разными ИИшными штуками.

#ai #ии #нейросети #filmora
FLUX.1 Kontext разработка Black Forest Labs, представлена 29 мая 2025 г.

Модель предназначена для точечного редактирования изображений по текстовому запросу или с учётом прикреплённого референса.

Она меняет указанный фрагмент кадра, стараясь сохранить остальную сцену без искажений.

Принимает одновременно текст и изображение, что упрощает работу с характерами, реквизитом и шрифтами.

Делает упор на соблюдение стиля и целостность персонажей.

Доступны два основных варианта:
▫️ Kontext pro рассчитан на интерактивные правки.

▫️ Kontext max с повышенной точностью и улучшенной работой с типографикой.

#ai #нейросеть #flux
Как-то само собой появилась услуга по доработке и разработке промптов.

Ко мне с таким вопросом обратилось несколько человек.

Если у вас есть подобная задача, пишите в лс @DJWOMS
С задаче по определенью текста в AI-детекторе я справился уже давно.

Было видео на эту тему. Также помог с промптом для переписывания большого объема текста.

Сейчас работаю, чтобы после рерайта, выдавало > 90% уникальности текста.

Предварительный результат на скрине.
Отправляем вопрос в ТГ бот. Затем отправляем файл (он небольшой, поэтому без RAG) в LLM и даем ответ пользователю.

#ai #нейросеть #n8n
Cлужбы и платформы, позволяющие внедрять AI-агентов

Low-\No-code автоматизация рабочих процессов
▫️ n8n — open-source конструктор сценариев. Есть готовые узлы для OpenAI и других LLM.

▫️ Zapier Agents — создаёт автономных "агентов" внутри zaps и подключает их к 7 000+ SaaS-приложений.

▫️ Make AI Agents — модуль в платформе Make для проектирования и повторного использования агентов.

▫️ Pipedream Connect — SDK и хостинг для 2 700+ интеграций. Подходит как бэкэнд для собственных AI-агентов.


Управляемые облачные предложения LLM-провайдеров
▫️ OpenAI Assistants API — готовый слой памяти, инструментов и диалоговой логики для генеративных агентов.

▫️ AWS Bedrock Agents — оркестрация многошаговых задач с доступом к корпоративным данным и внешним API.

▫️ Google Vertex AI Agent Builder — сервис для создания и развертывания многоагентных решений на базе моделей Gemini.

▫️ Microsoft Copilot Studio / Power Automate Agents — визуальная среда для агентов, публикуемых в Teams, почту и мессенджеры.


Открытые фреймворки для разработчиков
▫️ LangChain — цепочки, память, инструменты и исполнитель агентов для Python и JS.

▫️ AutoGen — библиотека Microsoft Research для кооперации нескольких LLM-агентов.

▫️ CrewAI — лёгкий фреймворк на Python для быстрых многоагентных сценариев.

▫️ LlamaIndex AgentWorkflow — компонент RAG-ориентированной библиотеки LlamaIndex для оркестрации агентов.
Codex — автономный агент для разработки
C 3 июня 2025 г. доступен подписчикам ChatGPT Plus.

Он анализирует репозитории GitHub, редактирует код, запускает тесты и формирует pull-request’ы внутри изолированной песочницы, при необходимости получая ограниченный доступ в интернет.

OpenAI предупреждает о повышенном риске prompt-injection, поэтому советует включать сеть только для заранее разрешённых доменов, фильтровать ввод-вывод и оставлять итоговое ревью за разработчиком.

#ai #нейросеть #chatgpt #codex
This media is not supported in your browser
VIEW IN TELEGRAM
Veo 3 развлекается
Решил свою книгу по промпт-инжинирингу выложить на сайты. А там требуют fb2.

Соответственно следующие свои труды сразу буду делать адаптированные под этот формат.

Пойду писать автоматизацию на верное форматирование. Конверторы ужас творят.