Получаем закадровый план любой съемки.
Подаёте исходную картинку в Нанобанану и просите её восстановить окружающую обстановку.
Не мог удержаться :)
Теперь мы знаем всё про посадку на Луну.
(создай реалистичную закулисную сцену для этой сцены фильма, покажите мне, где расположены камера и освещение для съемки этой сцены, используйте стрелки, чтобы обозначить название освещения, тип освещения, настройки освещения)
тут еще много примеров
#Нанобанана #Луна #промпты #юмор
———
@tsingular
Подаёте исходную картинку в Нанобанану и просите её восстановить окружающую обстановку.
Не мог удержаться :)
Теперь мы знаем всё про посадку на Луну.
generate a realistic behind the scene for this film scene, show me where the camera and lights are placed to film this scene, use arrows to label the name of the light, what kind of lights, light settings
(создай реалистичную закулисную сцену для этой сцены фильма, покажите мне, где расположены камера и освещение для съемки этой сцены, используйте стрелки, чтобы обозначить название освещения, тип освещения, настройки освещения)
тут еще много примеров
#Нанобанана #Луна #промпты #юмор
———
@tsingular
1😁44✍4🔥3💯1
Через 10 минут эфир MoscowAI
Кто не смог приехать,- подключайтесь,- будет интересно.
Ссылка на трансляцию
#MoscowAI #SGR
------
@tsingular
Кто не смог приехать,- подключайтесь,- будет интересно.
Ссылка на трансляцию
#MoscowAI #SGR
------
@tsingular
🔥12👍4⚡2❤🔥1🆒1 1
Forwarded from Data Secrets
Это первая модель, которая пробила планку 80 на SWE bench verified. С ее 80.9% это теперь уверенная SOTA по кодингу.
Модель уже доступна в API, и, что самое приятное, цена относительно предыдущего Opus упала! Было 15$/75$, стало 5/25, ощутимое понижение.
Плюс, модель снова стала экономичнее относительно токенов: на среднем уровне ризонинга она достигает уровня Sonnet 4.5, используя на 76% меньше токенов. А при выкрученном на максимум бюджете обходит Sonnet аж на 4.3 процентных пункта (SWE bench), используя на 48% меньше токенов.
Anthropic пишут, что скормили Opus 4.5 внутренний экзамен, который они дают кандидатам при устройстве на работу. За 2 часа модель справилась с ним лучше, чем любой человек когда-либо в истории стартапа.
Что касается апдейтов в продукте:
– В Claude App добавили сжатие контекста, как в новом Codex. При достижении лимита старый контекст суммаризуется и передается в новое контекстное окно, и вы не упираетесь в конец диалога. Кроме того, теперь в десктопное приложение завезли Claude Code, и там его можно параллелить на разные задачки.
– Из беты вышли Claude для Chrome и для Excel.
– Теперь можно самостоятельно контролировать время размышлений, есть режимы low, high и medium.
🔥 www.anthropic.com/news/claude-opus-4-5
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥16⚡4❤2🏆1
Протестил Opus 4.5 венком сонетов.
На мой взгляд, - хуже, чем Gemini3, как ни странно.
Вангую скандал с докруткой метрик под бенчи.
Хотелось бы ошибаться, конечно, но в полном стихе это прям видно в каждом сонете из венка.
Он неплохо старается, по форме и по сюжету, но плывёт по рифме в содержании.
% попадания в рифму как-будто упал.
Полный венок в комментарии, как обычно.
#Opus #Сонет #тест
———
@tsingular
На мой взгляд, - хуже, чем Gemini3, как ни странно.
Вангую скандал с докруткой метрик под бенчи.
Хотелось бы ошибаться, конечно, но в полном стихе это прям видно в каждом сонете из венка.
Он неплохо старается, по форме и по сюжету, но плывёт по рифме в содержании.
% попадания в рифму как-будто упал.
Полный венок в комментарии, как обычно.
#Opus #Сонет #тест
———
@tsingular
⚡6🤔3❤1
Opus 4.5 vs Gemini 3 Pro: программирование
А вот так наверное будет более наглядно.
Поставил задачу:
И это просто абсолютный провал Opus и чистая победа Gemini 3
Смотрите сами. Тут много деталей, которые повылезали, как окончание и согласованность строк и рифмы в сонете.
Opus 4.5 просто налабал какую-то крутящуюся стену.
Gemini при этом даже вытащил некоторые ссылки на логотипы, и у него карты похожи на MtG, не наплывают друг на друга.
Ну и 3й ролик это тот же самый промпт, но в Gemini 3 Pro BUILD, - это такой облачный вайбкодер.
Тут вообще практически идеально.
С логотипами только промах, но качество приложения, - просто огонь!
Удаляем Opus, возвращаемся на Gemini 3 Pro.
Может у кого-то другой опыт, - делитесь в комментариях, но я пока свой выбор сделал.
Сами файлы тоже выкладываю в комментариях.
#Opus #Gemini
———
@tsingular
А вот так наверное будет более наглядно.
Поставил задачу:
сделай 1 HTML файл с каруселью из карт вендоров ИИ
3D карусель.
все вендоры, а не только западные.
на месте логотипов -ссылки на их лого в интернете.
стиль Magic the gathering
И это просто абсолютный провал Opus и чистая победа Gemini 3
Смотрите сами. Тут много деталей, которые повылезали, как окончание и согласованность строк и рифмы в сонете.
Opus 4.5 просто налабал какую-то крутящуюся стену.
Gemini при этом даже вытащил некоторые ссылки на логотипы, и у него карты похожи на MtG, не наплывают друг на друга.
Ну и 3й ролик это тот же самый промпт, но в Gemini 3 Pro BUILD, - это такой облачный вайбкодер.
Тут вообще практически идеально.
С логотипами только промах, но качество приложения, - просто огонь!
Удаляем Opus, возвращаемся на Gemini 3 Pro.
Может у кого-то другой опыт, - делитесь в комментариях, но я пока свой выбор сделал.
Сами файлы тоже выкладываю в комментариях.
#Opus #Gemini
———
@tsingular
🔥8🤔5⚡2❤1👍1🤝1
This media is not supported in your browser
VIEW IN TELEGRAM
В NotebookLM подвезли возможность создавать презентации.
Ранее туда же добавляли DeepResearch.
Получается теперь можно не выходя из NotebookLM сразу и исследование прогнать и презентацию по его результатам запилить.
Manus опасносте.
#NotebookLM #Google #презентации
------
@tsingular
Ранее туда же добавляли DeepResearch.
Получается теперь можно не выходя из NotebookLM сразу и исследование прогнать и презентацию по его результатам запилить.
Manus опасносте.
#NotebookLM #Google #презентации
------
@tsingular
✍6⚡4🔥4
Google обещает увеличить инфраструктуру для ИИ в 1000 раз за 5 лет
Глава подразделения инфраструктуры Амин Вахдат озвучил план удваивать серверные мощности каждые полгода.
Получается за 5-6 лет вырастут в 1000x и считают это необходимостью.
Вахдат уверен - риск недоинвестировать выше, чем переинвестировать.
Ставка делается на новые поколения TPU (7 и выше) и будущие новые модели LLM.
Т.е. модели в 1000 раз умнее/способнее сегодняшних, - это бизнесплан. Запоминаем.
#Google #TPU #Infrastructure
———
@tsingular
Глава подразделения инфраструктуры Амин Вахдат озвучил план удваивать серверные мощности каждые полгода.
Получается за 5-6 лет вырастут в 1000x и считают это необходимостью.
Вахдат уверен - риск недоинвестировать выше, чем переинвестировать.
Ставка делается на новые поколения TPU (7 и выше) и будущие новые модели LLM.
Т.е. модели в 1000 раз умнее/способнее сегодняшних, - это бизнесплан. Запоминаем.
#Google #TPU #Infrastructure
———
@tsingular
🔥8 3 2⚡1
Адам Вольф, один из разработчиков CludeCode в Anthropic, пишет
Через 6 месяцев софтварным инженерам нечем будет заняться.
Уже сегодня он просто ставит задачу ClaudeCode, уходит минут на 20-30 и когда возвращается, - в большинстве случаев задача решена.
С новыми моделями мы перестанем ожидать что ИИ разраб может ошибиться, ровно так, как мы не ждём ошибки от работы компилятора.
#claudecode #dev #Claude #Anthropic
———
@tsingular
Через 6 месяцев софтварным инженерам нечем будет заняться.
Уже сегодня он просто ставит задачу ClaudeCode, уходит минут на 20-30 и когда возвращается, - в большинстве случаев задача решена.
С новыми моделями мы перестанем ожидать что ИИ разраб может ошибиться, ровно так, как мы не ждём ошибки от работы компилятора.
#claudecode #dev #Claude #Anthropic
———
@tsingular
🤯8 8⚡6👍6🤣3😁2🗿2👏1
Microsoft экспериментирует с Agent Workspace в Windows для ИИ-агентов
Microsoft запускает экспериментальную функцию Agent Workspace - отдельные виртуальные среды в Windows, где ИИ-агенты работают параллельно с пользователем.
Каждый агент получает собственную учётную запись и десктоп, изолированные от основной сессии.
При включении админом агенты пока получают доступ к шести папкам:
Документы, Загрузки, Рабочий стол, Музыка, Изображения, Видео.
Обещают лёгкие виртуалки, которые не будут нагружать машину.
Пока в порядке тестов для участников Windows Insider.
Верните DOS :(
#Windows #Microsoft #CopilotActions #AgentWorkspace
------
@tsingular
Microsoft запускает экспериментальную функцию Agent Workspace - отдельные виртуальные среды в Windows, где ИИ-агенты работают параллельно с пользователем.
Каждый агент получает собственную учётную запись и десктоп, изолированные от основной сессии.
При включении админом агенты пока получают доступ к шести папкам:
Документы, Загрузки, Рабочий стол, Музыка, Изображения, Видео.
Обещают лёгкие виртуалки, которые не будут нагружать машину.
Пока в порядке тестов для участников Windows Insider.
Верните DOS :(
#Windows #Microsoft #CopilotActions #AgentWorkspace
------
@tsingular
👀7✍3❤2⚡1👍1💯1
Forwarded from Machinelearning
Tencent выложила в open-source новую модель HunyuanOCR.
Это компактная, быстрая и полностью готовая end-to-end система для OCR, построенная на мультимодальной архитектуре Hunyuan.
Главное - при размере только 1 миллиард параметров она показывает результаты уровня крупных моделей и стоит в разы дешевле в запуске.
⚡ Топ по бенчмаркам
• 860 на OCRBench среди всех моделей до 3B
• 94.1 на OmniDocBench - лучший результат в задачах распознованяисложных документов
🌐 Что умеет HunyuanOCR
Модель закрывает практически все типы OCR задач
• текст на улицах, витринах, табличках
• рукописный текст и художественные шрифты
• сложные документы: таблицы, формулы, встроенный HTML и LaTeX
• субтитры в видео
• перевод текста на фото end-to-end сразу на 14 языков
Это не каскадный пайплайн, а единое решение
Один запрос и одно инференс-прогон дают готовый результат.
Это быстрее, надёжнее и удобнее, чем традиционные OCR-цепочки.
📌 Project Page
web: https://hunyuan.tencent.com/vision/zh?tabIndex=0
mobile: https://hunyuan.tencent.com/open_source_mobile?tab=vision&tabIndex=0
🔗 GitHub
https://github.com/Tencent-Hunyuan/HunyuanOCR
🤗 Hugging Face
https://huggingface.co/tencent/HunyuanOCR
📄 Technical Report
https://github.com/Tencent-Hunyuan/HunyuanOCR/blob/main/HunyuanOCR_Technical_Report.pdf
@ai_machinelearning_big_data
#HunyuanOCR #TencentAI #OCR #VisionAI #DeepLearning #Multimodal #AIModels #OpenSourceAI #ComputerVision #DocumentAI
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9⚡3❤2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
FLUX.2: обновление графической модели на 32B
Black Forest Labs выкатили FLUX.2 [dev] — трансформер на 32B, который генерирует, редактирует и комбинирует картинки по текстовым инструкциям.
Модель доступна на Hugging Face.
Работает локально на RTX 4090/5090 через 4-битное квантование с удалённым текстовым энкодером.
Полный размер 70+ гигов.
Поддержка в ComfyUI и Diffusers из коробки.
Короче, похоже, что если вам не критична скорость,- M3 Ultra с 512 гигами, - реально самая подходящая машина для малого бизнеса.
Таких вот моделей поднять каскад, на круг под 400Гигов и забьются.
#FLUX2 #BlackForestLabs
———
@tsingular
Black Forest Labs выкатили FLUX.2 [dev] — трансформер на 32B, который генерирует, редактирует и комбинирует картинки по текстовым инструкциям.
Модель доступна на Hugging Face.
Работает локально на RTX 4090/5090 через 4-битное квантование с удалённым текстовым энкодером.
Полный размер 70+ гигов.
Поддержка в ComfyUI и Diffusers из коробки.
Короче, похоже, что если вам не критична скорость,- M3 Ultra с 512 гигами, - реально самая подходящая машина для малого бизнеса.
Таких вот моделей поднять каскад, на круг под 400Гигов и забьются.
#FLUX2 #BlackForestLabs
———
@tsingular
👍7🔥5❤1
Вчера был очень полезный доклад по нейрографике и анимации от Ксении Галушкиной
Сегодня Ксения поделилась всеми исходниками на канале.
Презентация 700мегов, там много видео, перезалил на Dropbox
------‐quote-------------
На миро-доске вчерашние примеры с промптами и ещё десятки способов использования новой нано бананы про, которые не влезли в презентацию.
https://miro.com/app/board/uXjVJft9A8M=
Запись митапа можно посмотреть по той же ссылке, где была трансляция. Доклад с 58:00.
https://embed-cdn.mashroom.online/?hash=FxiVJsjT
Старые промпты от первой бананы тоже отлично работают.
Для некоторых задач и стилистик больше не нужно обучать лоры, потому что можно снова и снова добавлять референс персонажа, и банана сохраняет его одинаковым от кадра к кадру.
Потестировать кучу разных применений бананы в виде приложения можно здесь:
https://aistudio.google.com/apps/drive/1sEmTQCUUnVNwH1WdRP_7FraYTKw1tbmR?fullscreenApplet=true&showPreview=true&showAssistant=true
И здесь:
https://flowith.io/
Ответы на основные вопросы со вчерашней встрече:
Плейлист с базой по комфи
https://www.youtube.com/watch?v=Zko_s2LO9Wo&list=PL-pohOSaL8P9kLZP8tQ1K1QWdZEgwiBM0&index=1
3D-нейронки:
Hunyuan https://3d.hunyuan.tencent.com/
Hitem 3d https://hitem3d.ai/
Viscom для текстур, особенно хенд-пеинт https://www.vizcom.com/
Пост про 3д-ИИ генераторы, в комментах блендер-сцены, всё можно скачать себе и посмотреть:
https://t.me/Aironically/710
Установка комфи и нано бананы в фотошоп. Видео снято про первую нано банану, но в https://www.astria.ai/ вторую тоже уже добавили, так что и со второй всё будет работать.
https://t.me/Aironically/686
Главные посты канала с навигацией:
https://t.me/Aironically/619
Все видео из презентации есть в канале, часть видео была только на стриме с Янисом в практическом блоке с 15:00. Видео про комфи с 18:00:
https://www.youtube.com/watch?v=FGQJlIReiEo
-----------------
#Aironically #нейрорендер #обучение
------
@tsingular
Сегодня Ксения поделилась всеми исходниками на канале.
Презентация 700мегов, там много видео, перезалил на Dropbox
------‐quote-------------
На миро-доске вчерашние примеры с промптами и ещё десятки способов использования новой нано бананы про, которые не влезли в презентацию.
https://miro.com/app/board/uXjVJft9A8M=
Запись митапа можно посмотреть по той же ссылке, где была трансляция. Доклад с 58:00.
https://embed-cdn.mashroom.online/?hash=FxiVJsjT
Старые промпты от первой бананы тоже отлично работают.
Для некоторых задач и стилистик больше не нужно обучать лоры, потому что можно снова и снова добавлять референс персонажа, и банана сохраняет его одинаковым от кадра к кадру.
Потестировать кучу разных применений бананы в виде приложения можно здесь:
https://aistudio.google.com/apps/drive/1sEmTQCUUnVNwH1WdRP_7FraYTKw1tbmR?fullscreenApplet=true&showPreview=true&showAssistant=true
И здесь:
https://flowith.io/
Ответы на основные вопросы со вчерашней встрече:
Плейлист с базой по комфи
https://www.youtube.com/watch?v=Zko_s2LO9Wo&list=PL-pohOSaL8P9kLZP8tQ1K1QWdZEgwiBM0&index=1
3D-нейронки:
Hunyuan https://3d.hunyuan.tencent.com/
Hitem 3d https://hitem3d.ai/
Viscom для текстур, особенно хенд-пеинт https://www.vizcom.com/
Пост про 3д-ИИ генераторы, в комментах блендер-сцены, всё можно скачать себе и посмотреть:
https://t.me/Aironically/710
Установка комфи и нано бананы в фотошоп. Видео снято про первую нано банану, но в https://www.astria.ai/ вторую тоже уже добавили, так что и со второй всё будет работать.
https://t.me/Aironically/686
Главные посты канала с навигацией:
https://t.me/Aironically/619
Все видео из презентации есть в канале, часть видео была только на стриме с Янисом в практическом блоке с 15:00. Видео про комфи с 18:00:
https://www.youtube.com/watch?v=FGQJlIReiEo
-----------------
#Aironically #нейрорендер #обучение
------
@tsingular
🔥11✍6❤3⚡2🙏2👍1