InNeuralNetwork

Вышла LLaMa 3

Доступно бесплатно, есть несколько версий: простая, базовая, 400 миллиарднопараметерная. Помимо текста, ещё можно генерить картинки. По качеству выдвигают как самую лучшую бесплатную модель. Подробнее с релизом можно ознакомиться на официальном блоге.

Также можно потыкать вручную в формате чата. С русским пока не очень, больше на английском работает. Пробуйте тут, но с VPN

🤖 InNeuralNetwork

4.1K viewsedited 16:14

InNeuralNetwork

This media is not supported in your browser

VIEW IN TELEGRAM

📸

Генеративный фотошоп все ещё круто

Сделал фотошопную визуализацию своего котелка, если сбрить его на половину. Загрузил фотку, обвёл маской половину головы, сделал копию для сравнения, а по запросу remove hair генеративно преобразил. 2 подхода по 30 секунд ожиданий, фотка готова. А то в реальности сложно представить, как оно будет на самом деле.

В жизни совпало (фотка в белой футболке после стрижки). Та же форма головы, только не очень ровно отметил линию при генерации — половина головы все же левее начинается. Ещё волос чуть меньше надо было оставить на другой, все же за стрижкой собрался.

Генеративную заливку можно пульнуть через Photoshop Beta по подписке Adobe на PS и LR за $12 в месяц. Похожая фича есть в бесплатном Adobe Firefly, но процесс чуть дольше.

🤖 InNeuralNetwork

Please open Telegram to view this post

VIEW IN TELEGRAM

3.5K views13:59

InNeuralNetwork

0:21

This media is not supported in your browser

VIEW IN TELEGRAM

Assistant API убер проапгрейдили

Я чуть подзабил на GPTs, так как режим в меру ограничен по обработке данных — плохо работает с русским, долго выдаёт ответ и быстро прерывается. Можно было загрузить до 20 файлов, по-хорошему, не более 100 страниц, чтобы сносно работало. Однако сегодня OpenAI пульнули супер обновление — можно грузить до 10 000 файлов, работает векторный поиск, нативная работа без танцев с бубном. Простым языком, сделать линейную автоматизацию можно за вечер и не сотни тысяч рублей.

Я нервно потираю руки от происходящего, так как часть вещей «делаем так, тут костылём подправим, тут костылём костыль исправим» больше не потребуется. И с другой стороны — печалюсь, что часть своих текущих работ надо адаптировать под новый пайплайн.

Для примера, гружу «Пиши, сокращай», спрашиваю нетривиальный вопрос про замену штампов, на что получаю точный ответ меньше, чем за 30 секунд. Для русского языка и облачной машины это топ. 2 запроса с поиском и переводом правда обошлись в 22 рубля, так что всему своя (оправданная) цена.

AGI близко!

🤖 InNeuralNetwork

4.0K viewsedited 18:24

InNeuralNetwork

ChatGPT потихоньку собирает на меня досье

Для ChatGPT Plus подписчиков открылась фича с вечной памятью. Например, если указать персональную информацию, то ChatGPT запишет это в специальную секцию и не потребуется повторять, что вы «профессиональный писатель, который пишет шедевр» и прочее из каталога промптов. Вы просто начинаете диалог, а чат уже лучше перснонализирует промпт.

А если не надо сохранять инфомрацию, то подойдут временные чаты — информация из них никуда не идет, чат удалится через месяц.

Интересно понять, как повлияет это на контекстное окно и режим Custom Instructions (скорее всего объединят или выпилят). За несколько тестовых чатов уже набрал случайную информацию, надо чистить.

🤖 InNeuralNetwork

4.2K views18:06

InNeuralNetwork

Вышло приложение Claude на iOS. Не в российском сторе, поставил через US

Работает шустро, правда выбрать модель не дает — только максимальную, которая доступна по плану. Если с подпиской, то Opus, а без — Sonnet

По остальным фичам все просто. Можно заводить чаты, фоткать, грузить документы

🤖 InNeuralNetwork

5.1K viewsedited 15:41

InNeuralNetwork

Весенний апдейт OpenAI крутой.

Выкатили лучше модель — GPT-4o. В 2 раза быстрее GPT-4 Turbo и ограниченно-бесплатная (для платных пользователей все также более доступно). Еще и сделали бесплатный GPT Store. Со всеми фичами платной версией, что появляется вопрос — а за что платим? Очевидный ответ — больше лимитов

Также чуть подтюнили UI, сделали проще и доступнее. Еще и аппку на мак запилили.

Но самое кабиносносное — постоянный войс режим. Можно общаться как с человеком о том и о сем. На демо показали пример с переводом текста (подобное уже делали), который работает без задержки и с правильными интонациями.

После лайва с апдейтом OpenAI жду, когда сделают шлем на манер железного человека, чтобы общаться с ChatGPT повсеместно.

🤖 InNeuralNetwork

4.4K viewsedited 17:43

InNeuralNetwork

Приложение ChatGPT на MacOS ~~как замена Siri~~ распространяется постепенно для платных подписчиков. Нашёл ссылку на скачивание, но после установки даже не пускает и надо дождаться инвайта по почте. Ждемс

4.4K viewsedited 08:23

InNeuralNetwork

Новое демо Sora от операторов Я не могу, какое же прекрасное качество у Sora. Ни смещений, ни дергающейся картики. И что удивительное — есть звук. Пока непонятно, он сгенерирован или просто наложен отдельно от модели, но давайте будем честны — если посмотреть…

2:54

This media is not supported in your browser

VIEW IN TELEGRAM

Вышел «за кадром» Deflated с использованием Sora

Из очевидного отмечу, что по запросу сразу получить магию не выйдет. Наглядно видно, что это не во многом отличается от текущего видеопрода, где по слоям собирают футажи и стабилизируют. Затем цветокорят, чтобы консистентно смотрелось. С генерацией Sora также надо в последствии корпеть.

Еще заметил, что в основном используют крупные кадры без мелких деталей. Галлюцинации и кашу можно заметить, когда много объектов в кадре. На 2:23 отчётливо видно, как сливаются машины и пешеходный переход в дали, а основные объекты в основном сохраняют форму. Это даже не говоря про обхват руки

Тем не менее, очень хочу потыкать самому и понять, насколько модель оптимизирует продакшен. Конечную версию видео можно посмотреть по ссылке

🤖 InNeuralNetwork

4.7K viewsedited 11:23

InNeuralNetwork

Найти место по фото через Geospy

Клёвый сервис, чтобы получить ответ с локацией по фото. Так ещё с координатами, описанием, другими фото поблизости и даже редиректом в Google Maps. Супер!

Работает это все на основе пользовательских отметок в картах, где и происходит тот самый метч. От этого возникает и другая проблема — если данных нет, то ответа тоже. Ну или максимум возможно вероятные предложения.

Для примера, свою фотку из Гонгконга получилось найти корректно, но с координатами чуть не угадал на несколько километров :)

🤖 InNeuralNetwork

5.3K viewsedited 12:21

InNeuralNetwork

Привет, ~~Джарвис~~ Siri

Вчера анонсировали Apple Intelligence, позволяющую локально использовать генеративные нейросети на айфонах, айпадах и маках. Не буду пересказывать пресс-релиз, а вкину следственное — нейросети теперь станут повсеместными.

Сгенерировать картинку или пересказать письмо и раньше можно было сделать, да, но раздельно и в разных интерфейсах. Теперь всё это доступно по запросу в Siri.

Особенно радует, что можно комбинировать данные из разных приложений: напоминание о встрече из iMessage, рекомендация маршрута и плейлист — всё это в одной цепочке действий. Оценивать качество рано, но направление верное — сделать технологии более человечными и прикладными. Ждем 18 сентября, чтобы затестить релиз!

🤖 InNeuralNetwork

4.7K viewsedited 10:22

InNeuralNetwork

This media is not supported in your browser

VIEW IN TELEGRAM

Попробовал GEN-3, выглядит реалистично.

GEN-3 — это новая модель для генерации видео от Runway. В отличие от GEN-2 улучшилась консистенция, повысилось качество, можно писать текст — стало киношно. Ролик длится 5 или 10 секунд (1 секунда = 10 токенов), качество 720P, генерится минут 10 с учётом очереди. Даже есть отдельный гайд, как обращаться с нейронкой. Результат на глаза.

Но и цена соответствующая — от $15 подписка.

Примечательно ещё, что в связке с релизом пишут про невышедшую SORA и сравнивают качество. При этом так получается с LUMA, King и любой другой моделью. Феномен забавный, из-за которого все больше повышаются ожидания от модели OpenAI. Тем не менее, видосы и правды становятся все лучше, так что техногонка c видео крутая

🤖 InNeuralNetwork

4.1K viewsedited 18:51

InNeuralNetwork

Своё творчество = 6,5 миллиона рублей + саммари + суд

Случился прецедент, когда авторы «Пиши, сокращай» выиграли суд у сервиса по саммари их же книги. В деле не уточняется, как именно сделано сокращение, но, глядя на развитие AI-саммаризаторов и отсутствие подобных кейсов в остальные годы, мы имеем дело с нейросетями. И результат их работы удалось по-судебному рассмотреть

Саммари ранее никогда не фигурировало в суде. И самой ближайшей судебной коннотацией стала переработка. То есть за пересказ книги в своём исполнении можно дойти до суда. При условии, что пересказ сопровождается исходным названием и есть примеры сходств (пересказ 🤝 книга)

Из дела прояснилось, что регистрация товарного знака — идея номер один, чтобы аргументировать любую «перепродажу идей». В ином случае сервис смог бы возразить и даже пытался зарегистрировать товарный знак «Пиши, сокращай» на себя (рекомендую прочитать статью целиком, там много дурно-забавного). Теперь стало чуть более ясно, почему в ChatGPT почти год как прекратили генерацию текста от известных людей и всячески пытаются оперировать общей информацией. Сбер и Яндекс, кстати, похожим образом идут

В целом, оно было понятно сразу, что наживаться на чужом имени без отчислений — плохо. И нейросети здесь не выбелят такую позицию

🤖 InNeuralNetwork

3.9K viewsedited 10:17

InNeuralNetwork

Forwarded from Токсичный Епихин

Смешанная реальность теперь станет чуть более широким термином, чем ловля покемонов. Новые Самсунги могут на ваши фотографии дорисовывать с помощью ИИ объекты, которые иногда выглядят максимально реалистично. На The Verge вышла статья, где есть наглядные примеры как это выглядит. В современном искусстве такой монтаж – довольно популярный прием. Теперь он будет доступен более широким массам. Посмотрим, как люди себя проявят в таком творчестве. Правда, для массового распрастранения подобное должно появится в айфонах, а это случится… в 2025 году… не для Европы… не для старых айфонов… не сразу для всех.

https://www.theverge.com/2024/7/17/24199005/samsung-galaxy-ai-z-fold-6-sketch-to-image

The Verge

Samsung’s new image-generating AI tool is a little too good

What is a photo, really?

3.7K views14:22

InNeuralNetwork

Привет, GPT-4o mini

Вышла новая базовая модель GPT-4o mini на смену GPT-3.5 Turbo. По тестам обходит все базовые модели конкурентов (Gemini 1.5 Flash, Claude 3 Haiku), при этом по функционалу соответствует основным моделям в ChatGPT — доступна работа с файлами, генерация картинок, выход в Bing, 128т токенов контекстное окно.

Примечательно ещё, что доступ по API 0,15$ на запрос и 0,6$ на ответ за миллион токенов. Переводя на русский — дешево, сердито. Цена/качества выглядит как восторг

Выкладка модели начнётся с сегодня, а пока можно почитать блог-пост про модель

🤖 InNeuralNetwork

4.4K viewsedited 17:55

InNeuralNetwork

Аккаунт в Kling (text-2-video model) можно завести без китайского номера. Скорее всего в ближайшее время будет лимит на вход из-за нагрузки, так что бегом смотреть и генерить видео. На 24 часа дают 66 кредитов

По первым впечатлениям на голову качественнее Gen-3, Luma и Pika

🤖 InNeuralNetwork

4.0K viewsedited 08:00

InNeuralNetwork

0:34

This media is not supported in your browser

VIEW IN TELEGRAM

OpenAI анонсировали свой временный поисковой прототип

По демо работает быстро, использует качественные источники, минимизирует галлюцинации. Работает по типу Perplexity. После теста лучшие фичи пойдут в ChatGPT. Пока можно только встать в лист ожидания на тест

🤖 InNeuralNetwork

5.6K viewsedited 18:31

оффтоп: хочу посмотреть эту короткометражку
поддержать проект — https://planeta.ru/campaigns/notareal

3.6K views08:59

InNeuralNetwork

Grok 2 mini c Flux генерирует картинки без цензуры

Проверил в твитере новую модель xAI и достаточно хорошо. Картинки выходят в рисованном виде. И при этом без явных галлюцинаций

Самое примечательное, что сейчас (не факт, что надолго) можно делать до 20 картинок в день с любыми персонажами и почти любых ситуаций (явно эксплисит контент все же нельзя сделать с Микки Маусом). Такого качество и скорости нет ни в одной другой публичной визуальной модели

Еще заметил, что генерации известных персонажей часто делает их с переднего вида и поверх любых других объектов. Так, например, я попробовал сделать 5 генераций Марио с пивом, чтобы бокал был не за его носом 🥸

Про лимиты до конца не понял, но после 15 картинки я на сегодня больше не могу делать новые. Доступно по подписке от 8$ в месяц

🤖 InNeuralNetwork

6.7K views11:01

About

Blog

Apps

Platform