InNeuralNetwork
5.04K subscribers
94 photos
36 videos
106 links
ChatGPT, нейросети и опыт их использования.

Для связи: @biblik
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Попробовал GEN-3, выглядит реалистично.

GEN-3 — это новая модель для генерации видео от Runway. В отличие от GEN-2 улучшилась консистенция, повысилось качество, можно писать текст — стало киношно. Ролик длится 5 или 10 секунд (1 секунда = 10 токенов), качество 720P, генерится минут 10 с учётом очереди. Даже есть отдельный гайд, как обращаться с нейронкой. Результат на глаза.

Но и цена соответствующая — от $15 подписка.

Примечательно ещё, что в связке с релизом пишут про невышедшую SORA и сравнивают качество. При этом так получается с LUMA, King и любой другой моделью. Феномен забавный, из-за которого все больше повышаются ожидания от модели OpenAI. Тем не менее, видосы и правды становятся все лучше, так что техногонка c видео крутая

🤖 InNeuralNetwork
Своё творчество = 6,5 миллиона рублей + саммари + суд

Случился прецедент, когда авторы «Пиши, сокращай» выиграли суд у сервиса по саммари их же книги. В деле не уточняется, как именно сделано сокращение, но, глядя на развитие AI-саммаризаторов и отсутствие подобных кейсов в остальные годы, мы имеем дело с нейросетями. И результат их работы удалось по-судебному рассмотреть

Саммари ранее никогда не фигурировало в суде. И самой ближайшей судебной коннотацией стала переработка. То есть за пересказ книги в своём исполнении можно дойти до суда. При условии, что пересказ сопровождается исходным названием и есть примеры сходств (пересказ 🤝 книга)

Из дела прояснилось, что регистрация товарного знака — идея номер один, чтобы аргументировать любую «перепродажу идей». В ином случае сервис смог бы возразить и даже пытался зарегистрировать товарный знак «Пиши, сокращай» на себя (рекомендую прочитать статью целиком, там много дурно-забавного). Теперь стало чуть более ясно, почему в ChatGPT почти год как прекратили генерацию текста от известных людей и всячески пытаются оперировать общей информацией. Сбер и Яндекс, кстати, похожим образом идут

В целом, оно было понятно сразу, что наживаться на чужом имени без отчислений — плохо. И нейросети здесь не выбелят такую позицию

🤖 InNeuralNetwork
Смешанная реальность теперь станет чуть более широким термином, чем ловля покемонов. Новые Самсунги могут на ваши фотографии дорисовывать с помощью ИИ объекты, которые иногда выглядят максимально реалистично. На The Verge вышла статья, где есть наглядные примеры как это выглядит. В современном искусстве такой монтаж – довольно популярный прием. Теперь он будет доступен более широким массам. Посмотрим, как люди себя проявят в таком творчестве. Правда, для массового распрастранения подобное должно появится в айфонах, а это случится… в 2025 году… не для Европы… не для старых айфонов… не сразу для всех.

https://www.theverge.com/2024/7/17/24199005/samsung-galaxy-ai-z-fold-6-sketch-to-image
Привет, GPT-4o mini

Вышла новая базовая модель GPT-4o mini на смену GPT-3.5 Turbo. По тестам обходит все базовые модели конкурентов (Gemini 1.5 Flash, Claude 3 Haiku), при этом по функционалу соответствует основным моделям в ChatGPT — доступна работа с файлами, генерация картинок, выход в Bing, 128т токенов контекстное окно.

Примечательно ещё, что доступ по API 0,15$ на запрос и 0,6$ на ответ за миллион токенов. Переводя на русский — дешево, сердито. Цена/качества выглядит как восторг

Выкладка модели начнётся с сегодня, а пока можно почитать блог-пост про модель

🤖 InNeuralNetwork
Аккаунт в Kling (text-2-video model) можно завести без китайского номера. Скорее всего в ближайшее время будет лимит на вход из-за нагрузки, так что бегом смотреть и генерить видео. На 24 часа дают 66 кредитов

По первым впечатлениям на голову качественнее Gen-3, Luma и Pika

🤖 InNeuralNetwork
This media is not supported in your browser
VIEW IN TELEGRAM
OpenAI анонсировали свой временный поисковой прототип

По демо работает быстро, использует качественные источники, минимизирует галлюцинации. Работает по типу Perplexity. После теста лучшие фичи пойдут в ChatGPT. Пока можно только встать в лист ожидания на тест

🤖 InNeuralNetwork
Media is too big
VIEW IN TELEGRAM
оффтоп: хочу посмотреть эту короткометражку
поддержать проект — https://planeta.ru/campaigns/notareal
Grok 2 mini c Flux генерирует картинки без цензуры

Проверил в твитере новую модель xAI и достаточно хорошо. Картинки выходят в рисованном виде. И при этом без явных галлюцинаций

Самое примечательное, что сейчас (не факт, что надолго) можно делать до 20 картинок в день с любыми персонажами и почти любых ситуаций (явно эксплисит контент все же нельзя сделать с Микки Маусом). Такого качество и скорости нет ни в одной другой публичной визуальной модели

Еще заметил, что генерации известных персонажей часто делает их с переднего вида и поверх любых других объектов. Так, например, я попробовал сделать 5 генераций Марио с пивом, чтобы бокал был не за его носом 🥸

Про лимиты до конца не понял, но после 15 картинки я на сегодня больше не могу делать новые. Доступно по подписке от 8$ в месяц

🤖 InNeuralNetwork
This media is not supported in your browser
VIEW IN TELEGRAM
Midjourney доступен в веб-версии, так ещё и с бесплатным триалом

🤖 InNeuralNetwork
Пока ChatGPT не научился рекомендовать каналы по векторной дб, делюсь самыми полезными авторскими каналы про нейронки, на которые подписан сам:

Бурый — народные тесты бесплатных нейронок для красавиц и скуфов.

Tips AI — пишет об интересных сервисах IT и AI технологий! Всегда актуальное и востребованное, с щепоткой юмора 😉

Мысли Рвачева — канал Никиты Рвачева (живет в Нью-Йорке, США, занимается AI) о последних новостях в мире AI, лучших лекциях и подкастах, новых технологиях, и, конечно, обо всем этом с авторским мнением.

ИИволюция — канал Сергея Пахандрина, где он делится своими экспериментами и лайфхаками по применению ИИ для решения разных задач.

Силиконовый Мешок — авторский канал нейроиспытателя Артема Субботина про искусственный интеллект, приносящий прибыль.
This media is not supported in your browser
VIEW IN TELEGRAM
iPhone 16 могут "видеть", объединив ИИ с камерой и новой кнопкой.

Теперь можно использовать камеру, чтобы:

• Решать задачи через ChatGPT
• Находить товары в Google
• Получить отзыв о ресторане
• Бронировать билеты по афише
• Задавать вопросы о чем угодно​​​​​​​​​​​​​​​​

Не клево, что не в США будет работать ограничено или вовсе не 🫠

🤖 InNeuralNetwork
o1. Новая модель OpenAI, которую сегодня раскатывают

До 6 раз лучше GPT-4o для задач в несколько заходов промптов, в 1 запрос попроще улучшения. Также научили глубже оценивать запрос при комплексном решении.

Доступ дают платным подписчикам ChatGPT. Больше информации

🤖 InNeuralNetwork
Часовое видео в текст за 2 минуты? Charla это делает.

Протестировал Charla — сервис для расшифровки аудио и видео. Что заметил:

• Транскрибирует исправно – c 93% точностью по заверению с сайта
• Ставит знаки препинания по контексту, а не просто лепит текст сплошняком
• Работает через Веб, API и Telegram-бот

Ещё по плюсам:
⌨️ В 3 раза быстрее печатания (по моим подсчетам)
🗄️ Для готовых файлов скорость ещё выше
📄 Полученный текст можно саммаризировать
🔗 Принимает любые файлы и ссылки
💫 Нет ограничений на размер файла

Есть бесплатный 5-ти дневный тест. Первые 30 юзеров, которые регистрируются по этой ссылке, получают скидку 50% на первый месяц. Попробуете — расскажите, как оно!

#промо
Все меньше гуглю, когда надо в чем-то разобраться

Неделю не понимал, откуда и почему берутся приколы про Diddy. Скандал, вечеринки, сравнение с реперами — контекст из этого что-то между что и непонятно. При этом я стабильно бью рекорды по уведомлениям «Ваше экранное время увеличилось на n% по сравнению с прошлой неделей» и все равно не понимаю, кто этот черт и почему мои друзья про него знают, а я — нет.

Смотря уже 15 рилс, оставаясь вне контекста, пошел в Perplexity с почти seo-запросом и сразу получил ответ без лишнего. Так ещё уточнил неочевидное, тоже понял. С ссылками на источники как русскими, так и английскими первоисточниками. Теперь спокойно могу пропускать любое новое видео про него.

Еще раз убедился, когда что-то непонятно и хочется вникнуть доступно в контекст — надо обращаться в Perplexity. А Google тем временем становится скорее удобной тулзой для логина, чем инструментом поиска

🤖 InNeuralNetwork