Media is too big
VIEW IN TELEGRAM
Величезний прорив у світі ШІ.
ChatGPT тепер може говорити, чути, бачити...
Іншими словами, ChatGPT офіційно мультимодальний і щойно став у 10 разів простішим у використанні!
-Тепер ви можете використовувати голос, щоб брати участь у розмові з помічником.
Гіперреалістична модель перетворення тексту в мовлення дозволяє вибирати з п’яти різних голосів.
-Навички логічного мислення ChatGPT тепер можуть розуміти зображення, фотографії, скріншоти та документи, що містять текст.
Ви також можете обговорити кілька зображень або скористатися новим інструментом малювання, щоб керувати своїм помічником.
-Нові можливості голосу забезпечуються абсолютно новою моделлю перетворення тексту в мовлення.
OpenAI використовував Whisper і співпрацював з професійними акторами голосу, щоб створити кожен із п’яти голосів.
-Нова модель перетворення тексту в мовлення вже використовується в пілотній версії голосового перекладу Spotify.
Подкасти, перекладені штучним інтелектом, з’являться на Spotify.
#текст #фото #аудіо
ChatGPT тепер може говорити, чути, бачити...
Іншими словами, ChatGPT офіційно мультимодальний і щойно став у 10 разів простішим у використанні!
-Тепер ви можете використовувати голос, щоб брати участь у розмові з помічником.
Гіперреалістична модель перетворення тексту в мовлення дозволяє вибирати з п’яти різних голосів.
-Навички логічного мислення ChatGPT тепер можуть розуміти зображення, фотографії, скріншоти та документи, що містять текст.
Ви також можете обговорити кілька зображень або скористатися новим інструментом малювання, щоб керувати своїм помічником.
-Нові можливості голосу забезпечуються абсолютно новою моделлю перетворення тексту в мовлення.
OpenAI використовував Whisper і співпрацював з професійними акторами голосу, щоб створити кожен із п’яти голосів.
-Нова модель перетворення тексту в мовлення вже використовується в пілотній версії голосового перекладу Spotify.
Подкасти, перекладені штучним інтелектом, з’являться на Spotify.
#текст #фото #аудіо
Нова модель генерації зображень DALL-E 3 від OpenAI тепер доступна безкоштовно у Bing.
Модель добре слідує інструкціям у підказці.
Вона також може генерувати текст на зображеннях, що поки що неможливо на Midjourney.
Щоб отримати до неї доступ, просто виконайте такі дії:
- Перейдіть до bing.com/images/create/
- Увійдіть за допомогою облікового запису Microsoft або створіть новий
- Введіть підказку у верхній панелі та натисніть «Створити»
Ви можете зробити 100 «швидких» генерацій на тиждень.
Якщо досягнете 0 кредитів, ви можете продовжити генерацію, але це займе більше часу. Насолоджуйтесь! #фото
Модель добре слідує інструкціям у підказці.
Вона також може генерувати текст на зображеннях, що поки що неможливо на Midjourney.
Щоб отримати до неї доступ, просто виконайте такі дії:
- Перейдіть до bing.com/images/create/
- Увійдіть за допомогою облікового запису Microsoft або створіть новий
- Введіть підказку у верхній панелі та натисніть «Створити»
Ви можете зробити 100 «швидких» генерацій на тиждень.
Якщо досягнете 0 кредитів, ви можете продовжити генерацію, але це займе більше часу. Насолоджуйтесь! #фото
Media is too big
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Програма зміни голосу від ElevenLabs AI Speech to Speech Converter дозволяє перетворити свій голос на голос іншого персонажа та керувати його емоціями та подачею.
Ви можете змінити свій голос, щоб створити привабливі озвучення для своєї аудиторії в TikTok, YouTube та Instagram, а також можете легко створювати власні голоси для ігор, відео, аудіокниг, подкастів тощо одним клацанням миші. #аудіо #текст
Ви можете змінити свій голос, щоб створити привабливі озвучення для своєї аудиторії в TikTok, YouTube та Instagram, а також можете легко створювати власні голоси для ігор, відео, аудіокниг, подкастів тощо одним клацанням миші. #аудіо #текст
This media is not supported in your browser
VIEW IN TELEGRAM
Stability AI представила SDXL Turbo - модель генерації тексту в зображення в реальному часі.
SDXL Turbo досягає найсучаснішої продуктивності за допомогою нової технології дистиляції, що дозволяє генерувати зображення за один крок із безпрецедентною якістю, зменшуючи необхідну кількість кроків із 50 до лише одного. #фото
SDXL Turbo досягає найсучаснішої продуктивності за допомогою нової технології дистиляції, що дозволяє генерувати зображення за один крок із безпрецедентною якістю, зменшуючи необхідну кількість кроків із 50 до лише одного. #фото
Media is too big
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Microsoft запустила спеціальну програму Copilot для Android та IOS.
Додаток Copilot працює на базі OpenAI GPT-4 і DALL-E 3, що дозволяє йому пропонувати можливості, подібні до чат-бота від ChatGPT. Це означає, що ви можете задавати запитання, створювати текст для електронних листів, створювати зображення тощо. Однак, на відміну від ChatGPT, Copilot дозволяє вам використовувати GPT-4 безкоштовно. #текст #фото
Додаток Copilot працює на базі OpenAI GPT-4 і DALL-E 3, що дозволяє йому пропонувати можливості, подібні до чат-бота від ChatGPT. Це означає, що ви можете задавати запитання, створювати текст для електронних листів, створювати зображення тощо. Однак, на відміну від ChatGPT, Copilot дозволяє вам використовувати GPT-4 безкоштовно. #текст #фото
This media is not supported in your browser
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
RunwayML представила інструмент Multi Motion Brush, що дозволяє створювати більш виразні та точні зображення. За допомогою Multi Motion Brush ви можете вибрати до п’яти зон незалежного руху та керування по трьох напрямних осях (x, y, z).
#фото #відео
#фото #відео
This media is not supported in your browser
VIEW IN TELEGRAM
Whisper Speech - нейромережа, яка ідеально копіює голоси інших людей і оживляє ваш текст у дивовижно реалістичний спосіб. #аудіо
Media is too big
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
HeyGen представив нову функцію створення аватарів штучного інтелекту під назвою «Avatar in Motion 1.0»
Він може відстежувати, перекладати та синхронізувати будь-які рухи, включаючи рухи рук, жести та тони голосу.
Найбільш приголомшлива частина цієї демонстрації: на оригінальному кадрі чоловік розмовляє німецькою!
Тож англійська та іспанська мови, які ви чуєте в цьому відео, є перекладами його німецької мови, згенерованими ШІ (з його оригінальним голосом та інтонаціями).
#аудіо #відео
Він може відстежувати, перекладати та синхронізувати будь-які рухи, включаючи рухи рук, жести та тони голосу.
Найбільш приголомшлива частина цієї демонстрації: на оригінальному кадрі чоловік розмовляє німецькою!
Тож англійська та іспанська мови, які ви чуєте в цьому відео, є перекладами його німецької мови, згенерованими ШІ (з його оригінальним голосом та інтонаціями).
#аудіо #відео
This media is not supported in your browser
VIEW IN TELEGRAM
Meta випустила Llama 3.1 405B – найпотужніша модель з відкритим кодом, яка була навчена на більш ніж 15T токенах.
Вона забезпечує 16-кратне збільшення вікна контексту, аж до 128 тис. токенів. Це дає змогу використовувати нові способи резюмування довгого тексту, кодування тощо.
Llama 3.1 забезпечує високу продуктивність на 8 мовах, що дозволяє використовувати багатомовні розмовні агенти та переклад.
#текст
Вона забезпечує 16-кратне збільшення вікна контексту, аж до 128 тис. токенів. Це дає змогу використовувати нові способи резюмування довгого тексту, кодування тощо.
Llama 3.1 забезпечує високу продуктивність на 8 мовах, що дозволяє використовувати багатомовні розмовні агенти та переклад.
#текст
На випадок будь-яких проблем із роботою Telegram, нагадуємо, що можна слідкувати за останніми оновленнями зі світу штучного інтелекту у Твіттері/X - AI NOW.
Саме час підписатись!
Саме час підписатись!