TECH LAB

Согласно последним тестам OpenAl, новейшие языковые модели компании демонстрируют значительно более высокую склонность к галлюцинациям (выдача ложной информации).

Это открытие вызывает серьезную обеспокоенность, особенно учитывая, что причины такого ухудшения остаются неясными.

Исследование, о котором сообщает The New York Times, показало шокирующие результаты: модель GPT 03, считающаяся самой мощной системой OpenAl, галлюцинирует в 33% случаев при проведении теста PersonQA, который включает ответы на вопросы о публичных фигурах. Это более чем вдвое превышает частоту галлюцинаций предыдущей системы GPT 01. Еще хуже дела обстоят с новой GPT o4-mini, которая показала уровень галлюцинаций в 48%.

При проведении другого теста, SimpleQA, который задает более общие вопросы, показатели оказались еще более тревожными: уровень галлюцинаций составил 51% для GPT 03 и ошеломляющие 79% для GPT 04-mini. Для сравнения, предыдущая система GPT 01 галлюцинировала в 44% случаев при этом же тесте.

OpenAl заявляет, что необходимы дополнительные исследования для понимания причин увеличения ошибок в новейших моделях. Однако некоторые отраслевые эксперты указывают на так называемые "reasoning models" (модели с рассуждением) как на возможный источник проблемы.

Независимо от причин, одно можно сказать с уверенностью - модели искусственного интеллекта должны в значительной степени исключить бессмыслицу и ложь, если они хотят быть настолько полезными, как предполагают их создатели.

❤4

194 views10:03

TECH LAB

GT 63 “APXGP Edition”

🔥4

185 views10:20

TECH LAB

'Arc ZERO: Eclipse'

❤4

187 views09:34

TECH LAB

0:18

This media is not supported in your browser

VIEW IN TELEGRAM

Серийный летающий автомобиль AirCar 2 анонсировала компания из Словакии Klein Vision. Аппарат способен трансформироваться из дорожного транспортного средства в воздушное судно всего за минуту и двадцать секунд.

Один из основателей Klein Vision Антон Зайац заявил, что стоимость AirCar 2 будет варьироваться в пределах от $800 тысяч до $1 млн. AirCar 2 представляет собой значительный шаг вперёд по сравнению с предыдущей моделью, AirCar, которая в 2021 году совершила успешный 35-минутный перелёт, вызвав широкий общественный интерес.

👍5

160 views08:37

TECH LAB

😁4

136 views08:27

TECH LAB

0:06

This media is not supported in your browser

VIEW IN TELEGRAM

Доброе утро 🤖

Это Optimus, которого разработала компания Tesla.

Маск напомнил, что в 2021 году во время презентации концепции робота на сцену был приглашен актер в костюме, который имитировал движения робота. Тогда человек исполнил танец, похожий на тот, что теперь станцевал на видео Optimus.

А еще Optimus способен ходить, приседать, балансировать на одной ноге, поднимать и перемещать объекты. Робот управляется ИИ, схожим с тем, что используется в автомобилях Tesla.

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥6❤3

153 viewsedited 05:05

TECH LAB

Осталось понять целевое значение такой коллаборации, выглядит🔥, особенно часы

❤5

133 views14:20

About

Blog

Apps

Platform