Согласно последним тестам OpenAl, новейшие языковые модели компании демонстрируют значительно более высокую склонность к галлюцинациям (выдача ложной информации).
Это открытие вызывает серьезную обеспокоенность, особенно учитывая, что причины такого ухудшения остаются неясными.
Исследование, о котором сообщает The New York Times, показало шокирующие результаты: модель GPT 03, считающаяся самой мощной системой OpenAl, галлюцинирует в 33% случаев при проведении теста PersonQA, который включает ответы на вопросы о публичных фигурах. Это более чем вдвое превышает частоту галлюцинаций предыдущей системы GPT 01. Еще хуже дела обстоят с новой GPT o4-mini, которая показала уровень галлюцинаций в 48%.
При проведении другого теста, SimpleQA, который задает более общие вопросы, показатели оказались еще более тревожными: уровень галлюцинаций составил 51% для GPT 03 и ошеломляющие 79% для GPT 04-mini. Для сравнения, предыдущая система GPT 01 галлюцинировала в 44% случаев при этом же тесте.
OpenAl заявляет, что необходимы дополнительные исследования для понимания причин увеличения ошибок в новейших моделях. Однако некоторые отраслевые эксперты указывают на так называемые "reasoning models" (модели с рассуждением) как на возможный источник проблемы.
Независимо от причин, одно можно сказать с уверенностью - модели искусственного интеллекта должны в значительной степени исключить бессмыслицу и ложь, если они хотят быть настолько полезными, как предполагают их создатели.
Это открытие вызывает серьезную обеспокоенность, особенно учитывая, что причины такого ухудшения остаются неясными.
Исследование, о котором сообщает The New York Times, показало шокирующие результаты: модель GPT 03, считающаяся самой мощной системой OpenAl, галлюцинирует в 33% случаев при проведении теста PersonQA, который включает ответы на вопросы о публичных фигурах. Это более чем вдвое превышает частоту галлюцинаций предыдущей системы GPT 01. Еще хуже дела обстоят с новой GPT o4-mini, которая показала уровень галлюцинаций в 48%.
При проведении другого теста, SimpleQA, который задает более общие вопросы, показатели оказались еще более тревожными: уровень галлюцинаций составил 51% для GPT 03 и ошеломляющие 79% для GPT 04-mini. Для сравнения, предыдущая система GPT 01 галлюцинировала в 44% случаев при этом же тесте.
OpenAl заявляет, что необходимы дополнительные исследования для понимания причин увеличения ошибок в новейших моделях. Однако некоторые отраслевые эксперты указывают на так называемые "reasoning models" (модели с рассуждением) как на возможный источник проблемы.
Независимо от причин, одно можно сказать с уверенностью - модели искусственного интеллекта должны в значительной степени исключить бессмыслицу и ложь, если они хотят быть настолько полезными, как предполагают их создатели.
❤4
This media is not supported in your browser
VIEW IN TELEGRAM
Серийный летающий автомобиль AirCar 2 анонсировала компания из Словакии Klein Vision. Аппарат способен трансформироваться из дорожного транспортного средства в воздушное судно всего за минуту и двадцать секунд.
Один из основателей Klein Vision Антон Зайац заявил, что стоимость AirCar 2 будет варьироваться в пределах от $800 тысяч до $1 млн. AirCar 2 представляет собой значительный шаг вперёд по сравнению с предыдущей моделью, AirCar, которая в 2021 году совершила успешный 35-минутный перелёт, вызвав широкий общественный интерес.
Один из основателей Klein Vision Антон Зайац заявил, что стоимость AirCar 2 будет варьироваться в пределах от $800 тысяч до $1 млн. AirCar 2 представляет собой значительный шаг вперёд по сравнению с предыдущей моделью, AirCar, которая в 2021 году совершила успешный 35-минутный перелёт, вызвав широкий общественный интерес.
👍5
This media is not supported in your browser
VIEW IN TELEGRAM
Доброе утро 🤖
Это Optimus, которого разработала компания Tesla.
Маск напомнил, что в 2021 году во время презентации концепции робота на сцену был приглашен актер в костюме, который имитировал движения робота. Тогда человек исполнил танец, похожий на тот, что теперь станцевал на видео Optimus.
А еще Optimus способен ходить, приседать, балансировать на одной ноге, поднимать и перемещать объекты. Робот управляется ИИ, схожим с тем, что используется в автомобилях Tesla.
Это Optimus, которого разработала компания Tesla.
Маск напомнил, что в 2021 году во время презентации концепции робота на сцену был приглашен актер в костюме, который имитировал движения робота. Тогда человек исполнил танец, похожий на тот, что теперь станцевал на видео Optimus.
А еще Optimus способен ходить, приседать, балансировать на одной ноге, поднимать и перемещать объекты. Робот управляется ИИ, схожим с тем, что используется в автомобилях Tesla.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6❤3