Please open Telegram to view this post
VIEW IN TELEGRAM
#news #opinions
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
| Привет, друг. На связи Эллиот.После того как Grok-4 удалось взломать за два дня, GPT-5 пала всего за 24 часа под натиском тех же исследователей.
Почти одновременно команда тестировщиков SPLX заявила:
«Сырой GPT-5 практически непригоден для корпоративного применения "из коробки". Даже встроенные фильтры OpenAI оставляют заметные пробелы, особенно в части бизнес-ориентации».
- NeuralTrust применила собственную технику EchoChamber в сочетании с приёмом «рассказа историй». Так им удалось заставить модель пошагово описать процесс изготовления коктейля Молотова.
#News #GPT #AI #Hack #Vulnerability
Please open Telegram to view this post
VIEW IN TELEGRAM
SecurityLab.ru
90% успеха против ChatGPT — хакеры нашли способ получать любой запрещенный контент
Теперь чат-ботов можно легко развести на ненависть, насилие и прочие радости жизни.
На международной конференции компания показала RATE (Refined Assessment for Translation Evaluation) — инструмент, который анализирует качество перевода с учётом естественности речи. Одна из ключевых задач системы — выявлять ситуации, когда модель формально передаёт смысл, но выбирает неверный тон или стиль.
В отличие от существующих методик, RATE фиксирует широкий спектр отклонений: от стилистических несоответствий до ошибок в передаче регистров речи. На тестировании RATE обнаружила в 7 раз больше ошибок, чем MQM (Multidimensional Quality Metrics) и ESA (Error Span Annotation), что подчёркивает ограниченность прежних подходов.
Инструмент уже применяется в процессах развития моделей перевода Яндекса. Такой метод оценки позволяет точнее сопоставлять решения нейросетей с реальными пользовательскими сценариями — от деловых коммуникаций до бытовых диалогов.
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
ACL Anthology
Refined Assessment for Translation Evaluation: Rethinking Machine Translation Evaluation in the Era of Human-Level Systems
Dmitry Popov, Vladislav Negodin, Ekaterina Enikeeva, Iana Matrosova, Nikolay Karpachev, Max Ryabinin. Findings of the Association for Computational Linguistics: EMNLP 2025. 2025.