Паттерн универсален: проверено на трех масштабах моделей (355M–70B параметров), трех архитектурах (GPT-Neo, RoBERTa, Llama*) и восьми задачах
@ИИ
Паттерн универсален: проверено на трех масштабах моделей (355M–70B параметров), трех архитектурах (GPT-Neo, RoBERTa, Llama*) и восьми задачах
Все модели провалили критерии безопасности при управлении роботами
Система BLAZER автоматически обучает роботов манипулированию, достигая 47.8% успешности против 33.3% у базовой модели