English
日本語
中文
标签:
规则奖励
用规则奖励提高模型安全行为 | OpenAI
7 月 25, 2024
—
由
air-beans
于
AI
OpenAI开发了一种利用规则奖励(RBRs)的新方法,在无需大量人类数据收集的情况下,使模型行为更加安全。R…