OpenAI | 通过证明者-验证者游戏提高语言模型输出的可读性

—

由

于 AI

OpenAI的研究表明，通过训练强大的语言模型生成易于弱模型验证的文本，也使得文本更容易被人类评估。这种技术被称为“证明者-验证者游戏”，涉及两个玩家（证明者和验证者）检查解决方案的正确性。这确保了模型输出不仅准确，而且易于理解和验证。

引用元: Prover-Verifier Games improve legibility of language model outputs, July 17, 2024

评论