AI文摘

blog-thum
AI生成的烂图,居然可以反过来「微调模型」?

OpenAI用来改进模型的强化学习过程,是从积极的人类交互中隐式地减少消极行为。在本文中,作者采取了一种全新的实践方案:用消极的人类交互(即故意选择低质量图像)来隐式地增加积极行为。有了Dream

read more