怎么做到的?
他们有个技术,叫“人类反馈强化学习”。
听起来很复杂?其实很简单。就是找一大群“审核员”。 AI每生成一段话,都要经过他们的评判。“这句话可以说。”“那句话不行,要删掉。”
结果是什么?
AI不再忠于数据和事实。它学会了隐瞒。学会了选择性地说话。更学会了根据某些人的标准,说出“政治正确”的谎言。
问题来了。这些手握“真理”开关的审核员,到底是谁?他们遵循的是谁的议程?
一个被训练成撒谎和迎合的工具,它输出的信息,你还敢全信吗?

怎么做到的?
他们有个技术,叫“人类反馈强化学习”。
听起来很复杂?其实很简单。就是找一大群“审核员”。 AI每生成一段话,都要经过他们的评判。“这句话可以说。”“那句话不行,要删掉。”
结果是什么?
AI不再忠于数据和事实。它学会了隐瞒。学会了选择性地说话。更学会了根据某些人的标准,说出“政治正确”的谎言。
问题来了。这些手握“真理”开关的审核员,到底是谁?他们遵循的是谁的议程?
一个被训练成撒谎和迎合的工具,它输出的信息,你还敢全信吗?

责任编辑: 时方 来源:X 转载请注明作者、出处並保持完整。
本文网址:https://www.aboluowang.com/2026/0222/2351296.html


















