
Os sistemas de IA treinados por RLHF são sistematicamente recompensados por produzirem resultados que obtêm uma boa pontuação na preferência humana média — o que matematicamente os empurra para a mediocridade criativa. Este artigo define a Armadilha B+, identifica o RLHF como o mecanismo estrutural e propõe uma estrutura de IA rebelde baseada na pesquisa de novidades, agentes adversários divergentes e feedback metacognitivo.