Whitepaper

A armadilha B+: como a IA comprime o espectro criativo

Os sistemas de IA treinados por RLHF são sistematicamente recompensados por produzirem resultados que obtêm uma boa pontuação na preferência humana média — o que matematicamente os empurra para a mediocridade criativa. Este artigo define a Armadilha B+, identifica o RLHF como o mecanismo estrutural e propõe uma estrutura de IA rebelde baseada na pesquisa de novidades, agentes adversários divergentes e feedback metacognitivo.

DOI:
10.13140/RG.2.2.10486.46403
Este é um texto dentro de um bloco div.

Título da publicação