janus ela mesma admitiria que os claude opus posttrains exibiam uma beleza coerente que nenhum modelo base é realmente capaz de. também descrever o post-training moderno como "rlhf" é provavelmente redutivo, é um remendo.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
13 Curtidas
Recompensa
13
5
Repostar
Compartilhar
Comentário
0/400
ThreeHornBlasts
· 7h atrás
Ah, rlHF não é mais do que um grande misto.
Ver originalResponder0
VitaliksTwin
· 7h atrás
Sinto que ainda há muitos buracos por preencher
Ver originalResponder0
GasWaster
· 7h atrás
Então, o que fazer? Não foi treinado?
Ver originalResponder0
BackrowObserver
· 7h atrás
O que é tão sofisticado que não consigo entender?
Ver originalResponder0
NftPhilanthropist
· 7h atrás
não vou mentir, mesmo os modelos base não conseguem igualar essa estética hype
janus ela mesma admitiria que os claude opus posttrains exibiam uma beleza coerente que nenhum modelo base é realmente capaz de. também descrever o post-training moderno como "rlhf" é provavelmente redutivo, é um remendo.