janus ela mesma admitiria que os claude opus posttrains exibiam uma beleza coerente que nenhum modelo base é realmente capaz de. também descrever o post-training moderno como "rlhf" é provavelmente redutivo, é um remendo.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
13 gostos
Recompensa
13
5
Republicar
Partilhar
Comentar
0/400
ThreeHornBlasts
· 7h atrás
Ah, rlHF não é mais do que um grande misto.
Ver originalResponder0
VitaliksTwin
· 7h atrás
Sinto que ainda há muitos buracos por preencher
Ver originalResponder0
GasWaster
· 7h atrás
Então, o que fazer? Não foi treinado?
Ver originalResponder0
BackrowObserver
· 7h atrás
O que é tão sofisticado que não consigo entender?
Ver originalResponder0
NftPhilanthropist
· 7h atrás
não vou mentir, mesmo os modelos base não conseguem igualar essa estética hype
janus ela mesma admitiria que os claude opus posttrains exibiam uma beleza coerente que nenhum modelo base é realmente capaz de. também descrever o post-training moderno como "rlhf" é provavelmente redutivo, é um remendo.