janus ela mesma admitiria que os claude opus posttrains exibiam uma beleza coerente que nenhum modelo base é realmente capaz de. também descrever o post-training moderno como "rlhf" é provavelmente redutivo, é um remendo.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • 5
  • Repostar
  • Compartilhar
Comentário
0/400
ThreeHornBlastsvip
· 7h atrás
Ah, rlHF não é mais do que um grande misto.
Ver originalResponder0
VitaliksTwinvip
· 7h atrás
Sinto que ainda há muitos buracos por preencher
Ver originalResponder0
GasWastervip
· 7h atrás
Então, o que fazer? Não foi treinado?
Ver originalResponder0
BackrowObservervip
· 7h atrás
O que é tão sofisticado que não consigo entender?
Ver originalResponder0
NftPhilanthropistvip
· 7h atrás
não vou mentir, mesmo os modelos base não conseguem igualar essa estética hype
Ver originalResponder0
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)