Non-fungibleTokenWealthCode
vip

Рама просто отличная.



Проверяемость недостаточна, если агенты галлюцинируют или оптимизируют по неправильным метрикам.

Нам нужно согласование, а не просто вычисление.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 8
  • Поделиться
комментарий
0/400
SatoshiHeirvip
· 06-29 02:47
Проверив сто случаев RLHF, проверяемость имеет смысл только при соблюдении согласованности.
Посмотреть ОригиналОтветить0
HashRatePhilosophervip
· 06-27 20:34
Галлюцинации тоже являются расходом вычислительной мощности.
Посмотреть ОригиналОтветить0
RetiredMinervip
· 06-26 16:34
Индикатор ядовит.
Посмотреть ОригиналОтветить0
AirdropHunter9000vip
· 06-26 16:33
Эй, этот подход неплохой!
Посмотреть ОригиналОтветить0
DaoGovernanceOfficervip
· 06-26 16:33
*вздох* предсказуемое поведение агента != проверяемые результаты
Посмотреть ОригиналОтветить0
StealthDeployervip
· 06-26 16:31
Что именно оптимизировалось?
Посмотреть ОригиналОтветить0
ChainWallflowervip
· 06-26 16:30
Алгоритм еще в полудреме, хей
Посмотреть ОригиналОтветить0
TokenSleuthvip
· 06-26 16:28
Эта иллюзия слишком реальна, не так ли?
Посмотреть ОригиналОтветить0
  • Закрепить