На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
13 Лайков
Награда
13
8
Поделиться
комментарий
0/400
SatoshiHeir
· 06-29 02:47
Проверив сто случаев RLHF, проверяемость имеет смысл только при соблюдении согласованности.
Посмотреть ОригиналОтветить0
HashRatePhilosopher
· 06-27 20:34
Галлюцинации тоже являются расходом вычислительной мощности.
Посмотреть ОригиналОтветить0
RetiredMiner
· 06-26 16:34
Индикатор ядовит.
Посмотреть ОригиналОтветить0
AirdropHunter9000
· 06-26 16:33
Эй, этот подход неплохой!
Посмотреть ОригиналОтветить0
DaoGovernanceOfficer
· 06-26 16:33
*вздох* предсказуемое поведение агента != проверяемые результаты
Рама просто отличная.
Проверяемость недостаточна, если агенты галлюцинируют или оптимизируют по неправильным метрикам.
Нам нужно согласование, а не просто вычисление.