gkzhb 花园

❯

❯

❯

❯

❯

睡前布置任务，睡醒验收：先解决信任问题_哔哩哔哩_bilibili

睡前布置任务，睡醒验收：先解决信任问题_哔哩哔哩_bilibili

2025年12月25日1分钟阅读

ZK/BibCard
CODE/Capture

tags::
source:: 睡前布置任务，睡醒验收：先解决信任问题_哔哩哔哩_bilibili

核心亮点

定义问题：如何划清人与 AI 交互的边界（哪些事情需要人来确认验证，哪些事情 AI 自行处理）

从强化学习（RLVR）的思想出发，设计如何让 Agent 每轮执行效果不断向目标收敛。核心问题：Verifiable Reward 如何量化验证产物的效果，并进行反馈

RLVR: Reinforcement Learning from Verifiable Rewards

其它

关系图谱

核心亮点
其它

Created with Quartz v4.5.1 © 2026

GitHub
Blog