- tags:: AI Agent
背景
AI Agent 正在向着目标导向去发展,将通过不断与环境交互进行强化学习,来不断提高执行的能力。
现有 LLM 不具备记忆能力,需要借助外部的记忆工程框架,将信息注入 LLM 对话上下文中,使用上下文学习来近似地实现记忆能力。
目标
现有提示词系统通常是固定预先调好的提示词,在场景日益复杂的情况下,缺乏灵活性,工程迭代成本高。
需要一套新的工程方案,实现根据实际运行目标或结果(执行前调整或者执行后调整),动态反馈优化提示词。
期望这套方案能解放用户心智,让用户不用操心提示词优化问题,而且能从会话中自动学习总结经验,无需人工干预。
技术设计
- 使用 OpenCode 作为 Agent 核心
- 提供 Web UI 或机器人进行对话
技术复杂性分析
- AI 系统有较大随机性,且输入空间很广泛,无法穷举
- 记忆系统设计,没有最优解,针对不同场景的适用技术方案可能不同
应对策略
针对复杂性 1,需要建立一套观测系统,能够记录评测日常交互中的 Agent 运行效果。
针对复杂性 2,需要建立问题分类场景,针对不同场景,设计合适的记忆系统。