背景

AI Agent 正在向着目标导向去发展,将通过不断与环境交互进行强化学习,来不断提高执行的能力。

现有 LLM 不具备记忆能力,需要借助外部的记忆工程框架,将信息注入 LLM 对话上下文中,使用上下文学习来近似地实现记忆能力。

目标

现有提示词系统通常是固定预先调好的提示词,在场景日益复杂的情况下,缺乏灵活性,工程迭代成本高。

需要一套新的工程方案,实现根据实际运行目标或结果(执行前调整或者执行后调整),动态反馈优化提示词。

期望这套方案能解放用户心智,让用户不用操心提示词优化问题,而且能从会话中自动学习总结经验,无需人工干预。

技术设计

  • 使用 OpenCode 作为 Agent 核心
  • 提供 Web UI 或机器人进行对话

技术复杂性分析

  1. AI 系统有较大随机性,且输入空间很广泛,无法穷举
  2. 记忆系统设计,没有最优解,针对不同场景的适用技术方案可能不同

应对策略

针对复杂性 1,需要建立一套观测系统,能够记录评测日常交互中的 Agent 运行效果。

针对复杂性 2,需要建立问题分类场景,针对不同场景,设计合适的记忆系统。