AI 应用的端到端评估体系

问题:对于无法精确打分的场景,如何建立起可量化的评估?

基于解决用户问题的具体场景,分析总结出好的有效的行为模式中,存在的特点