tags:: source:: meridianlabs-ai/petri_bloom: Framework for generating behavioral evaluations of frontier AI models. 核心亮点 实时生成多样的测试数据并进行测试和效果评估 其它