≡ AI工具

Meeseeks – 美团开源的模型指令遵循能力评测集

分类:AI工具
Meeseeks – 美团开源的模型指令遵循能力评测集

Meeseeks是什么

Meeseeks 是美团 M17 团队开源的大模型评测集,用在评估模型的指令遵循能力。Meeseeks通过三级评测框架,从宏观到微观全面衡量模型是否能严格按照用户指令生成回答,不评估回答内容的知识正确性。Meeseeks 引入多轮纠错模式,让模型在接收到反馈后进行修正,评估其自我纠错能力。Meeseeks用客观评测标准,摒弃模糊指令,确保结果一致性和准确性。Meeseeks 的数据设计更具挑战性,能有效拉开不同模型间的差距,为模型开发者提供优化方向。

Meeseeks