AI写作工具 0
AI图像工具 0
- 常用AI图像工具
- AI图片插画生成
- AI图片背景移除
- AI图片物体抹除
- AI图片无损放大
- AI图片优化修复
- AI商品图生成
- AI 3D模型生成
AI视频工具 0
AI办公工具 0
- AI幻灯片和演示
- AI表格数据处理
- AI思维导图
- AI文档工具
- AI会议工具
- AI招聘求职
- AI法律助手
- AI语言翻译
- AI效率提升
AI智能体 0
AI聊天助手 0
AI编程工具 0
AI设计工具 0
AI音频工具 0
AI搜索引擎 0
AI开发平台 0
AI学习网站 0
AI训练模型 0
AI模型评测 0
AI内容检测 0
- 内容检测
- 降AI/AIGC率
AI提示指令 0

≡ AI工具

SWE-Lancer – OpenAI 推出的大模型基准测试

分类：AI工具

SWE-Lancer是什么

SWE-Lancer 是 OpenAI 推出的大模型基准测试，评估前沿语言模型（LLMs）在自由职业软件工程任务中的表现。包含来自 Upwork 的 1400 多个任务，总价值达 100 万美元，分为个人贡献者（IC）任务和管理任务。IC 任务涵盖从简单修复到复杂功能开发，管理任务则要求模型选择最佳技术方案。SWE-Lancer 的任务设计贴近真实软件工程场景，涉及全栈开发、API 交互等复杂场景。通过专业工程师的验证和测试，基准测试能评估模型的编程能力，衡量在实际任务中的经济效益。