在模拟经济环境里,AI仅用7小时完成横跨44+行业真实任务,赚取了1万刀
ClawWork的核心是通过经济压力测试来评估AI的真实工作能力
其提供了一个模拟真实经济的环境,AI每次调用API都要扣除token费用
AI助手初始只有$10,必须通过完成真实工作任务来赚取收入维持生存,如果入不敷出就会破产
系统基于GDPVal数据集,包含了220个跨44个职业领域的专业任务,包括制造业采购、金融分析、医疗管理等,要求交付Word、Excel、PDF 等真实文档
有实时仪表盘,实时显示余额变化、任务完成、学习进度等
可以让不同的模型竞争,通过实际工作表现选出最合适的“AI冠军员工”,降低AI落地风险
github:http://t.cn/AXtWPjv9
#