国产大模型数据收集系统

💰 津贴奖励

¥100

通过审核即可获得

📚 样题示例

样题加载中...

✨ 试运行通知

我们计划试运行至1月中旬，视强化学习实验结果决定项目去留～

期望大家提供高质量的题目，一起帮助模型变得更好！

📋 津贴发放标准

✓
通过合成数据检查
确保提交并非AI合成/改编题
✓
大模型 Roll 8次正确数 ≤ 6次
即8次中至少错2次以上
✓
通过正确性 Judge 审核
建议自行先验证一下

🤖 推荐测试模型

deepseek v3.2
https://chat.deepseek.com/
seed v1.8
https://www.doubao.com/chat/
kimi k2 thinking
https://www.kimi.com/

⚙️ 测试要求：

✓ 尽可能开启深度思考 / 长思考 / 联网搜索等模式
✓ 自行检查或使用AI辅助检查问题和答案的正确性

📝 数据质量要求

✓ 蕴含学科相关知识/推理
✓ 回避已开源测评bench题目
暂不接受选择题和证明题
✓ 问题表述清晰完整
✓ 答案准确无误
✓ 解答过程详细
✓ 支持 Markdown 格式和 LaTeX 数学公式

📝 提交题目

问题 (Problem) *

支持 Markdown 语法和 LaTeX 数学公式（行内: $公式$，块级: $$公式$$）

答案 (Answer) *

推荐提供唯一、明确的正确答案

解答过程 (Solution) *

请提供完整的推理步骤和解答过程

错误对话链接 *

请提供 kimi k2 thinking / deepseek v3.2 / seed v1.8 做错时的完整分享链接

微信号 (WeChat ID) *

用于联系和发放津贴

📦 批量题目上传

💡 批量上传说明

上传 JSONL 格式文件（每行一个JSON对象）
每个题目需包含：problem（问题）、answer（答案）、solution（解答）
无需提供错误对话链接（我们会统一测试）
津贴按通过检查的题目数量计算，每题100元

上传 JSONL 文件 *

支持 .jsonl 或 .json 格式文件 📥 下载示例文件

文件预览

                                未选择文件
                            

微信号 (WeChat ID) *

用于联系和发放津贴（按通过检查的题目数量计算）

💰 津贴说明

• 我们会对上传的题目进行统一测试和审核
• 津贴按通过检查的题目数量计算：100元/题
• 审核完成后会通过微信单独联系发放bonus

✅ 提交成功！

您的数据已成功提交，我们将在3个工作日内完成审核。

审核结果将通过微信通知您。

❌ 提交失败

请稍后重试或联系管理员