We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
一个不同 SOTA 开源模型在不同的日常任务(主要为代码生成)效果上的测试。
There was an error while loading. Please reload this page.
一个不同 SOTA 开源模型不同任务效果上的测试。
这个测试对日常使用的不同场景任务的人工评测。
参考各个 markdown 文件中的 prompt 和结论。