GitHub - davideuler/llm-practical-test: 一个不同 SOTA 开源模型在不同的日常任务（主要为代码生成）效果上的测试。

一个不同 SOTA 开源模型不同任务效果上的测试。

这个测试对日常使用的不同场景任务的人工评测。

参考各个 markdown 文件中的 prompt 和结论。

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
.gitignore		.gitignore
1_rest_prompt.md		1_rest_prompt.md
2_chrome_extension_prompt.md		2_chrome_extension_prompt.md
3.ch_scene_prompt.md		3.ch_scene_prompt.md
4.library_management_prompt.md		4.library_management_prompt.md
5.long_task_library_management_prompt.md		5.long_task_library_management_prompt.md
6.fix_api_service.md		6.fix_api_service.md
7.mobile_git_client.md		7.mobile_git_client.md
8.music_player_app.md		8.music_player_app.md
LHK_DPO_v1_app.py		LHK_DPO_v1_app.py
Nous-Capybara-7B-V1p9_app.misunderstand.py		Nous-Capybara-7B-V1p9_app.misunderstand.py
Nous-Hermes-2-Mixtral-8x7B_DPO_app.py		Nous-Hermes-2-Mixtral-8x7B_DPO_app.py
Nous-Hermes-2-Yi-34B_Downloader_app.py		Nous-Hermes-2-Yi-34B_Downloader_app.py
README.md		README.md
Snorkel-Mistral-PairRM-DPO_downloader_app.works.py		Snorkel-Mistral-PairRM-DPO_downloader_app.works.py
deepseek-coder-33b-instruct_downloader_app.works.py		deepseek-coder-33b-instruct_downloader_app.works.py
gpt4_app.py		gpt4_app.py
gpt4_fixed_for_LHK_DPO_app.py		gpt4_fixed_for_LHK_DPO_app.py
requirements.txt		requirements.txt
test_downloader.sh		test_downloader.sh

Provide feedback