AI 文档
该目录包含与 LLM 相关的关键文档:
LLM 评估报告
提供对各种 LLM 模型的比较分析,包括:
性能指标(响应时间,通过的测试)
质量评估(CodeBLEU,有用性,功能正确性)
评分方法的详细解释
LLM-准备文档
提供一个为LLM消费而设计的综合参考文档,将各种文档整合为一个易于访问的格式。
这些文档提供了对LLM性能的见解,并提供了LLM交互的资源。随着新评估的进行或文档的修订,它们可能会被更新。
Last updated
该目录包含与 LLM 相关的关键文档:
提供对各种 LLM 模型的比较分析,包括:
性能指标(响应时间,通过的测试)
质量评估(CodeBLEU,有用性,功能正确性)
评分方法的详细解释
提供一个为LLM消费而设计的综合参考文档,将各种文档整合为一个易于访问的格式。
这些文档提供了对LLM性能的见解,并提供了LLM交互的资源。随着新评估的进行或文档的修订,它们可能会被更新。
Last updated