国内厂商,能力还行。主要是便宜!接口使用百万token几块钱!

成本很低!随便玩。

DeepSeek-V2.5在多个评测榜单中表现出色,特别是在中文综合能力上位列开源榜首,与GPT-4-Turbo和文心4.0等闭源模型处于同一梯队。在英文综合能力上,它也位于第一梯队,与LLaMA3-70B相当,并超过了Mixtral8x22B。该模型在知识、数学、推理和编程等领域的表现均居前列,支持128K上下文。其具体评分如下:

  • 中文综合(AlignBench):8.04
  • 英文综合(MT-Bench):9.02
  • 知识(MMLU):80.4
  • 基础算数(GSM8K):95.1
  • 数学解题(MATH):74.7
  • 逻辑推理(BBH):84.3
  • 编程(HumanEval):89.0

数据统计

相关导航

暂无评论

暂无评论...