国内厂商,能力还行。主要是便宜!接口使用百万token几块钱!
成本很低!随便玩。
DeepSeek-V2.5在多个评测榜单中表现出色,特别是在中文综合能力上位列开源榜首,与GPT-4-Turbo和文心4.0等闭源模型处于同一梯队。在英文综合能力上,它也位于第一梯队,与LLaMA3-70B相当,并超过了Mixtral8x22B。该模型在知识、数学、推理和编程等领域的表现均居前列,支持128K上下文。其具体评分如下:
- 中文综合(AlignBench):8.04
- 英文综合(MT-Bench):9.02
- 知识(MMLU):80.4
- 基础算数(GSM8K):95.1
- 数学解题(MATH):74.7
- 逻辑推理(BBH):84.3
- 编程(HumanEval):89.0
数据统计
相关导航
暂无评论...