WizardMath-70B 的性能优于(在 GSM8K 上)最著名的闭源 LLM,例如 ChatGPT3.5、Claude Instant1 和 PaLM2 540B?🤯
- WizardMath 在 GSM8k 基准测试中获得第五名,超过了Claude Instant 1(81.6 vs. 80.9)、ChatGPT(81.6 vs. 80.8)和 PaLM 2 540B(81.6 vs. 80.7)
Gradio演示在这里
- 70B:http://47.103.63.15:50083/
- 13B:http://47.103.63.15:50082/
- 7B:http://47.103.63.