周赛情况
等这周抽空补做下……
模型测试
新任务,要在 MMLU 数据集上测试 ChatGLM-6B、T5-3B、Flan-T5-3B 三个模型的效果。进展更新在仓库里。周日先初步测试了下 ChatGLM-6B,慢是真的慢……得学下怎么 finetuning。
CPP
其实也忘得差不多了,忽然要教别人,也只能现学现卖了hh
发布于 2023-03-26 89 次阅读
等这周抽空补做下……
新任务,要在 MMLU 数据集上测试 ChatGLM-6B、T5-3B、Flan-T5-3B 三个模型的效果。进展更新在仓库里。周日先初步测试了下 ChatGLM-6B,慢是真的慢……得学下怎么 finetuning。
其实也忘得差不多了,忽然要教别人,也只能现学现卖了hh
Comments NOTHING