2023 年第 13 周总结

发布于 2023-03-26  41 次阅读


周赛情况

等这周抽空补做下……

模型测试

新任务,要在 MMLU 数据集上测试 ChatGLM-6B、T5-3B、Flan-T5-3B 三个模型的效果。进展更新在仓库里。周日先初步测试了下 ChatGLM-6B,慢是真的慢……得学下怎么 finetuning。

CPP

其实也忘得差不多了,忽然要教别人,也只能现学现卖了hh