发布于 2023-04-02
摘要
周赛情况 半小时做出 3 题,WA一发,最终成绩三题 排 1098/5180 名。 第四题用 DFS 、 BFS 都超时。 模型测 …
周赛情况 半小时做出 3 题,WA一发,最终成绩三题 排 1098/5180 名。 第四题用 DFS 、 BFS 都超时。 模型测 …
周赛情况 等这周抽空补做下…… 模型测试 新任务,要在 MMLU 数据集上测试 ChatGLM-6B、T5-3B、Flan-T5- …
Subword Modeling 在之前的学习中,我们都以有限的词汇作为基本假设来训练模型。在遇到“字典”里没出现过的词语时,我们 …
Issues with RNN models Linear interaction distance: words that sh …
为了提高效率,模型在处理句子(embeddings)时并不是一句一句进行的,而是以 batch 为单位批量处理。但一个 batch …
Reference 原理 对输入数据施加一个线性变换再输出。 数学描述:$\bold{y} = \bold{A}^{T} \bol …
For language which there isn’t much parallel data available, comm …
Training a RNN Language Model At each step, the model have the pr …
本周学习情况 通过 cs224n Lecture 4 学习了句法结构分析的基本方法,尤其是 Dependency Parsing …
Context-Free Grammars (CFGs) Also called constituency or phrases …