NLP – 第 2 页 – 星黎殿

发布于 2023-04-02

148 热度无~ 周总结

2023 年第 14 周总结

摘要

周赛情况半小时做出 3 题，WA一发，最终成绩三题排 1098/5180 名。第四题用 DFS 、 BFS 都超时。模型测 …

发布于 2023-03-26

152 热度无~ 周总结

2023 年第 13 周总结

摘要

周赛情况等这周抽空补做下…… 模型测试新任务，要在 MMLU 数据集上测试 ChatGLM-6B、T5-3B、Flan-T5- …

发布于 2023-02-13

186 热度无~ 笔记

CS224N Lecture 10: Transformers and Pretraining

摘要

Subword Modeling 在之前的学习中，我们都以有限的词汇作为基本假设来训练模型。在遇到“字典”里没出现过的词语时，我们 …

发布于 2023-02-13

196 热度无~ 笔记

CS224N Lecture 9: Self-Attention and Transformers

摘要

Issues with RNN models Linear interaction distance: words that sh …

发布于 2023-02-06

192 热度无~ 笔记

pack_padded_sequence 与 pad_packed_sequence

摘要

为了提高效率，模型在处理句子（embeddings）时并不是一句一句进行的，而是以 batch 为单位批量处理。但一个 batch …

发布于 2023-02-06

189 热度无~ 笔记

torch.nn.Linear

摘要

Reference 原理对输入数据施加一个线性变换再输出。数学描述：$\bold{y} = \bold{A}^{T} \bol …

发布于 2023-02-06

188 热度无~ 笔记

CS224N Lecture 7: Translation, Seq2Seq, Attention

摘要

For language which there isn’t much parallel data available, comm …

发布于 2023-02-06

186 热度无~ 笔记

CS224N Lecture 6: Simple and LSTM RNNs

摘要

Training a RNN Language Model At each step, the model have the pr …

发布于 2023-01-23

142 热度无~ 周总结

2023 年第 4 周总结

摘要

本周学习情况通过 cs224n Lecture 4 学习了句法结构分析的基本方法，尤其是 Dependency Parsing …

发布于 2023-01-16

160 热度无~ 笔记

CS224N Lecture 4: Syntactic Structure and Dependency Parsing

摘要

Context-Free Grammars (CFGs) Also called constituency or phrases …