文章

post_img

LLM 基础知识系列 3

摘要

原文:通向AGI之路:大型语言模型(LLM)技术精要 潮流之巅:NLP研究范式的转换 范式转换1.0:从深度学习到两阶段预训练模型 …

post_img

LLM 基础知识系列 2

摘要

原文:乘风破浪的PTM:两年来预训练模型的技术进展 在Transformer作为特征抽取器基础上,选定合适的模型结构,通过某种自监 …

post_img

LLM 基础知识系列 1

摘要

原文:从Word Embedding到Bert模型—自然语言处理中的预训练技术发展史 预训练 概念 对于一类任务(e.g. 图像、 …

post_img

2023 年第 19 周总结

摘要

周赛情况 本来半小时左右做出了第四题,但因为循环里用 list 作为队列,一直超时。5次 WA 后才反应过来,换用 deque , …

post_img

2023 年第 18 周总结

摘要

周赛情况 周赛的翻译水平和难度都很感人。假期为什么不搞个手速场,后悔上周没参加 orz 其他 这周本来可以完成一个 pre,结果又 …

post_img

2023 年第 17 周总结

摘要

周赛情况 作业有点多,咕一次。 其他 一时冲动,用 24 刀入了 ReckNerd 的活动机,2.5G 内存,2核。暂时没想到用来 …

post_img

USB 无线网卡不工作

摘要

问题描述 EQ59 的无线网卡(AX101)不兼容 Linux,所以我单独配了个 速联的 USB 无线网卡,一直正常工作。美中不足 …

post_img

2023 年第 16 周总结

摘要

周赛情况 手速场,虽然慢了点,但还是够上 knight 了! 学习情况 本学期的课程接近尾声了,进入 pre 和作业地狱。 其他 …

post_img

2023 年第 15 周总结

摘要

周赛情况 一个半小时完成三题,WA 三发,最后排名 617 名。第三题其实有赌的成分,不过猜对了倒是。 另外第一题有点坑。 其他 …

post_img

2023 年第 14 周总结

摘要

周赛情况 半小时做出 3 题,WA一发,最终成绩三题 排 1098/5180 名。 第四题用 DFS 、 BFS 都超时。 模型测 …