LJL'Blog

答辩结束后

写在前面 这下是真的很久没有写文章了,甚至找这个博客的仓库都找了很久。 不好说最近有没有在认真生活,但是最近确实有在认真养小猫! 关于毕业 我个人觉得有一点艰难的,还是走到了毕业这一步,在三月初的时候完成了正式答辩、提交了归档的论文,然后和讨厌的大论文暂时告别(并且希望以后永远不要相见)。比较符合预料的是,正式答辩的确是走形式偏多一些的,在预答辩尖锐的评委老师在正式答辩常常保持沉...

Multilingual LAMA, Investigating Knowledge in Multilingual Pretrained Language Models

本文的主要动机来源于,发现多语言的背景下,LMs会表现出语言偏差,例如使用意大利语,会倾向于将意大利预测为原产国。 例如上图,可以看到语言的倾向是很大的,会对预测结果产生较大的影响,本文针对这个问题,利用mBERT做了以下问题探究: mBERT可以作为多语言知识库,大多数先前的工作只考虑了英语,将研究语言扩展到不同语言同样重要 利用英语数据集的翻译,探究mBERT的性能和语...

A Survey on In-context Learning

In-context Learning(上下文表征学习) ICL本身 ICL在LLMs时代非常有用,可以用来评判大语言模型。 简单来说,ICL允许在大模型当中应用一些简单的例子来进行上下文学习,即可以从上下文当中的几个示例来学习,其中,在数学推理(主要应用了CoT)等问题上的能力已经得到了验证。 具体来说,ICL的作用就是给出一些示例,直接丢给大模型,让他去根据其中的潜在模式来给出回...

GPT类的大模型的QA问答相关文献整理

写在前面 最近身边有很多人都毕业了,自升学以来,我常常都会有孤独的感觉,除了47,我的大部分,或者说几乎所有的本科的朋友都已经不在同济了,虽然现在的生活也不能说不好,无论是宿舍还是实验室还是课题组的氛围。但是在逛超市的时候总是能想到当初封校的前一天,宿舍一起在小卖铺搬成箱的冰红茶,补办的毕业典礼我也没有去,因为没有什么值得合照的机会,看到大家的合照又会想起宿舍分别的前一天晚上。之前的生活常...

年更博主今天上新啦

最近在忙些什么呢,我也说不太清楚。上个周末去了浦东,和47一起去帮支付宝大厦的人验题,说是验题,其实是去实际上做了一遍类似kaggle的竞赛题,但是因为自己的本领实在是太差了x,也没打过类似的算法竞赛,其实实际上感觉学习的时间远远大于做题的时间。对于题目的理解也仅仅停留在了,啊,我要做一个特征,我要把这些提取出来的特征丢进一个模型,我还得看看模型的结果是什么( 因此虽然是去测试题目的,实际...

© ljl. 保留部分权利。

本站由 Jekyll 生成,采用 Chirpy 主题。