BERT是一个transformers模型,它是在一个大型英文语料库上进行自监督预训练的。这意味着它仅在原始文本上进行预训练,没有任何人类以任何方式对其进行标注(这就是为什么它可以使用大量公开可用的数据、,并使用自动过程从这些文本中生成输入和标签。更准确地说,它是通过两个目标进行预训练的:
- 掩码语言建模(MLM、:将一个句子,模型随机屏蔽输入中15%的单词,然后将整个屏蔽的句子通过模型运行,并预测屏蔽的单词。这与传统的递归神经网络(RNN、不同,后者通常一个接一个地看到单词,或者与GPT这样的自回归模型内部屏蔽未来的标记。它允许模型学习句子的双向表示。
- 下一句预测(NSP、:模型在预训练期间将两个掩码句子连接在一起作为输入。有时它们对应于原始文本中相邻的句子,有时则不是。然后,模型必须预测这两个句子是否相互跟随。
通过这种方式,模型学习了英语语言的内部表示,然后可以用于提取对下游任务有用的特征:例如,如果您有一个标记的句子数据集,您可以使用BERT模型生成的特征作为输入来训练标准分类器。
本文URL:https://www.ainavpro.com/sites/2559.html
收录说明:
1、本网页并非 bert-base-uncased-Hugging Face 官网网址页面,此页面内容编录于互联网,只作展示之用;2、如果有与 bert-base-uncased-Hugging Face 相关业务事宜,请访问其网站并获取联系方式;3、本站与 bert-base-uncased-Hugging Face 无任何关系,对于 bert-base-uncased-Hugging Face 网站中的信息,请用户谨慎辨识其真伪。4、本站收录 bert-base-uncased-Hugging Face 时,此站内容访问正常,如遇跳转非法网站,有可能此网站被非法入侵或者已更换新网址,导致旧网址被非法使用,5、如果你是网站站长或者负责人,不想被收录请邮件删除:i-hu#Foxmail.com (#换@)
前往AI网址导航
2、本站所有文章、图片、资源等如果未标明原创,均为收集自互联网公开资源;分享的图片、资源、视频等,出镜模特均为成年女性正常写真内容,版权归原作者所有,仅作为个人学习、研究以及欣赏!如有涉及下载请24小时内删除;
3、如果您发现本站上有侵犯您的权益的作品,请与我们取得联系,我们会及时修改、删除并致以最深的歉意。邮箱: i-hu#(#换@)foxmail.com