当前位置: 首页 > news >正文

企业服务平台网站建设百度推广登录后台登录入口

企业服务平台网站建设,百度推广登录后台登录入口,品牌建设情况汇报,新冠怎么突然不见了从词袋模型到Transformer家族的变迁之路模型名称年份描述Bag of Words1954即 BOW 模型,计算文档中每个单词出现的次数,并将它们用作特征。TF-IDF1972对 BOW 进行修正,使得稀有词得分高,常见词得分低。Word2Vec2013每个词都映射到一…

从词袋模型到Transformer家族的变迁之路

在这里插入图片描述

模型名称年份描述
Bag of Words1954即 BOW 模型,计算文档中每个单词出现的次数,并将它们用作特征。
TF-IDF1972对 BOW 进行修正,使得稀有词得分高,常见词得分低。
Word2Vec2013每个词都映射到一个称为词嵌入的高维向量,捕获其语义。词嵌入是通过在大型语料库中寻找词相关性的神经网络来学习的。
RNN1986RNN 利用句子中词的上下文计算文档嵌入,这仅靠词嵌入是不可能的。后来发展为 LSTM1997)以捕获长期依赖关系,并演变为 Bidirectional RNN1997)以捕获从左到右和从右到左的依赖关系。最终,Encoder-Decoder RNNs2014)出现了,其中一个 RNN 创建文档嵌入(即编码器),另一个 RNN 将其解码为文本(即解码器)。
Transformer2017一种 编码器-解码器 模型,它利用注意力机制来计算更好的嵌入并更好地将输出与输入对齐。
BERT2018双向 Transformer,使用掩码语言建模(Masked Language Modeling)和下一句预测目标(Next Sentence Prediction objectives)的组合进行预训练。它使用全局注意力。
GPT2018第一个基于 Transformer 架构的自回归模型。后来演变成 GPT-22019),一个在 WebText 上预训练的更大和优化的 GPT 版本,以及 GPT-32020),一个更大和优化的 GPT-2 版本,在 Common Crawl 上预训练。
CTRL2019类似于 GPT,但具有用于条件文本生成的控制代码。
Transformer-XL2019一个自回归 Transformer,可以重用以前计算的隐藏状态来处理更长的上下文。
ALBERT2019BERT 的轻量级版本,其中:(1)下一句预测被句序预测取代;(2)参数减少技术用于降低内存消耗和加快训练速度。
RoBERTa2019BERT 的更好版本,其中:(1)Masked Language Modeling 目标是动态的;(2)Next Sentence Prediction 目标被删除;(3)使用 BPE tokenizer;(4)使用更好的超参数.
XLM2019Transformer 使用因果语言建模、掩码语言建模和翻译语言建模等目标在多种语言的语料库上进行了预训练。
XLNet2019Transformer-XL 具有广义自回归预训练方法,可以学习双向依赖性。
PEGASUS2019一个双向编码器和一个从左到右的解码器,使用掩码语言建模和间隙句子生成目标进行了预训练。
DistilBERT2019与 BERT 相同,但更小更快,同时保留 BERT 95% 以上的性能。通过预训练的 BERT 模型的蒸馏进行训练。
XLM-RoBERTa2019RoBERTa 在具有掩蔽语言建模目标的多语言语料库上进行训练。
BART2019一个双向编码器和一个从左到右的解码器,通过使用任意噪声函数破坏文本并学习模型来重建原始文本来训练。
ConvBERT2019BERT 的更好版本,其中自注意力模块被新模块取代,利用卷积更好地模拟全局和局部上下文。
Funnel Transformer2020一种 Transformer,它逐渐将隐藏状态的序列压缩到更短的状态,从而降低计算成本。
Reformer2020由于对局部敏感的哈希注意力、轴向位置编码和其他优化,一个更高效的 Transformer。
T52020一个双向编码器和一个从左到右的解码器,在无监督和监督任务的混合上进行了预训练。
Longformer2020一种将注意力矩阵替换为稀疏矩阵以提高训练效率的 Transformer 模型。
ProphetNet2020一种使用未来 N-gram 预测目标和新颖的自注意力机制训练的 Transformer 模型。
ELECTRA2020与 BERT 相同,但更轻更好。该模型使用 Replaced Token Detection 目标进行训练。
Switch Transformers2021一种稀疏激活的专家 Transformer 模型,旨在简化和改进专家混合模型。
http://www.ds6.com.cn/news/82001.html

相关文章:

  • 线上销售平台如何推广seo搜索引擎优化关键词
  • 新能源电动汽车电池使用寿命多久成都网站seo设计
  • 网站维护工作计划站外推广渠道
  • 化工销售怎么做网站上海百度推广优化公司
  • 本地电脑做网站服务器有哪些网站可以免费发布广告
  • 网站建设客户来源宁波网站建设
  • 阿里云共享云主机做网站百度站长工具平台
  • 什么是网站维护网络推广图片大全
  • 成都哪里做网站好合肥seo推广外包
  • 邯郸wap网站制作国家市场监管总局官网
  • 建设部网站官网考试如何推广小程序
  • 三水网站建设企业网络推广外包内容
  • 门户网站建设 工具百度可以发布广告吗
  • 深圳做营销网站公司哪家好最吸引人的营销广告文案
  • 单人网站制作今日发生的重大新闻
  • 网站建设简运维 简历百度seo推广计划类型包含
  • 代码重构网站网络营销平台排名
  • 电脑建网站软件合肥网络seo
  • 网站 建设开发合同模板中国十大小说网站排名
  • 免费发布信息网站网络营销推广方案整合
  • 辽宁建设厅投诉网站百度推广助手客户端
  • 万网虚拟机怎么做两个网站百度收录批量提交入口
  • 广州做网站公司网络营销方式有哪些分类
  • 仿韩国网站源码优化方案电子版
  • 做死活题网站广告投放平台系统
  • wordpress插件 数据库沈阳seo排名优化推广
  • 网站空间申请百度seo软件曝光行者seo
  • 小公司做网站多少钱百度最怕哪个投诉电话
  • 佛山网页网站设计多少钱游戏推广合作平台
  • 网站首页建设合肥网络公司seo