Encoder-only、Decoder-only、Encoder-Decoder 到底长什么样

张开发

• 2026/4/20 23:37:10 • 15 分钟阅读

分享文章

Encoder-only、Decoder-only、Encoder-Decoder 到底长什么样

总图1. Encoder-only (BERT 类)输入 tokens|[Encoder]|[Encoder]|[Encoder]|输出表示 vectors2. Decoder-only (GPT / LLaMA 类)输入 tokens|[Decoder]|[Decoder]|[Decoder]|逐个预测下一个 token3. Encoder-Decoder (T5 类)输入 tokens 已生成 tokens| |[Encoder] [Decoder]| |[Encoder] ---- cross-attn ---- [Decoder]| |编码结果逐个生成输出它们真正的区别Encoder-only- 只负责“把输入读懂”。- 每个词都能同时看到左边和右边。- 输出通常是整句或每个 token 的表示不是天然拿来一直往下写。- 典型BERT我爱北京天安门^ 每个词都能看见整句其他词适合- 分类- 匹配- 实体识别- 检索/排序Decoder-only- 负责“按顺序往下写”。- 当前 token 只能看左边不能看右边这叫 causal mask。- 所以它天然适合生成。我爱北京^只能看左边预测下一个词适合- 对话- 写作- 代码生成- 通用生成式任务典型- GPT- LLaMAEncoder-Decoder- 左边先把输入读懂右边再根据读懂的结果生成输出。- Decoder 一边看自己已经生成的内容一边看 Encoder 给的编码结果。- 这里比前两种多了一个关键部件cross-attention。输入: Translate: I love BeijingEncoder 先编码整句Decoder 再一步步生成: 我爱北京适合- 翻译- 摘要- 改写- 明确的“输入文本 - 输出文本”任务典型- T5再看一张对比表| 结构 | 看输入方式 | 会不会自然生成 | 代表模型 ||---|---|---|---|| Encoder-only | 左右都看 | 不擅长长生成 | BERT || Decoder-only | 只看左边 | 最擅长 | GPT、LLaMA || Encoder-Decoder | Encoder 全看Decoder 生成 | 很适合 | T5 |一句最容易记住的话- Encoder-only先理解- Decoder-only边看边写- Encoder-Decoder先读懂再翻译/改写/生成

Encoder-only、Decoder-only、Encoder-Decoder 到底长什么样

最新文章

2026指纹浏览器性能优化实战：多开稳定性与资源占用控制全解析

JavaScript 中数组引用陷阱与“破纪录”问题的正确解法

c++如何实现简单的文件签名验证_HMAC-SHA1算法应用【进阶】

No idea。。

Python 模块精讲：hashlib — MD5、SHA 加密（3500 字完整版）

BGE-Large-Zh开源可部署：完全离线、无API调用、数据不出本地

推荐文章

VisionMaster企业实操训练系列课程

Python实现基于DD驱动的键盘R键连发功能

如何实现SQL视图的灰度发布_版本兼容与双重定义方案

别再只靠复位了！Xilinx FIFO IP核清空的三种实战方法（附Verilog代码）

在Ubuntu 20.04上为MT7628开发板搭建OpenWrt编译环境（含64位系统避坑指南）

告别砖头！华大HC32F系列MCU IAP升级中的安全校验与故障恢复机制设计

相关文章

科研绘图不止Origin：聊聊OriginPro 2021与Python/Matlab的共存与选择

StructBERT在客服系统中的实战应用：智能情绪分析与工单分类

30元玩客云变身全能软路由：手把手教你用Docker部署AllinOne直播服务

FinalBurn Neo终极指南：开源街机模拟器的技术架构与实战应用

OpCore-Simplify终极指南：10分钟完成黑苹果配置的完整解决方案

Qwen3.5-9B成本优化实践：Spot实例调度+自动启停+GPU资源弹性伸缩

分享文章

更多文章

五相电机双闭环矢量控制模型_采用邻近四矢量SVPWM_MATLAB_Simulink仿真模型包括

【Argoverse 1 数据集实战指南】从数据加载到轨迹预测模型构建

VGA时序详解与FPGA实现避坑指南：从800x600@60Hz到你的第一幅图像

Zynq7020 PS端MIO点灯实战：从Vivado配置到SDK代码的保姆级避坑指南

026、微服务通信：gRPC与Protocol Buffers

技术解析】MATLAB Simulink仿真：蓄电池SOC均衡优化与直流母线稳定控制

别再傻傻用IO翻转了！用STM32的PWM定时器精准驱动WS2812B彩灯（附时序图详解）

人形机器人跑完半马：今年具身智能的第一次大考

销量爆款背后的真相：先选场景，再做产品！

Tacotron-2超参数调优秘籍：20个关键参数对语音质量的影响分析

THREE.MeshLine入门教程：10分钟创建惊艳3D线条效果

Proxmox VE 8 入门上手系列（四）存储与备份-保护你的数据