由于数学公式不能成功渲染,阅读体验较差,在此建议阅读PDF版本
由于数学公式不能成功渲染,阅读体验较差,在此建议阅读PDF版本
IO设备I/O控制方式在输入/输出系统中,经常需要进行大量的数据传输,而传输过程中有各种不同的I/O控制方式,基本的控制方式主要有以下四种:1)程序查询方式。由CPU通过程序不断查询I/O设备是否已做好准备,从而控制I/O设备与主机交换信息。2)程序中断方式。只在I/O设备准备就绪并向CPU发出中断请求时才予以响应。3)DMA方式。主存和I/O设备之间有一条直接数据通路,当主存和I/O设备交换信息时,无须调用中断服务程序。4)通道方式。在系统中设有通道控制部件,每个通道都挂接若干外设,主机在执行I/O命令时,只需启动有关通道,通道将执行通道程序,从而完成I/O操作。
I/O接口功能I/O接口的主要功能如下:
进行地址译码和设备选择。CPU送来选择外设的地址码后,接口必须对地址进行译码以产生设备选择信息,使主机能和指定外设交换信息。
实现主机和外设的通信联络控制。解决主机与外设时序配合问题,协调不同工作速度的外设和主机之间交换信息,以保证整个计算机系统能统一、协调地工 ...
虚拟地址物理和虚拟寻址计算机系统的主存被组织成一个由M个连续的字节大小的单元组成的数组。每字节都有一个唯一的物理地址(PA)。第一个字节的地址为0,接下来的字节地址为1,再下一个为2,依此类推。给定这种简单的结构,CPU访问内存的最自然的方式就是使用物理地址。我们把这种方式称为物理寻址。
早期的PC采用物理寻址,现代处理器使用的是一种虚拟寻址的寻址方式。
使用虚拟寻址,CPU通过生成一个虚拟地址(VirtualAddress,VA)来访问主存,这个虚拟地址在被送到内存之前先转换成适当的物理地址。将一个虚拟地址转换为物理地址的任务叫做地址翻译(addresstranslation)。就像异常处理一样,地址翻译需要CPU硬件和操作系统之间的紧密合作。CPU芯片上叫做内存管理单元(MemoryManagementUnit,MMU)的专用硬件,利用存放在主存中的查询表来动态翻译虚拟地址,该表的内容由操作系统管理。
虚拟内存的三个角色作为缓存工具概念上来说,虚拟内存就是存储在磁盘上的 N 个连续字节的数组。这个数组的部分内容,会缓存在 DRAM 中,在 DRAM 中的每个缓存块(cache b ...
Attention is all you needstructure
Encoder and decoderEncoder编码器由6层组成,每层包含两个子层(多头注意力层,全连接网络层)在每层后使用残差连接和层归一化
残差连接类似一种兜底策略,目的是使得 就算模型的深度已经达到最优解,后面再增加冗余层也至少不会导致之前的效果下降 。
Decoder同样由6层组成,但每层包含三个子层(增加了一个掩码多头注意力层)目的是为了防止当前位置注意到后续的位置。
Attention$$\mathrm{Attention}(Q,K,V)=\mathrm{softmax}(\frac{QK^T}{\sqrt{d_k}})V$$
Q,K,V均来自于输入的特征的线性变换
其中Q代表着需要查询的信息,K代表着输入本身的内容,V代表着原本的信息。
所以如果不引入注意力机制,全部使用V就是简单的全连接神经网络
Q和K的乘积表示了需要的内容和本身的内容之间的相似度,进而指出了需要注意哪些内容
比例系数是为了防止softmax后的值过大,所有的注意力被分走,同时可以让softmax的偏导数不至于太小,加快 ...
循环神经网络
根据全部语料来调节模型
单轮训练参数矩阵保持不变
$$\begin{aligned}h_{t}&=\sigma(W^{(hh)}h_{t-1}+W^{(hx)}x_{[t]})\\hat{y}{t}&=softmax(W^{(S)}h{t})\end{aligned}$$
RNN loss$$J^{(t)}(\theta)=-\sum_{j=1}^{|V|}y_{t,j}\times log(\hat{y}_{t,j})$$
单个时间步的交叉熵损失
$$J=\frac{1}{T}\sum_{t=1}^{T}J^{(t)}(\theta)=-\frac{1}{T}\sum_{t=1}^{T}\sum_{j=1}^{|V|}y_{t,j}\times log(\hat{y}_{t,j})$$
整个语料库的平均交叉熵损失
$$Perplexity=2^J$$
困惑度
优缺点
处理任意长度序列
模型不会因为序列长度变长而变大
使用了之前时间步的信息
计算慢,无法 ...
中央处理器cpu的功能cpu由运算器和控制器组成。具体功能包括
指令控制。完成取指令(也称取指)、分析指令和执行指令的操作,即程序的顺序控制。
操作控制。产生完成一条指令所需的操作信号,把各种操作信号送到相应的部件,从而控制这些部件按指令的要求正确执行。
时间控制。严格控制各种操作信号的出现时间、持续时间及出现的时间顺序。
数据加工。对数据进行算术和逻辑运算。
中断处理。对运行过程中出现的异常情况和中断请求进行处理。
指令周期的数据流取指周期的数据流向如下:
$1)PC\textcircled{1}MAR\textcircled{2}地址总线\textcircled{3}$存储器。2)CU发出读命令$\textcircled{4}$控制总线$\textcircled{5}$存储器。3)主存$\textcircled{6}$数据总线$\textcircled{7}$MDR$\underline{\textcircled{8}}$IR(存放指令)。4)CU发出控制信号,PC 内容加 1。
间址周期的数据流向如下:1)Ad(IR)(或 MDR)$\textcircled{1}$MAR ...
指令系统ISA所有指令的集合构成该机器的指令系统,又称指令集。是ISA(指令集体系结构最核心的部分)
ISA规定的内容包括
指令格式,指令寻址方式,操作类型,每种操作对应的操作数的规定
操作数类型,操作数寻址方式,大端法or小端法
程序可访问的寄存器的编号,个数和位数,存储空间的大小和编址方式
指令执行过程的控制方式等,包括程序计数器、条件码定义
指令格式总体分为 操作码+地址码的形式
具体可分为
零地址指令:仅有操作码op,没有显式地址。 如:空操作,停机,中断
一地址指令:op+A1 如:+1 -1 求反 求补
二地址指令:op + A1 +A2 指令含义:(A1)op (A2) 存到 A1
三地址指令:与二地址不同的是存到A3
四地址指令:与三地址不同的是 A4是下一条指令的地址
拓展操作码
一种典型方法 简单理解为 前面都是1代表操作码还未停止 读取到第一次 1111 代表后面为操作数
例题三道在 CPU 执行指令的过程中,指令的地址由 ( ) 给出。
A. 程序计数器 (PC)B. 指令的地址码字段C. 操作系统D. 程序员
设机器字长为 32 位,一个容量为 16M ...
由于数学公式不能成功渲染,阅读体验较差,在此建议阅读PDF版本
由于数学公式不能成功渲染,阅读体验较差,在此建议阅读PDF版本