Lazysqrt2

IO设备I/O控制方式在输入/输出系统中，经常需要进行大量的数据传输，而传输过程中有各种不同的I/O控制方式，基本的控制方式主要有以下四种：1）程序查询方式。由CPU通过程序不断查询I/O设备是否已做好准备，从而控制I/O设备与主机交换信息。2）程序中断方式。只在I/O设备准备就绪并向CPU发出中断请求时才予以响应。3）DMA方式。主存和I/O设备之间有一条直接数据通路，当主存和I/O设备交换信息时，无须调用中断服务程序。4)通道方式。在系统中设有通道控制部件，每个通道都挂接若干外设，主机在执行I/O命令时，只需启动有关通道，通道将执行通道程序，从而完成I/O操作。 I/O接口功能I/O接口的主要功能如下：进行地址译码和设备选择。CPU送来选择外设的地址码后，接口必须对地址进行译码以产生设备选择信息，使主机能和指定外设交换信息。实现主机和外设的通信联络控制。解决主机与外设时序配合问题，协调不同工作速度的外设和主机之间交换信息，以保证整个计算机系统能统一、协调地工 ...

学习

未读

CSAPP学习笔记(2)

Created2025-04-282025-04-28 CSAPP

虚拟地址物理和虚拟寻址计算机系统的主存被组织成一个由M个连续的字节大小的单元组成的数组。每字节都有一个唯一的物理地址（PA）。第一个字节的地址为0，接下来的字节地址为1，再下一个为2，依此类推。给定这种简单的结构，CPU访问内存的最自然的方式就是使用物理地址。我们把这种方式称为物理寻址。早期的PC采用物理寻址，现代处理器使用的是一种虚拟寻址的寻址方式。使用虚拟寻址，CPU通过生成一个虚拟地址（VirtualAddress，VA)来访问主存，这个虚拟地址在被送到内存之前先转换成适当的物理地址。将一个虚拟地址转换为物理地址的任务叫做地址翻译（addresstranslation)。就像异常处理一样，地址翻译需要CPU硬件和操作系统之间的紧密合作。CPU芯片上叫做内存管理单元（MemoryManagementUnit，MMU)的专用硬件，利用存放在主存中的查询表来动态翻译虚拟地址，该表的内容由操作系统管理。虚拟内存的三个角色作为缓存工具概念上来说，虚拟内存就是存储在磁盘上的 N 个连续字节的数组。这个数组的部分内容，会缓存在 DRAM 中，在 DRAM 中的每个缓存块(cache b ...

学习

未读

Attention is all you need

Created2025-04-262025-05-02 CS224

Attention is all you needstructure Encoder and decoderEncoder编码器由6层组成，每层包含两个子层（多头注意力层，全连接网络层）在每层后使用残差连接和层归一化残差连接类似一种兜底策略，目的是使得就算模型的深度已经达到最优解，后面再增加冗余层也至少不会导致之前的效果下降。 Decoder同样由6层组成，但每层包含三个子层（增加了一个掩码多头注意力层）目的是为了防止当前位置注意到后续的位置。 Attention$$\mathrm{Attention}(Q,K,V)=\mathrm{softmax}(\frac{QK^T}{\sqrt{d_k}})V$$ Q,K,V均来自于输入的特征的线性变换其中Q代表着需要查询的信息，K代表着输入本身的内容，V代表着原本的信息。所以如果不引入注意力机制，全部使用V就是简单的全连接神经网络 Q和K的乘积表示了需要的内容和本身的内容之间的相似度，进而指出了需要注意哪些内容比例系数是为了防止softmax后的值过大，所有的注意力被分走，同时可以让softmax的偏导数不至于太小，加快 ...

学习

未读

CS224-learn(2)

Created2025-04-242025-04-27 CS224

循环神经网络根据全部语料来调节模型单轮训练参数矩阵保持不变 $$\begin{aligned}h_{t}&=\sigma(W^{(hh)}h_{t-1}+W^{(hx)}x_{[t]})\\hat{y}{t}&=softmax(W^{(S)}h{t})\end{aligned}$$ RNN loss$$J^{(t)}(\theta)=-\sum_{j=1}^{|V|}y_{t,j}\times log(\hat{y}_{t,j})$$ 单个时间步的交叉熵损失 $$J=\frac{1}{T}\sum_{t=1}^{T}J^{(t)}(\theta)=-\frac{1}{T}\sum_{t=1}^{T}\sum_{j=1}^{|V|}y_{t,j}\times log(\hat{y}_{t,j})$$ 整个语料库的平均交叉熵损失 $$Perplexity=2^J$$ 困惑度优缺点处理任意长度序列模型不会因为序列长度变长而变大使用了之前时间步的信息计算慢，无法 ...

学习

未读

计算机组成原理学习笔记(4)

Created2025-04-222025-05-02 计算机组成原理

中央处理器cpu的功能cpu由运算器和控制器组成。具体功能包括指令控制。完成取指令（也称取指）、分析指令和执行指令的操作，即程序的顺序控制。操作控制。产生完成一条指令所需的操作信号，把各种操作信号送到相应的部件，从而控制这些部件按指令的要求正确执行。时间控制。严格控制各种操作信号的出现时间、持续时间及出现的时间顺序。数据加工。对数据进行算术和逻辑运算。中断处理。对运行过程中出现的异常情况和中断请求进行处理。指令周期的数据流取指周期的数据流向如下： $1)PC\textcircled{1}MAR\textcircled{2}地址总线\textcircled{3}$存储器。2)CU发出读命令$\textcircled{4}$控制总线$\textcircled{5}$存储器。3)主存$\textcircled{6}$数据总线$\textcircled{7}$MDR$\underline{\textcircled{8}}$IR(存放指令)。4)CU发出控制信号,PC 内容加 1。间址周期的数据流向如下：1)Ad(IR)(或 MDR)$\textcircled{1}$MAR ...

学习

未读

计算机组成原理学习笔记(3)

Created2025-04-202025-05-02 计算机组成原理

指令系统ISA所有指令的集合构成该机器的指令系统，又称指令集。是ISA（指令集体系结构最核心的部分） ISA规定的内容包括指令格式，指令寻址方式，操作类型，每种操作对应的操作数的规定操作数类型，操作数寻址方式，大端法or小端法程序可访问的寄存器的编号，个数和位数，存储空间的大小和编址方式指令执行过程的控制方式等，包括程序计数器、条件码定义指令格式总体分为操作码+地址码的形式具体可分为零地址指令：仅有操作码op，没有显式地址。如：空操作，停机，中断一地址指令：op+A1 如：+1 -1 求反求补二地址指令：op + A1 +A2 指令含义：（A1）op （A2）存到 A1 三地址指令：与二地址不同的是存到A3 四地址指令：与三地址不同的是 A4是下一条指令的地址拓展操作码一种典型方法简单理解为前面都是1代表操作码还未停止读取到第一次 1111 代表后面为操作数例题三道在 CPU 执行指令的过程中，指令的地址由 ( ) 给出。 A. 程序计数器 (PC)B. 指令的地址码字段C. 操作系统D. 程序员设机器字长为 32 位，一个容量为 16M ...