跳转至

04 硬件语言筑基(二): 代码是怎么生成具体电路的?

你好,我是LMOS。

上节课,我们学习了硬件描述语言Verilog的基础知识。今天我会带你一起用Verilog设计一个简单的电路模块。通过这节课,你不但能复习巩固上节课学到的硬件语言知识,还能在动手实践中体会代码是怎么生成具体电路的。

Verilog代码编写

如果你学过计算机组成原理的课程或图书,应该对ALU并不陌生。算术逻辑单元(Arithmetic&logical Unit,ALU)是CPU的执行单元,是所有中央处理器的核心组成部分。

利用Verilog,我们可以设计一个包含加、减、与、或、非等功能的简单ALU模块,代码如下:

module alu(a, b, cin, sel, y);
  input [7:0] a, b;
  input cin;
  input [3:0] sel;
  output [7:0] y;

  reg [7:0] y;
  reg [7:0] arithval;
  reg [7:0] logicval;

  // 算术执行单元
  always @(a or b or cin or sel) begin
    case (sel[2:0])
      3'b000  : arithval = a;
      3'b001  : arithval = a + 1;
      3'b010  : arithval = a - 1;
      3'b011  : arithval = b;
      3'b100  : arithval = b + 1;
      3'b101  : arithval = b - 1;
      3'b110  : arithval = a + b;
      default : arithval = a + b + cin;
    endcase
  end

  // 逻辑处理单元
  always @(a or b or sel) begin
    case (sel[2:0])
      3'b000  : logicval =  ~a;
      3'b001  : logicval =  ~b;
      3'b010  : logicval = a & b;
      3'b011  : logicval = a | b;
      3'b100  : logicval =  ~((a & b));
      3'b101  : logicval =  ~((a | b));
      3'b110  : logicval = a ^ b;
      default : logicval =  ~(a ^ b);
    endcase
  end

  // 输出选择单元
  always @(arithval or logicval or sel) begin
    case (sel[3])
      1'b0    : y = arithval;
      default : y = logicval;
    endcase
  end

endmodule

通过上面的代码,我们实现了一个8位二进制的简单运算模块。其中,a和b是输入的两个8位二进制数,cin是a和b做加法运算时输入的进位值,4bit位宽的sel[3:0] 则是CPU中通常所说的指令操作码。

在这个ALU模块中,逻辑功能代码我们把它分成三个部分,分别是运算单元、逻辑处理单元和输出选择单元。运算单元是根据输入指令的低三位sel[2:0],来选择执行加减等运算。同理,逻辑处理单元执行与或非门等操作。最后,根据指令的最高位sel[3],来选择Y输出的是加减运算单元结果,还是逻辑处理的结果。

你还记得上节课的例子么?当时我们一起研究了一个4位10进制的计算器,里面用到了时钟设计。也就是说,这个计算器是通过时序逻辑实现的,所以always块中的赋值语言使用了非阻塞赋值“<=”。

always@(posedge clk or negedge reset_n) begin
  if(!reset_n) begin                        //复位时,计时归0
      cnt_r        <= 4'b0000 ;
    end

而今天我们实现的ALU模块,用到的是组合逻辑,所以always块中使用阻塞赋值“=”。

怎么区分阻塞赋值和非阻塞赋值呢?阻塞赋值对应的电路结构往往与触发沿没有关系,只与输入电平的变化有关;而非阻塞赋值对应的电路结构往往与触发沿有关系,只有在触发沿时,才有可能发生赋值的情况。

另外,在前面8位二进制的代码里,算术执行单元和逻辑处理单元的两个always块是并行执行的。所以它们的运算结果几乎是同时出来,这里值得你好好理解一下。如果你没有发现两个块并行,可以暂停下来回顾一下。

如何通过仿真验证代码

就像我们开发软件,需要代码编译器和模拟器一样,Verilog这种硬件语言的代码,也需要运行验证。那怎么来运行验证呢?现在很多企业采用的是VCS—verilog仿真器或者是NC-verilog仿真器,这些工具都需要花重金去购买才能使用,普通人用起来成本太高了。

除了重金购买这些EDA工具之外,我们还有更节约成本、也更容易学习入门的选择。我给你推荐两个轻量级开源软件,分别是Iverilog和GTKWave。Iverilog是一个对Verilog进行编译和仿真的工具,而GTKWave是一个查看仿真数据波形的工具。

Iverilog运行于终端模式下,安装完成之后,我们就能通过Iverilog对verilog执行编译,再对生成的文件通过vvp命令执行仿真,配合GTKWave即可显示和查看图形化的波形。

在Linux系统下安装Iverilog和GTKWave非常简单。以Ubuntu为例,我们通过apt-get就可以直接安装。

安装Iverilog:sudo apt-get install iverilog
安装GTKWave:sudo apt-get install gtkwave

安装完成之后,我们需要使用which命令查看安装路径,确认是否安装成功。

which iverilog 
which vvp 
which gtkwave

有了软件和Verilog代码。在运行仿真前,我们还需要设计一个重要的文件,即仿真激励文件,也就是TestBench。在仿真时,要把TestBench放在所设计模块的顶层,以便对模块进行系统性的例化调用。

我们把TestBench放在设计模块的顶层,以便对模块进行系统性的例化,调用所设计的各个模块并对其进行仿真。

针对上面的ALU模块,设计了一个给ALU产生运算指令和数据的TestBench,并且把ALU的运算结果打印出来,TestBench的代码如下:

`timescale 1 ns / 1 ns

module alu_tb;
  reg[7:0] a, b;
  reg cin;
  reg[3:0] sel;
  wire[7:0] y;
  integer idx;

  //对alu模块进行例化,类似于软件程序中的函数调用
  alu u_alu(.a(a), .b(b), .cin(cin), .sel(sel), .y(y));

  initial 
  begin
    //给 a 和 b 赋初值
    a = 8'h93;
    b = 8'hA7;
    for (idx = 0;  idx <= 15;  idx = idx + 1) 
    begin
      // 循环产生运算指令 sel 的值
      sel = idx;
      // 当指令 sel = 7 时是加法操作,设定进位值cin=1
      if (idx == 7)
        cin = 1'b1;
      else
        cin = 1'b0;
      //每产生一个指令延时10ns
      #10
      // 延时之后打印出运算结果
      $display("%t: a=%h, b=%h, cin=%b, sel=%h, y=%h", $time, a, b, cin, sel, y);
    end 
  end
  
initial
begin
  $dumpfile("wave.vcd");        //生成波形文件vcd的名称
  $dumpvars(0, alu_tb);          //tb模块名称
end

endmodule

这里我要说明一下,TestBench是不可以综合成具体电路的,只用于仿真验证,但和上一节课介绍的可综合的Verilog代码语法类似。

设计工作告一段落。我们终于可以打开终端开始跑仿真了。你需要在Verilog代码所在的文件目录下执行以下指令:

iverilog -o wave -y ./  alu_tb.v  alu.v 
vvp -n wave -lxt2

可以看到,运行结果输出如下:

LXT2 info: dumpfile wave.vcd opened for output.
                  10: a=93, b=a7, cin=0, sel=0, y=93 //指令0:y = a;
                  20: a=93, b=a7, cin=0, sel=1, y=94 //指令1:y = a + 1;
                  30: a=93, b=a7, cin=0, sel=2, y=92 //指令2:y = a - 1;
                  40: a=93, b=a7, cin=0, sel=3, y=a7 //指令3:y = b;
                  50: a=93, b=a7, cin=0, sel=4, y=a8 //指令4:y = b + 1;
                  60: a=93, b=a7, cin=0, sel=5, y=a6 //指令5:y = b - 1;
                  70: a=93, b=a7, cin=0, sel=6, y=3a //指令6:y = a + b;
                  80: a=93, b=a7, cin=1, sel=7, y=3b //指令7:y = a + b + cin;
                  90: a=93, b=a7, cin=0, sel=8, y=6c //指令8:y = ~a;
                 100: a=93, b=a7, cin=0, sel=9, y=58 //指令9:y = ~b;
                 110: a=93, b=a7, cin=0, sel=a, y=83 //指令10:y = a & b;
                 120: a=93, b=a7, cin=0, sel=b, y=b7 //指令11:y = a | b;
                 130: a=93, b=a7, cin=0, sel=c, y=7c //指令12:y = ~(a & b);
                 140: a=93, b=a7, cin=0, sel=d, y=48 //指令13:y = ~(a | b);
                 150: a=93, b=a7, cin=0, sel=e, y=34 //指令14:y = a ^ b;
                 160: a=93, b=a7, cin=0, sel=f, y=cb //指令15:y = ~(a ^ b);

有了运行结果,我们就可以打开GTKWave查看仿真波形了,这里需要在终端执行如下指令:

gtkwave wave.vcd

从打开的波形可以到,ALU模块输出的信号Y,这是根据输入指令sel和输入的数据a、b和cin的值,经过加减运算或者逻辑运算得到的。

代码是如何生成具体电路的?

经过上面的仿真,从打印的结果上已经看到了我们设计的模块功能。而通过查看仿真波形,我们同样也能知道各个信号的跳变关系。

但是,你可能还有个疑惑,不是说设计的Verilog语句,基本都会对应一份电路吗?怎样才能看到Verilog对应了哪些电路呢?

别急,这就是我马上要讲的逻辑综合。通过逻辑综合,我们就能完成从Verilog代码到门级电路的转换。而逻辑综合的结果,就是把设计的Verilog代码,翻译成门级网表Netlist。

逻辑综合需要基于特定的综合库,不同的库中,门电路基本标准单元(Standard Cell)的面积、时序参数是不一样的。所以,选用的综合库不一样,综合出来的电路在时序、面积上也不同。因此,哪怕采用同样的设计,选用台湾的台积电(TSMC)工艺和上海的中芯国际(SMIC)的工艺,最后生产出来的芯片性能也是有差异的。

通常,工业界使用的逻辑综合工具有Synopsys的Design Compiler(DC),Cadence的 RTL Compiler,Synplicity的Synplify等。然而,这些EDA工具都被国外垄断了,且需要收取高昂的授权费用。

为了降低学习门槛和费用,这里我们选择Yosys,它是一个轻量级开源综合工具。虽然功能上还达不到工业级的EDA工具,但是对于我们这门课的学习已经完全够用了。


如上图所示,利用Yosys软件,可以帮助我们把RTL代码层次的设计转换为逻辑门级的电路。

好,我先大致带你了解下,这个软件怎么安装和使用。在Ubuntu中安装Yosys非常简单,在终端中依次执行以下命令即可:

sudo add-apt-repository ppa:saltmakrell/ppa
sudo apt-get update
sudo apt-get install yosys

完成了安装,我们就能使用Yosys,对上面设计的ALU模块做简单的综合了。

直接在终端输入“yosys”,启动Yosys软件。启动成功后,我们通过后面这五条指令,就能得到到ALU的逻辑电路图文件了。

第一步,在Yosys中读取Verilog文件。

read_verilog alu.v

第二步,使用后面的命令,检查模块例化结构。

hierarchy -check

接着是第三步,执行下一条命令,来完成高层次的逻辑综合。

proc; opt; opt; fsm; memory; opt

到了第四步,我们就可以用write_verilog生成网表文件。

write_verilog alu_synth.v

最后,我们再用下方的命令,输出综合后的逻辑图。

show -format dot -prefix ./alu

这一套动作完成后,我们终于迎来了收获成果的时刻。打开生成的alu.dot文件,我们就可以看到ALU模块的门级电路图了,如下所示:

可以看到,这张图是由基本的and、or、not、add、sub、cmp、mux等电路单元组成。如果你还想进一步了解它们底层电路结构,可以自行查阅大学里学过的《数电》《模电》。

当然,Yosys功能还不只这些,这里我只是做个简易的演示。更多其它功能,如果你感兴趣的话可以到官网上学习。

到这里,类似于CPU里面的核心单元ALU电路,我们就设计完成了。

总结回顾

今天我们一起了解了怎么把Verilog代码变为具体的电路。为了实现代码编写、验证和仿真的“一站式”体验。我还向你推荐了几个开源软件。我们来回顾一下这节课的重点。

首先,我们用Verilog编写了一个类似CPU内部的ALU模块,该模块实现了加、减、与、或、非等基本运算功能。

针对上面的ALU模块,我们还设计了一个用于产生运算指令和数据的TestBench,并且把ALU的运算结果打印出来。利用这个TestBench,可以验证ALU模块的功能是否正确。

接下来,我们还用到了两个轻量级开源软件,分别是Iverilog和GTKWave。Iverilog是一个对Verilog进行编译和仿真的工具,GTKWave可以查看仿真数据波形的工具。利用这两个软件,我们完成了ALU模块的仿真和验证。

此外,我还推荐了一款轻量级开源综合工具Yosys。通过这个工具,我们把上面设计的ALU模块综合出了具体的门级电路。

感谢你耐心看到这里,我还给你准备了一张知识导图,总结今天所学的内容。

图片

扩展阅读

仅仅一两节课的内容,就想要把所有Verilog的相关知识学完是不可能的。因此,在课程之外,需要你去多搜索,多阅读,多动手编写Verilg代码,才能更好地掌握Verilog的相关知识,这里我精心为你整理了一些参考资料,供你按需取用:

1.首先是硬件描述语言Verilog HDL的语言标准文件《IEEE Standard Verilog Hardware Description Language (1364-2001)》。
2.如果你对底层的基本电路还不熟悉,不妨复习一下大学所学的教材。这里我推荐由童诗白和华成英编写的《模拟电子技术基础》第四版,以及阎石编写的《数字电子技术基础》。
3.你要是想全面学习数字集成电路的设计、仿真验证、逻辑综合等相关知识,可以看看电子工业出版社出版的《Verilog HDL高级数字设计》。
4.最后,你要是真的想学芯片设计,从更深层次去理解数字电路设计,推荐阅读这本Mohit Arora撰写、李海东等人翻译的图书——《硬件架构的艺术——数字电路的设计方法与技术》。

思考题

既然用Verilog很容易就可以设计出芯片的数字电路,为什么我们国家还没有完全自主可控的高端CPU呢?

期待你在留言区记录自己的学习收获或者疑问。如果这节课对你有帮助,也推荐你分享给更多朋友,我们一起来手写迷你CPU。

精选留言(15)
  • 揭晓林 👍(2) 💬(1)

    老师和同学们好,我也写了下如何运行本次课程里的代码(类似实验手册):在Gitee上,欢迎各位PR https://gitee.com/peterjxl/geek-time-computer-foundation-peterjxl 也感谢Bryan同学的开源

    2022-10-18

  • 听水的湖 👍(10) 💬(2)

    我是这门课的编辑小新,又见面啦。 感觉没接触过硬件语言的小伙伴对第三、四节课有畏难情绪,并且急于知道这两节课对后续学习的影响。这里统一说明一下: 👀两节课不太可能让你完全掌握verilog,如果之前没接触过硬件语言,一遍看下来有疑惑非常正常(大学学了verilog现在重看,卡壳也不奇怪)。 😑之所以咱们花两节课打这个基础,目的还是为实现riscv的处理器做铺垫,不然后面模块实现部分,代码大致思路都get不到就尴尬了。 👧所以建议根据自己情况量力而行,有能力就跟着课程写一写,至少risc-v指令集比x86简单嘛。 👉verilog我们主要是用在第三节课到第十一节课的处理器实现部分(手写miniCPU模块),不会verilog并不影响后面模块的学习。

    2022-08-08

  • Bryan 👍(17) 💬(2)

    写了下在 Mac 下怎么编译运行整个代码 https://notes.singee.me/#/page/verilog%20%E7%94%9F%E6%88%90%E5%85%B7%E4%BD%93%E7%94%B5%E8%B7%AF

    2022-08-03

  • 青蓝 👍(8) 💬(1)

    华为移动端芯片设计是领先的,但要自主可控还要eda、光刻机等庞大的生态

    2022-08-03

  • 李钟伟 👍(6) 💬(1)

    如何理解“阻塞赋值”和“非阻塞赋值”

    2022-08-03

  • 伊宝峰 👍(6) 💬(1)

    Verilog设计逻辑电路是纯逻辑理论层面的,不需要太复杂的设备,相对容易做,但是做成实体CPU需要逻辑综合布线,需要生产,这两个有极高的难度,是我们目前没有掌握的。

    2022-08-03

  • 青玉白露 👍(4) 💬(1)

    感觉大家很吃力,做了一个关于Verilog的初学者笔记,里面包含在线学习网站https://zhuanlan.zhihu.com/p/550710744

    2022-08-06

  • DustyBun 👍(4) 💬(1)

    感谢 lmos 把自己的知识与经验分享出来,为求知的人开了一盏明亮的灯。

    2022-08-05

  • vampire 👍(4) 💬(1)

    verilog只能设计出微架构,而不能设计出isa,更不能培育出生态

    2022-08-03

  • 熊出没 👍(3) 💬(1)

    有设计,也需要有制造,制造工艺跟不上是一方面,再加上芯片设计的专利保护等,我们没有一完整的生态。

    2022-08-06

  • 南总无敌 👍(2) 💬(1)

    思考题:既然用 Verilog 很容易就可以设计出芯片的数字电路,为什么我们国家还没有完全自主可控的高端 CPU 呢? 答:CPU作为承载电子万物的通用器件,需要的是完整的产业链和良好的生态。 (1)完整的产业链不仅仅包含前端设计,还有EDA设计工具和完整的产业制造,而我国仅仅只有前端设计站在了世界前沿,后面两个关键步骤远远达不到行业前沿水平 (2)另外芯片强是一个方面,而往往决定芯片能否广泛商用关键更多看好不好用。这里就牵扯到良好的生态了,没有相应完整的配套软件和售后技术支持,客户很难放心使用。这就像为啥各种NPU论PPA吊打NVIDIA,但是最后大家还是买了NVIDIA的GPU做模型训练。生态需要时间积累口碑和持续性努力,吾辈需加油

    2022-10-07

  • 骨汤鸡蛋面 👍(2) 💬(1)

    可以看到大概脉络是,cpu ==> 模块 == 硬件描述语言 ==> 基本电路单元 ==> 门电路 。大佬可以讲一下 控制器的实现嘛?

    2022-08-07

  • Geek_6a1eb9 👍(2) 💬(7)

    有一个疑问,Yosys不能在windows平台上安装吗

    2022-08-03

  • 👍(0) 💬(1)

    在CentOS上执行命令:gtkwave wave.vcd,报错:Could not initialize GTK! Is DISPLAY env var/xhost set? 解决方案可参考:https://www.freesion.com/article/4575335248/

    2022-10-08

  • VMNode 👍(0) 💬(1)

    真不错

    2022-09-02