同一用例 A 机 pass、B 机 fail？——SystemVerilog 随机稳定性 / 可复现性全攻略（含代码与排查清单）

你该到什么水平？（对标 20k / 25k / 30k）

20k（入门会用）
会 randomize()、$urandom()/$urandom_range()；知道用命令行传种子并打印出来，能按相同 seed 重跑。
25k（合格能排）
理解线程/对象本地 RNG（thread/object-local）；知道实例化顺序会改变随机序列；会用 srandom()、get_randstate()/set_randstate() 做局部锁定；能把失败缩到最小复现场景。
30k（精通可控）
熟悉 UVM seeding 策略与覆盖带来的创建顺序变化；能区分“伪随机问题”与真正根因（race、未初始化、并发调度差异、求解器差异…）；能把不稳定 test 变成稳定回归或可控 fuzz。

1. 基础概念：为什么会“同一 test 不同机结果不同”

SystemVerilog 的随机来源分两类：

函数式随机：$urandom() / $urandom_range()
约束随机：obj.randomize() / std::randomize()（走约束求解器）

二者都依赖初始种子；同时 SystemVerilog 规定 RNG 对线程/对象是局部的。任何会改变“对象/线程创建顺序”的因素（并发、延时、代码插桩、工厂覆盖、条件编译…）都会改变后续的随机流，从而出现：

A 机 pass、B 机 fail
本机同命令偶发 pass/fail（不稳定 test）

关键：给定同一个初始种子，还必须保证相同的对象/线程创建顺序，随机序列才真正可复现。

2. 最常见的 8 类原因（从高到低优先级）

初始种子不同或未记录（最常见）
仿真器/版本/编译或运行选项不同
未初始化/X 传播导致“随机”行为
并发/多核调度使创建顺序不同（影响对象/线程本地 RNG）
插入了调试/日志代码改变执行与创建顺序
UVM 自动 reseed 策略 + 层次名变化（覆盖/重构引入）
不同仿真器的约束求解器/RNG 实现差异
外部副作用（文件、时间、环境变量、壁钟时间做种子等）

3. 必会：统一打印并回放 seed（模板）

3.1 Testbench：读取 `+SEED=`，若未给则生成并打印

// seed_bootstrap.sv（可直接 `include`）
package seed_pkg;int unsigned g_seed;function void seed_setup();if (!$value$plusargs("SEED=%0d", g_seed)) begin// 若仿真器支持，可打印其初始种子；不支持就用 $urandom() 兜底`ifdef HAS_GET_INITIAL_RANDOM_SEEDint unsigned sim_seed = $get_initial_random_seed();$display("[SEED] Simulator initial seed: %0d", sim_seed);`endifg_seed = $urandom(); // 兜底$display("[SEED] No +SEED passed. Using g_seed=%0d (remember this!).", g_seed);end else begin$display("[SEED] Using +SEED=%0d", g_seed);endendfunction
endpackagemodule tb;import seed_pkg::*;initial beginseed_setup();// 可选：把关键线程/对象的 RNG 显式指向 g_seed（局部锁定）// this.srandom(g_seed);// 演示输出repeat (5) $display("[SEED] urandom=%0d", $urandom());$finish;end
endmodule

3.2 常见仿真器传参（统一到一套脚本里）

仿真器	运行时传种子（示例）
Synopsys VCS	`./simv +ntb_random_seed=123456`（也可统一用 `+SEED=...` 自己处理）
Siemens Questa/Modelsim	`vsim -sv_seed 123456`（也可加 `+SEED=` 自己处理）
Cadence Xcelium (xrun/irun)	`xrun -svseed 123456`（版本命名略异，可查本地 `xrun -help`）
Aldec Riviera	常见为 `-sv_seed` 或 `-seed`（视版本）

建议：团队统一一个 plusarg（如 +SEED=），由 testbench 自行处理；同时 CI 强制把 seed 写入日志/报告。

4. 最小可复现示例（3 段代码看懂“顺序改变 → 随机漂移”）

4.1 对象创建顺序改变 → 随机序列变化

class A;rand int x;function void show(string tag); $display("%s x=%0d", tag, x); endfunction
endclassmodule demo_order;A a1, a2;initial beginvoid'(std::randomize()); // 触发一次随机，模拟环境“噪声”a1 = new(); a1.randomize(); a1.show("a1");a2 = new(); a2.randomize(); a2.show("a2");$finish;end
endmodule

把 void'(std::randomize()); 注释/取消注释、或在 a1 与 a2 之间插入任何新对象创建/日志语句，你会发现 a1/a2 的数值对调或变化 —— 这就是创建顺序在影响 RNG。

4.2 线程本地 RNG：两个并发进程的相互影响

module demo_thread_rng;initial forkbegin : T1repeat (3) $display("T1 urnd=%0d", $urandom()); // 线程1endbegin : T2#1; // 轻微相位差repeat (3) $display("T2 urnd=%0d", $urandom()); // 线程2endjoininitial $finish;
endmodule

改变 #1 或插入别的并发块，就能导致两个线程的随机流互相错位。

4.3 `$urandom(seed)` 的“坑”

module demo_urandom_seed_pit;initial begin$display("A=%0d", $urandom());$display("B=%0d", $urandom(123)); // 重新播种，立刻返回一个与 123 绑定的值$display("C=%0d", $urandom());    // 注意：此后随机序列都被影响$finish;end
endmodule

在生产代码中随意 $urandom(seed)，会把当前 RNG 状态改写；不同位置/时机调用会带来不可预期的全局影响。

5. 真·工程排查流程（A 机 pass、B 机 fail）

目标：先变“稳定复现”，再做最小化，最后定位真正根因。

先拿全量信息：编译/运行命令、仿真器版本、OS/CPU、并发核数、回归平台配置。
从失败日志抓 seed：没有就先把本次日志与工单固化，之后统一强制打印。
在 B 机原样重跑：确保同版本/同选项/同 seed。能复现 → 继续；不能复现 → 环境差异。
降并行：如 -j1/单核运行或关闭多核仿真，排除调度造成的顺序变化。
打开更多日志与波形：打印关键对象/事务的创建时间与层次名（get_full_name()），并 dump 关键接口波形。
二分法最小化：减少 sequences/feature，缩到最小 transaction 能复现的用例。
检查 X / 未初始化：打开 x-propagation、初值检查；X 往往是“伪随机”背后真根因。
核对 UVM 覆盖/工厂替换：覆盖改变了类/组件的创建路径，从而改变 UVM 的自动 seeding 与 RNG 顺序。
跨仿真器差异：若只在某工具 fail，考虑求解器差异；用确定性数据（禁用约束随机）验证 DUT 是否真的有问题。
记录根因：把 seed、环境、最小 case、根因类型写入 Wiki/工单，纳入不稳定 test 清单。

6. 可控随机：锁定/隔离技巧

对象/线程局部播种：
在关键线程/对象构造后立刻 srandom(g_seed)，确保它不受全局顺序波动影响。
保存/恢复 RNG 状态：
调试时插入额外 randomize()/日志会改变随机流。用 get_randstate() / set_randstate() 在进入/退出调试段前后保存/恢复。
禁用 $urandom(seed) 滥用：
只在明确定义的初始化阶段调用，且有注释与审阅。
把“复杂约束”做成可降级策略：
提供命令行开关切换“稳定/简化约束模式”，用于回归或跨工具对比。
UVM 环境的顺序稳定：
- 统一在 build_phase 中完成 create；
- 覆盖在目标 create 前完成（通常 test.build_phase() 开头、super.build_phase() 之前）；
- 打印 uvm_factory::get().print() 验证覆盖是否如预期；
- 少量 debug 代码用 ifdef DEBUG 包住，并配合 randstate 保存/恢复。

7. UVM 场景化模板（可直接套用）

7.1 在 test 顶层锁定策略 + 打印 seed

class my_test extends uvm_test;`uvm_component_utils(my_test)function new(string n, uvm_component p); super.new(n,p); endfunctionvirtual function void build_phase(uvm_phase phase);// 1) 读取/打印/固定 seed（见上文 seed_pkg），并在需要的地方 srandom()// 2) 如需工厂覆盖，务必在 create 之前：// base_driver::type_id::set_type_override(enhanced_driver::get_type());super.build_phase(phase);// 3) 创建 envenv = my_env::type_id::create("env", this);endfunctionvirtual function void end_of_elaboration_phase(uvm_phase phase);uvm_factory::get().print(); // 确认覆盖，避免“覆盖太晚”endfunction
endclass

7.2 对象创建/顺序追踪（调试时打开）

`define TRACE_CREATE(obj, tag) \$display("[%0t] CREATE %s : %s", $time, tag, obj.get_full_name());function void my_env::build_phase(uvm_phase phase);super.build_phase(phase);agent0 = my_agent::type_id::create("agent0", this); `TRACE_CREATE(agent0,"agent0")agent1 = my_agent::type_id::create("agent1", this); `TRACE_CREATE(agent1,"agent1")
endfunction

8. CI/回归落地：三件硬性规定

所有回归统一 +SEED= 或工具 seed，并把 seed、仿真命令、工具版本写入报告。
失败自动重跑同 seed；仍失败则收敛最小 case后建工单。
维护“不稳定用例”清单：注明根因（顺序敏感/求解器差异/未初始化），并给出可操作的整改计划（锁定/降级/改约束/修 DUT）。

示例：shell 脚本生成 seed 并保存日志

#!/usr/bin/env bash
set -e
SEED=$(date +%s)   # 也可 /dev/urandom 取整
LOGDIR=logs/$(date +%F_%H%M%S)_seed${SEED}
mkdir -p "$LOGDIR"echo "[RUN] SEED=$SEED" | tee "$LOGDIR/run.txt"
# 你的编译命令……
# 你的运行命令（示例 VCS）：
./simv +SEED=${SEED} +ntb_random_seed=${SEED} | tee "$LOGDIR/sim.log"