本文分类:news发布日期:2025/2/4 15:52:01
相关文章
DeepSpeed Zero 解读
目录 主要参考: 分布式训练基础 – 数据并行,模型并行,流水线并行 DeepSpeed Zero 的各个stage 介绍 针对Zero 的各个stage,这里有三个点需要额外再说一下:
各个stage,要实现将某一部分参数分隔到不同GPU,…
建站知识
2025/2/4 15:44:59
deep generative model stanford lecture note3 --- latent variable
1 Introduction
自回归模型随着gpt的出现取得很大的成功,还是有很多工程上的问题并不是很适合使用自回归模型: 1)自回归需要的算力太大,满足不了实时性要求:例如在自动驾驶的轨迹预测任务中,如果要用纯自回…
建站知识
2025/2/4 15:23:44
XCCL、NCCL、HCCL通信库
XCCL提供的基本能力 XCCL提供的基本能力 不同的XCCL 针对不同的网络拓扑,实现的是不同的优化算法的(不同CCL库最大的区别就是这) 不同CCL库还会根据自己的硬件、系统,在底层上面对一些相对应的改动; 但是对上的API接口…
建站知识
2025/2/4 15:22:41
深度学习 Pytorch 基础网络手动搭建与快速实现
为了方便后续练习的展开,我们尝试自己创建一个数据生成器,用于自主生成一些符合某些条件、具备某些特性的数据集。
导入相关的包
# 随机模块
import random# 绘图模块
import matplotlib as mpl
import matplotlib.pyplot as plt# 导入numpy
import nu…
建站知识
2025/2/4 15:15:34
使用VCS对Verilog/System Verilog进行单步调试的步骤
Verilog单步调试:
System Verilog进行单步调试的步骤如下:
1. 编译设计 使用-debug_all或-debug_pp选项编译设计,生成调试信息。 我的4个文件: 1.led.v
module led(input clk,input rst_n,output reg led
);reg [7:0] cnt;alwa…
建站知识
2025/2/4 15:09:48
Java集合+并发(部分)
参考JavaGuide及其他开源资料,自用留存无商业目的
Java集合
Java集合类的继承结构和各自的适用情况
Collection
— List
— ArrayList:动态数组
— LinkedList:底层是双向链表,应用于Queue接口可以用于实现队列&am…
建站知识
2025/2/4 15:08:40
Electron使用WebAssembly实现CRC-8 MAXIM校验
Electron使用WebAssembly实现CRC-8 MAXIM校验
将C/C语言代码,经由WebAssembly编译为库函数,可以在JS语言环境进行调用。这里介绍在Electron工具环境使用WebAssembly调用CRC-8 MAXIM格式校验的方式。
CRC-8 MAXIM校验函数WebAssembly源文件
C语言实现C…
建站知识
2025/2/4 14:52:11
互联网行业常用12个数据分析指标和八大模型
本文目录 前言 一、互联网线上业务数据分析的12个指标 1. 用户数据(4个) (1) 存量(DAU/MAU) (2) 新增用户 (3) 健康程度(留存率) (4) 渠道来源 2. 用户行为数据(4个) (1) 次数/频率…
建站知识
2025/2/4 14:33:24