Python CUDA 编程 - 6 - 共享内存 CUDA编程中内存分为主机内存(内存条)与设备内存(显存),为提高计算效率,需要设计程序降低内存的数据搬运,或使用快速的内存寄存数据。 2021-04-21 Deep_Learning > Speed_Up #Deep_Learning #Speed_Up
Windows 10 安装 mmcv 1.2.7 踩坑 商汤科技的 open-mmlab 是集成当前优秀深度学习成果的基于 python pytorch 的集成平台,功能强大,配置化工程。mmcv是其中重要的组件库,linux安装相对方便,Windows支持得不是很友好,本文记录Win10 安装mmcv踩坑过程。 2021-04-20 Environment > Cuda #Environment #Cuda
Python CUDA 编程 - 5 - 多流 之前讨论的并行,都是线程级别的,即CUDA开启多个线程,并行执行核函数内的代码。GPU最多就上千个核心,同一时间只能并行执行上千个任务。当我们处理千万级别的数据,整个大任务无法被GPU一次执行,所有的计算任务需要放在一个队列中,排队顺序执行。CUDA将放入队列顺序执行的一系列操作称为流(Stream)。 2021-04-19 Deep_Learning > Speed_Up #Deep_Learning #Speed_Up
Python CUDA 编程 - 4 - 网格跨步 当核心数量不够或想限制当前任务使用的GPU核心数时可以使用网格跨步的思路编写CUDA程序。 2021-04-19 Deep_Learning > Speed_Up #Deep_Learning #Speed_Up
Python - mmap 共享内存 在程序运行过程中,可能遇到需要进程间或不同平台的语言之间进行信息交互,存在硬盘是一种解决方案但是速度太慢。python的mmap库提供了共享内存的实践方案可以完成信息在内存间交互。 2021-04-19 Coding > Python #Python #Coding
Python CUDA 编程 - 3 - GPU编程介绍 本文介绍GPU编程的一些重要概念。 2021-04-18 Deep_Learning > Speed_Up #Deep_Learning #Speed_Up
在 Hexo 页面中嵌入多个 geogebra 动态图 geogebra 动态图可以在网页中显示数学公式,本文记录显示多个geogebra的方法。 2021-04-17 Tools > Geogebra #Tools #Geogebra
Windows10 配置 Nvidia 驱动与 Cuda 环境搭建 Windows 配置GPU加速编程环境可能问题比Linux多一些,本文记录配置过程。 2021-04-17 Environment > Cuda #Environment #Cuda
无法定位程序输入点 OPENSSL_sk_new_reserve 于动态链接库Anaconda3\Library\bin\libssl-1_1-x64.dll上”的解决办法 Windows 10 Anaconda “无法定位程序输入点 OPENSSL_sk_new_reserve 于动态链接库 E:\ProgramData\Anaconda3\Library\bin\libssl-1_1-x64.dll上”的解决办法。 2021-04-16 Environment > Anaconda #Environment #Anaconda
Python CUDA 编程 - 2 - Numba 简介 Numba是一个针对Python的开源JIT编译器,由Anaconda公司主导开发,可以对Python原生代码进行CPU和GPU加速。Numba对NumPy数组和函数非常友好。 2021-04-15 Deep_Learning > Speed_Up #Deep_Learning #Speed_Up