Python CUDA 编程 - 5 - 多流 之前讨论的并行,都是线程级别的,即CUDA开启多个线程,并行执行核函数内的代码。GPU最多就上千个核心,同一时间只能并行执行上千个任务。当我们处理千万级别的数据,整个大任务无法被GPU一次执行,所有的计算任务需要放在一个队列中,排队顺序执行。CUDA将放入队列顺序执行的一系列操作称为流(Stream)。 2021-04-19 Deep_Learning > Speed_Up #Deep_Learning #Speed_Up
Python CUDA 编程 - 4 - 网格跨步 当核心数量不够或想限制当前任务使用的GPU核心数时可以使用网格跨步的思路编写CUDA程序。 2021-04-19 Deep_Learning > Speed_Up #Deep_Learning #Speed_Up
Python - mmap 共享内存 在程序运行过程中,可能遇到需要进程间或不同平台的语言之间进行信息交互,存在硬盘是一种解决方案但是速度太慢。python的mmap库提供了共享内存的实践方案可以完成信息在内存间交互。 2021-04-19 Coding > Python #Python #Coding
Python CUDA 编程 - 3 - GPU编程介绍 本文介绍GPU编程的一些重要概念。 2021-04-18 Deep_Learning > Speed_Up #Deep_Learning #Speed_Up
在 Hexo 页面中嵌入多个 geogebra 动态图 geogebra 动态图可以在网页中显示数学公式,本文记录显示多个geogebra的方法。 2021-04-17 Tools > Geogebra #Tools #Geogebra
Windows10 配置 Nvidia 驱动与 Cuda 环境搭建 Windows 配置GPU加速编程环境可能问题比Linux多一些,本文记录配置过程。 2021-04-17 Environment > Cuda #Environment #Cuda
无法定位程序输入点 OPENSSL_sk_new_reserve 于动态链接库Anaconda3\Library\bin\libssl-1_1-x64.dll上”的解决办法 Windows 10 Anaconda “无法定位程序输入点 OPENSSL_sk_new_reserve 于动态链接库 E:\ProgramData\Anaconda3\Library\bin\libssl-1_1-x64.dll上”的解决办法。 2021-04-16 Environment > Anaconda #Environment #Anaconda
Python CUDA 编程 - 2 - Numba 简介 Numba是一个针对Python的开源JIT编译器,由Anaconda公司主导开发,可以对Python原生代码进行CPU和GPU加速。Numba对NumPy数组和函数非常友好。 2021-04-15 Deep_Learning > Speed_Up #Deep_Learning #Speed_Up
使用 pip 离线复制 python 运行环境 python 运行时会有不同环境需求,在其他机器部署时需要重新配置python环境,当需要离线部署时可以使用pip的离线复制环境的功能。 2021-04-15 Environment > Pip #Environment #Pip
降维算法 - SNE SNE是一种数据降维算法,最早出现在2002年,它改变了MDS和ISOMAP中基于距离不变的思想,将高维映射到低维的同时,尽量保证相互之间的分布概率不变,SNE将高维和低维中的样本分布都看作高斯分布,而Tsne将低维中的坐标当做T分布,这样做的好处是为了让距离大的簇之间距离拉大,从而解决了拥挤问题。 2021-04-15 Machine_Learning #Machine_Learning