Ai 模型并行运行实践方案 - 又见苍岚

Ai 模型并行运行实践方案

Yiwei Zhang 2021年8月3日上午

282 字 3 分钟

本文最后更新于：2024年5月7日下午

本文记录并行Ai的一种实践路线。

背景

当遇到一个任务需要多个Ai模型分别完成时，串行执行Ai可能不是最好的方法，总无法发挥GPU的最大利用率
现有平台少有并行推断的相关信息
尝试搭建一个服务式的并行Ai执行框架

思路流程

构建网络服务，在网络服务中初始化模型
留出infer接口作为服务器备用
客户端多线程向服务器提供请求，实现Ai并行执行

技术方案

python平台
使用flask搭建微服务框架
将训练好的模型在服务器中初始化，留出infer接口，注册在路由中
服务端建好服务后 while True 在那呆着
客户端将测试数据作为 post 请求向指定ip 端口路由发送请求
服务器收到数据进行Ai推断得到结果
pytorch并行在Linux下可以多进程，但Win下会报内存或重复加载的错误
使用多线程向服务器提供请求的方式实现并行

文章链接：
https://www.zywvvd.com/notes/study/deep-learning/ai-parallel/ai-parallel/

“觉得不错的话，给点打赏吧 ୧(๑•̀⌄•́๑)૭”

微信二维码

微信支付

支付宝二维码

支付宝支付

Deep_Learning

#Deep_Learning

Ai 模型并行运行实践方案

https://www.zywvvd.com/notes/study/deep-learning/ai-parallel/ai-parallel/

作者

Yiwei Zhang

发布于

2021年8月3日

许可协议

Fluid -1- 主题安装上一篇

Win11 修改右键菜单回到 Win10 的方法下一篇

破坏小飞机