找回密码
 会员注册
查看: 33|回复: 0

vllm+llama3.1部署!

[复制链接]

2万

主题

0

回帖

6万

积分

超级版主

积分
68591
发表于 2024-9-10 12:22:12 | 显示全部楼层 |阅读模式
与我之前写的部署qwen2一样步骤:vllm+qwen2部署!_vllm部署qwen2-CSDN博客须注意的是:启动llama3.1_8b_instruct 需要将transfomers更新到最新4.43.2版本!pipinstall--upgradetransformers参考:最新LLMLlama3.1をAWQで4bit量子化してGPUサーバーに乗せてチャットできるようにした#Python-QiitaCUDA_VISIBLE_DEVICES=0,1python-mvllm.entrypoints.openai.api_server--model/你自己的路径/modles/llama3.1_8b_instruct --served-model-namellama3.1_8b_instruct--max-model-len=2048--dtype=half--tensor-parallel-size=2成功启动!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 会员注册

本版积分规则

QQ|手机版|心飞设计-版权所有:微度网络信息技术服务中心 ( 鲁ICP备17032091号-12 )|网站地图

GMT+8, 2025-1-5 09:34 , Processed in 0.517029 second(s), 25 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表