这意味着,用户不错在腹地老成的 Jupyter Notebook 或 IDE 里,用最模范的 Python 语法像搭积木雷同摆脱组合,掌控考试逻辑的细节。
这种模式带来了颠覆性的"东谈主力遵循比"耕作:它将蓝本需要运维工程师、Infra 工程师、平台工程师和算法工程师清雅合作的浩瀚团队,简化为了"一个算法工程师"的独处闭环。
用户不再被底层庞杂的基建累赘,不再包袱多职能的镣铐,也不再是黑盒填参的被迫延长者,而是概况独处独霸大范畴考试流的主动绸缪师。
这也意味着,不管是监督微调(SFT)照旧更复杂的强化学习(RL)Pipeline,齐能通过组合这些原子函数来纯真构建。
那么问题来了,为什么体验能作念到如斯丝滑?
为了达成极致的通顺度,潞晨云基于现存的 GPU 云工作架构达成了一套无缺的后端系统。
在具体达成中,潞晨云采⽤终端⾯与议论⾯分袂绸缪,通过统⼀ API Server 治理跨地域的多个 GPU 议论集群,达成多云部署能⼒。
核⼼采⽤基于 Future 模式的异步 API,统共考试操作⽀抓⾮窒碍调⽤,⽤⼾⽆需恭候 GPU 议论完成即可络续执⾏后续逻辑。
潞晨云微调 SDK 还具备智能队伍系统,即使在资源洪峰期,任务也会自动插足抓久化队伍(Persistence Queue),一朝底层资源可用,毫秒级启动,队伍恭候时间 0 计费,仅对实质 prefill+sample+train 的 Token 量收费,无资源闲置,将用户每一分钱齐用在产生梯度的刀刃上。
模子微调的算力零卖立异:从"包机租出"到"按 Token 计费"
要是说"易用性"是后考试平台的入场券,那么"资本结构"则是决定谁能走得更远的护城河。
在传统云主机的"包机 / 时租"模式中,用户一直在为"过程"买单——
也即是说,不管是在加载数据、调试代码,照旧只是在想考 Loss 函数,只须占用了显卡,计费表就在朝上。
这种模式下,诞生过程中有一半以上的预算齐奢靡在了这些莫得实质产出的"垃圾时候"里。
潞晨云为微调大模子场景引入了Serverless 架构,延长"按 Token 计费"的买卖模式,将微调场景的算力工作切分到了最细的颗粒度:
为价值付费:就像使用推理 API 雷同,用户只需为 Prefill(输入)、Sample(推理输出)和 Train(考试)产生的有用议论 Tokens 量付费。
其他身手全免费:腹地代码调试、环境设置、数据预处理、模子 Checkpoint 保存……这些在传统租卡模式下只争朝夕的身手,在潞晨云全部免费。
极致性价比:频繁,RL 需要同期小气高模糊的推理集群(vLLM)和考试集群,算力资本极高。但在潞晨云上,实测基于官方 Cookbook 的 math_rl recipe 跑通包含 Rollout 采样、Reward 评分和 PPO 更新的无缺 RL 进程(~300 steps),总算力资本仅 8.61 元。这意味着,个体诞生者也能低资本复现 RLHF/RLAIF 探索。
时期落地的三个场景:SFT 与 RL 同期"开箱即用"
这种新模式,也将透顶更正不同范围诞生者的使命流:
1、科研场景:告别资源蹙悚
学术界,时候与算力时时是最紧缺的资源。
扣问东谈主员不仅要靠近繁琐的集群运维(Slurm/Docker 设置),还要应答腾贵的实验复现资本。
潞晨云微调 SDK 因循"白盒级"的科研探索,全面兼容 Tinker API。
扣问东谈主员不错自界说 Evaluation 逻辑、通过 Forward/Backward,Sample 等原语精确终端后考试和强化学习 Pipeline,而无需热心底层的溜达式达成,让实验复现资本大幅裁减。
2、创业与独处诞生:极速考据 MVP
关于初创团队,"快"是生活根柢。
诈欺潞晨云微调 SDK 的 Serverless 特质,诞生者无需恭候资源排期。合作极低的 Token 资本,实测从 pip install 到跑通一个包含 1000 条样本的 SFT 或 RL 微调实验,仅需数分钟。
这种极致的角落资本,让创业者勇于在有限预算下快速迭代 Reward 模子,达成竟然的"低资本试错"。
3、工业级落地:复杂架构解围
而在金融、医疗等垂直范围的工业应用中,已有微调 API 时时难以应酬金杂的异构架构与 RLHF/RLAIF 需求。
潞晨云微调 SDK 允许工程师通过 train_step 摆脱界说 Loss 逻辑与强化学习奖励函数。诞生者领有对模子权重与考试细节的无缺终端权,达成端到端定制。
极简实战:三步上手
莫得复杂的集群设置,莫得冗长的 Docker 构建。
使用潞晨云微调 SDK,考试一个大模子就像写深广 Python 剧本雷同简便:
1、Install & Import:
Bash pip install hpcai
2、Initialize Client: 现时已因循 Qwen3 系列 ( 4B - 32B ) ,更多模子行将上线
Python import hpcai # 首先化 LoRA 考试客户端,无需设置复杂的溜达式参数 training_client = service_client.create_lora_training_client ( base_model= " Qwen/Qwen3-4B " , rank=32 )
3、Define Training Loop & Run:像在腹地写 PyTorch 雷同,领有对考试轮回的无缺终端权:
Python # 考试轮回:统统可控 for step in range ( target_steps ) : # 前向与反向传播 fwd_bwd = training_client.forward_backward ( batch, " cross_entropy " ) # 优化器步进 optim = training_client.optim_step ( adam_params ) # 及时获得 Loss 进行监控 loss = fwd_bwd.result ( ) .metrics.get ( "loss:mean" )
⽬前,微调 SDK 已隐秘 Qwen3 系列模子(4B、8B、14B、32B),因循监督学习和强化学习考试形状,并将抓续扩展更多模子能⼒与细分落地场景,⼤家也不错向官⽅提交需求 push 更新。
平台还准备了开箱即用的 HPC-AI Cookbook,提供包括DeepSeek-R1 GRPO 算法、基于 Verifier 的数学推理、自界说 Reward 函数等复杂 RL 场景的无缺代码达成。
诞生者无需从零构建复杂的 PPO/GRPO 活水线,只需复制 Cookbook 中的"配方",运行轻量级腹地 train.py 剧本,即可驱动云霄复杂的溜达式 RL 考试流,在潞晨云上复现具备复杂逻辑推明智商的 SOTA 模子。
从"能训"到"可抓续训"
后考试正从学术支线升级为工程干线,AI 基础圭表的终极形态应该是"零理会负荷"——
诞生者只需姿色数据与算法,其余(租卡、配环境、并行计谋、运维转机、故障自愈,乃至 RL 波及的一系列工程化的使命)全部属千里到用户无感。
当 GPU 闲置资本趋近于 0,环境设置时候趋近于 0,长序列 RLHF 也能按 Token 即时计费,应用创新后果平直靠近算力上限。
潞晨云微调 SDK 本日起全量通达:
无需白名单,无需预约
前 150 名专属辩论注册即得 30 元使用额度(见置顶评述)
立即体验:
https://cloud.luchentech.com/fine-tuning
使用文档:
https://cloud.luchentech.com/doc/docs/finetune-sdk/
Reference
[ 1 ] Tinker SDK: https://github.com/thinking-machines-lab/tinker
[ 2 ] DeepSeek-R1: https://arxiv.org/pdf/2501.12948
* 本文系量子位获授权刊载,不雅点仅为原作家统共。
一键三连「点赞」「转发」「预防心」
接待在评述区留住你的观点!
— 完 —
� � 点亮星标 � �
科技前沿阐扬逐日见镇江企业会议直播系统






