微调 - 天枰百科网

6.99元租H800，一键部署Llama3，有羊毛速来薅！

明敏发自凹非寺量子位 | 公众号 QbitAI猛然间，大模型圈掀起一股“降价风潮”。前脚，智谱、DeepSeek等大模型厂商将API价格一降再降，输入100万tokens仅需1元。紧接着，GPU...

推理 Llama 微调

2024-05-13 13:05 17 阅读 #知识百科
仅用250美元，Hugging Face技术主管手把手教你微调Llama 3

机器之心报道编辑：赵阳大语言模型的微调一直是说起来容易做起来难的事儿。近日 Hugging Face 技术主管 Philipp Schmid 发表了一篇博客，详细讲解了如何利用 Hugging Fa...

模型微调使用

2024-05-06 17:43 63 阅读 #知识百科
58行代码把Llama 3扩展到100万上下文，任何微调版都适用

梦晨发自凹非寺量子位 | 公众号 QbitAI堂堂开源之王Llama 3，原版上下文窗口居然只有……8k，让到嘴边的一句“真香”又咽回去了。在32k起步，100k寻常的今天，这是故意要给开源社区...

微调模型上下文

2024-05-06 13:10 97 阅读 #知识百科
LLM上下文窗口突破200万！无需架构变化+复杂微调，轻松扩展8倍

新智元报道编辑：LRS【新智元导读】LongRoPE方法首次将LLM的窗口扩展到了2048k个token，只是简单微调的情况下，就能实现与短上下文窗口相近的性能！大型语言模型（LLM）往往会追求更长...

上下文微调插值

2024-04-29 12:52 34 阅读 #知识百科

1