首页 > 游戏资讯 > 游戏新闻

如何建立局部大模型？傻瓜部署指南就在这里：跟我来

发布时间：2024-10-01浏览：20

AI大模型在科技圈开始流行。

用户不断增长的需求推动了AI技术的演进。随着大型语言模型的应用场景日益增多，它们开始在我们的生活中发挥越来越重要的作用。

尤其是在休闲、娱乐和实际工作中，大语言模型的应用越来越普遍。这些模型凭借其自然的语义能力、强大的数据处理能力以及复杂任务的执行效率，为用户提供了前所未有的便利，甚至是人们过去无法想象的数字陪伴感。

然而，随着大语言模型的快速普及，云大模型的局限性逐渐显现。

连接慢、成本高、数据隐私问题是任何人都无法轻易忽视的热门话题。最重要的是，基于各种制度和伦理的云审查制度进一步限制了大语言模型的自由。

本地部署似乎给我们带来了一条新的道路。

随着本土大型模型的呼声越来越高，今年Github 和Huggingface 上涌现了很多相关项目。经过大量研究，我按照示例得到了一种在本地部署大型模型的简单方法。

那么，本地部署是锦上添花还是对我们的人工智能体验的史诗般的增强？

跟随小雷的脚步，我们一起来玩吧。

本地大模型到底是个啥？

在开始之前，我们先来谈谈。

尽管如此，有些读者可能仍然不理解“本地大模型”的含义，不知道它意味着什么。

总而言之，总而言之。

现阶段流行的大模型应用，如国外的ChatGPT、Midjourney等，以及国内的文心一言、科大讯飞、KIWI等，基本上都是依靠云服务器来实现各种服务的AI应用。

（图片来源：温心一言）

他们可以实时更新数据并与搜索引擎集成。他们不需要占用自己的计算机资源。他们把所有的计算过程和负载都放在远程服务器上，他们只需要享受结果即可。

换句话说，有网络，就真的牛逼了。

但一旦互联网断开，这些依赖于云的AI服务就只能在键盘上输入“GG”。

相比之下，本地大模型自然侧重于在设备本地实现AI智能。

除了不用担心服务器崩溃带来的问题外，也更有利于保护用户隐私。

毕竟，如果大型模型运行在自己的计算机上，那么训练数据将直接存储在计算机中。肯定会比上传到云端然后让服务器计算更加安全，而且也省去了各种伦理道德的云端审计。

然而，目前在自己的计算机上构建本地大型模型并不容易。

设备要求高是原因之一。毕竟本地大模型需要把整个计算过程和负载都放在自己的电脑上，不仅会占用你电脑的性能，还会使其长时间在中高负载下运行。

第二.

从Github/Huggingface上琳琅满目的项目来看，要实现这个目标，基本上需要有编程经验。最起码，你需要安装很多运行时库，并在控制台执行一些命令行和配置。

别笑，这对于庞大的网友基数来说确实很不容易。

那么有没有一种本地应用程序更加“一键式”，只要设置好运行就可以开始对话呢？

确实有，Koboldcpp。

工具用得好，小白也能搞定本地大模型

简单介绍一下，Koboldcpp是一个基于GGML/GGUF模型的推理框架。与llama.cpp底层相同。它使用纯C/C++代码，无需任何额外的依赖库。甚至可以直接通过CPU运行进行推理。

（图片来源：PygmalionAI Wiki）

当然，这会运行得很慢。

要使用Koboldcpp，您需要去Github下载您需要的应用程序版本。

当然，我也会发布相应的拨号链接，方便大家使用。

目前Koboldcpp 共有三个版本。

koboldcpp_cuda12：目前最理想的版本，只要你有GTX 750以上显卡就可以使用，而且模型推理速度最快。

koboldcpp_rocm：适合AMD显卡的版本。基于AMD ROCm开放软件栈，同规格下推理时间约为N卡版本的3~5倍。

koboldcpp_nocuda：仅使用CPU进行推理的版本。功能非常精简。即使相同规格，推理时间依然是N卡版本的10倍以上。

（来源：Github）

打开软件后，首先可以关注Presets选项。

在软件首页的预设中，有多种不同的模式可供选择，例如旧版N卡、新版N卡、A卡、Intel显卡等。

默认情况下，不设置任何参数启动只会使用CPU的OpenBLAS进行快速处理和推理，运行速度肯定会很慢。

作为N卡用户，我选择CuBLAS。此功能仅适用于Nvidia GPU。我可以看到我的笔记本电脑显卡已被识别。

（来源：雷科技）

对于没有Intel显卡的用户，可以使用CLblast，这是OPENCL推出的一个可以在生产环境中使用的开源计算库。它最大的特点就是强调多功能性。至于性能，我还没有做过详细的测试。

主页上另一个需要调整的部分是Context Size。

为了获得更好的上下文体验，最好将其调整为4096。当然，Size越大，可以记住的上下文越多，但推理速度也会受到明显影响。

（来源：雷科技）

再往下，就是加载大模型的部分。

目前大型开源模型主要是从huggingface.co下载。如果你没有能力出国，也可以从国内的HF-Mirror镜像站或者modelscope社区下载。

根据我个人的经验，推荐两款不错的本土大机型：

因果LM-7B

这是基于LLaMA2和Qwen的模型权重训练的局部大模型。它最大的特点就是原生支持中文。显卡显存小于8G的用户建议下载CausalLM-7B，显卡显存小于8G的用户可以下载CausalLM-14B。效果更好。

（来源：modelscope）

MythoMax-L2-13B

母语是英语的大模特。其特点是文学性较强，能根据要求写出流畅、可读的小说文本。缺点是只能通过输入英文才能获得理想的输出内容。推荐给普通消费者。使用MythoMax-L2-13B。

如果你只是想使用一个大的语言模型，那么不需要对其他部分进行调整。只需单击“开始”，您选择的模型就会在本地加载。

一般来说，你必须将前端部署到大模型上才能使用。

不过Koboldcpp最大的特点是在llama.cpp的基础上增加了多功能的Kobold API端口。

该端口不仅提供额外的格式支持、稳定的扩散图像生成、良好的向后兼容性，而且还具有持久的故事、编辑工具、保存格式、内存、世界信息、作者注释、角色、场景定制定义功能的简化前端——Kobold Lite 。

大致来说，界面是这样的。

（来源：雷科技）

功能也非常简单。

（来源：雷科技）

像这样，加载你拥有的AI对话场景。

“保存/加载”也很清楚。您可以保存当前对话并加载并随时继续。

在“设置”中，您可以调整一些AI对话选项。

（来源：雷科技）

其中，温度。代表对话的随机性。值越高，生成的对话就越不可控，甚至可能超出角色设定的范围。

重复处罚。它可以抑制对话的重复性，让AI减少重复的讲话。

生成对话的长度上限。上限越长，需要的时间就越长。重点是，在实际体验中，过高的生成上限会导致AI胡言乱语。我个人不建议增加这个值。超过240。

最大Ctx。代币。是可以给大模型反馈的关键词上限。数据越高，上下文关系越紧密，生成速度就会变慢。

完成设置后，您就可以与托德·霍华德进行热烈的交谈了。

（来源：雷科技）

不能再说话了吗？

单击左下角的聊天工具，模型会根据您之前的帖子自动生成回复以推进对话。

（来源：雷科技）

答案错误，或者谈话进展不顺利？

点击右下角的聊天工具，不仅可以重复生成AI问题和答案，甚至可以自己编辑回复，确保对话不会误入歧途。

当然，Kobold Lite 除了对话之外还有更多的可能性。

可以连接AI语音和AI绘图端口，这样在对话过程中，可以自动调用AI语言对生成的文本进行配音，并且可以随时调用AI绘图进行绘图两人现在对话的场景。

除此之外，您甚至可以使用更高端的SillyTarven 前端在对话中嵌入GIF 和HTML 内容。

当然，这些都是以后的事情了。

总结

好的，部署本地大型模型的教程就到此为止。

文中提到的软件和大模型我已经上传到百度网盘了，有兴趣的读者可以自行领取。

从我这六个月的经验来看，目前大型本土机型的特点仍然是“可玩性高”。

只要你的配置足够，你就可以完全连接大语言模型、AI语音、AI绘图和2D数字人，打造你自己的本地数字人。看着屏幕上栩栩如生的AI角色，一定会非常令人着迷。恍惚感如《serial experiments lain》。

但这类开源大模型的数据通常滞后，专业知识明显缺乏。根据实际测算，大部分知识库要到2022年中期才可用，而且无法调用外部网络资源协助。当你工作和审查信息时，你会遇到很大的限制。

在我看来，理想的大语言模型体验应该是端云交互。

也就是说，我可以在本地使用自己的大模型构建自己的知识库，但是当我需要使用时间敏感的信息时，我也可以利用互联网的力量来获取最新的信息。这样不仅可以保护个人数据的隐私，也算有效。解决开源大模型信息滞后的问题。

至于本地角色交流，如果你有兴趣的话……

我整理一下雷霆科技的人物卡怎么样？

2024年5月20日至6月30日，618年中特卖即将来临。淘宝、天猫、京东、拼多多、抖音、快手、小红书六大电商平台集体“听意见”，取消了预购。出售，价格疯狂！

用户评论

封锁感觉

终于找到了！一直想了解一下怎么搭建本地模型，这篇文章太赞了，而且是“傻瓜式”部署，正好适合新手小白！

有15位网友表示赞同！

念旧是个瘾。

本地大模型确实挺酷的，不过一直找不到合适的教程。文章写的详细明了，关键步骤都标注很清楚了，希望能顺利完成部署后尝尝鲜~

有8位网友表示赞同！

有些人,只适合好奇~

这个标题让我以为是讲如何使用已经训练好的模型，结果原来是搭建整个模型！有点超出我的预期需求，我主要是想学习一下怎么用现成的模型做一些实验。

有9位网友表示赞同！

心已麻木i

看了下这篇文章，感觉描述的太简单了吧？实际操作起来肯定复杂得多吧！希望后续文章可以讲解更深入的内容，比如模型选择、训练参数调优等。

有6位网友表示赞同！

入骨相思

哈哈，这个“跟着我做就对啦”说的真逗人，感觉作者有点自信过头了，不过还是期待按照教程试一试！

有18位网友表示赞同！

▼遗忘那段似水年华

'傻瓜式部署指南' 这种说法太夸张了吧？我接触过不少大模型的部署流程，都说不上是简单易用的，这个本地模型估计难度也不小吧？

有18位网友表示赞同！

惯例

搭建本地模型真的需要强大的硬件配置吗？我的电脑配置一般般，能成功部署吗？文章有没有提到这些要求？

有17位网友表示赞同！

♂你那刺眼的温柔

我一直想试试自己开发一个小型本地模型，这篇文章刚好提供了一个方向！但还是希望作者能够详细讲解一下模型的训练过程和评估指标。

有12位网友表示赞同！

你很爱吃凉皮

看完了这篇文章，总感觉像是在看着个PPT一样，缺少一些实践案例和代码示例，很难直接上手操作！

有20位网友表示赞同！

冷风谷离殇

作为一名 AI 开发者，这种 "傻瓜式" 的部署方式其实还是比较有帮助的，可以方便初学者快速理解模型的搭建过程。但对于更深入的技术细节，还需要进一步学习和探索。

有17位网友表示赞同！

白恍

期待看到更多关于本地大模型实战案例，比如如何将它集成到实际应用程序中使用！

有7位网友表示赞同！

面瘫脸

其实搭建本地大模型还有很多需要注意的问题，例如数据预处理、训练过程中的优化策略等等。文章只是简单介绍了部署步骤，缺少对这些关键问题的深入探讨。

有10位网友表示赞同！

青瓷清茶倾城歌

本地部署模型的优势在于可控性高，数据安全也比较好保障。希望未来越来越多的人积极尝试本地大模型，从而推动 AI 技术的更广泛应用。

有10位网友表示赞同！

暖栀

我以前一直在用云平台上的大模型服务，但最近开始考虑搭建本地模型，可能是因为对数据安全更加重视吧！这篇文章刚好给了我一些方向和思路。

有15位网友表示赞同！

咆哮

虽然作者说很 "傻瓜式"，但我还是需要花时间去消化这篇文章内容，了解具体的步骤和工具。期待能够顺利完成部署后感受一下本地大模型的强大功能！

有13位网友表示赞同！

莫失莫忘

搭建本地大模型确实是一个挑战，希望本文能提供给一些学习这个领域的入门者一些指导方向，也希望看到更多作者分享他们的经验和心得。

有12位网友表示赞同！

心安i

对于我来说，最吸引的是“跟着我做就对啦”这种轻松幽默的语言风格，让人更愿意去尝试和了解这篇文章的内容！

有9位网友表示赞同！

暮光薄凉

感謝作者提供这份教程，希望能够帮助更多人入门本地大模型开发。期待看到更多的精彩内容分享！

有5位网友表示赞同！

热点资讯