a16z“门徒”Kuzco实操指南:如何高效地进行AI算力挖矿?
前言
笔者今天分享的是一个专门服务 LLM 大语言模型算力挖矿网络,今年入选,被该计划选中的项目会在 8 周内获得 a16z 至少 50 万美元的投资,并会得到 a16z 运营团队的指导和支持。目前来说离该计划结束大约剩 2 周时间。
Kuzco 项目还处于非常早期的阶段,与 io.net 同属于 GPU 算力网络领域,但走的是不同的发展方向。而 io.net 因为有强大的资金支持和背景,已经比 Kuzco 更早完成了对用户的空投,并成功上线了BIAN、Coinbase、Bybit 等主流加密货币交易所,获得了更大的市场曝光。
笔者更是亲身参与了 io.net 的挖矿,老实说,整个过程就像是让显卡「躺着赚钱」,只需要把显卡空挂着,它就自动给你生成收益,连电费都不怎么花。每台矿机每天耗电才 1.2 度,三个月总共才 10.8 美元电费。再加上二手显卡的折旧费和上网工具的零头,100 到 200 美元的成本轻轻松松搞定。最终获得 4000 美元收益,怎么看都觉得,这项目就像是左脚踩右脚螺旋上升的「空中楼阁」。
而后续代币价格的下跌验证了这一点。此外,笔者还编译了一篇文章,标题是,这篇文章也进一步反映了 AI 算力市场中的泡沫。无论是租赁市场的价格还是项目代币的下跌,都是市场在修正这些项目的真实价值,这种价格回调是符合市场规律的,说明未来可能会朝着更加理性的方向发展。
Kuzco 在挖矿机制上与之前的热门项目 io.net 有显著不同。io.net 是「空中楼阁」,依靠显卡空挂就能轻松获得数十倍的收益,背后支撑的实际价值并不明显。而 Kuzco 则更为脚踏实地,且得到了 a16z 的支持。我花了几周时间,认真测试了不同配置的矿机,包括单卡、多卡以及不同系统的搭建。通过这些实际操作,我将为大家分享这些实操经验,让大家了解一个为用户提供实际价值的挖矿项目,而不是仅靠泡沫支撑的虚假繁荣。
专门服务 LLM 大语言模型算力挖矿网络
Kuzco 是一个 Solana 生态的去中心化 GPU 网络,旨在利用个人用户的闲置 GPU 资源,为大型语言模型(如 Llama3、Mistral、Phi3)提供高效且廉价的算力服务。用户可以通过与 OpenAI 兼容的 API 来使用这些模型。Kuzco 的分布式架构能够整合闲置的算力资源,实现大型语言模型的运行,同时通过奖励机制激励提供算力的矿工。
项目运营情况
截至 10 月 21 日,Kuzco 项目有 2000 台在线 GPU 矿机,最高时曾达到 6000 台。最常用的 GPU 型号包括 3090、3060 等。矿工目前获得的是 KZO Point 奖励,但这些积分还不能变现,同时项目也还没有公布代币经济模型。笔者推测,随着 a16z 加速器计划的推进,该项目未来可能会有更多新的进展和更新发布。
如何部署
官方硬件要求
Kuzco 项目可以在 Mac、Windows 和 Linux 操作系统上运行,支持多种不同的硬件配置。系统最低要求是 16GB 的运行内存、30GB 的可用磁盘空间和至少 10MB/s 的网络带宽。Kuzco 支持至少有 8GB 显存的 NVIDIA(N 卡)和 AMD(A 卡)显卡,普通用户的 N 卡最低要求是 GTX750,而专业的算力显卡大部分都支持。
不过,笔者不推荐使用 A 卡进行算力挖矿,因为 AMD 显卡的兼容性较差,尤其是在 AI 任务中的表现不如 N 卡。如果你一定要用 A 卡,需要查看官方的。在 AI 领域,笔者必须说一句:AMD,NO!
笔者的五卡平台,主板华子Z490
笔者测试了几款硬件的挖矿效率,但因为网络波动,效率表现可能会有波动。
GTX1070:20 tok/s
RTX2060:30 tok/s
RTX2070S:40 tok/s
RTX3080: 80 tok/s
RTX4060Ti:50 tok/s
RTX4070S:70 tok/s
M2:20 tok/s
M3:30 tok/s
单位:Avager Tokens / Second (平均每秒完成的 Tokens 计算量)
实时监测矿机运行情况
部署方式
Kuzco 提供了客户端应用,用户可以下载并使用它来启动挖矿,但这种方式有时不稳定,可能会掉线,并且不会自动重启。笔者建议更稳定的做法是使用 Linux 系统或 Windows 的 WSL(Windows Subsystem for Linux)环境,通过命令行(CLI)或 Docker 容器来启动挖矿。如果需要使用多张显卡,可以在 Linux 中通过 Docker 容器指定某个 GPU 来进行多卡挖矿。例如要指定 GPU0:「docker run --rm --runtime=nvidia --gpus '"device=0"' -d kuzcoxyz/worker:latest --worker <workerid> --code <code>」,即可启动多个 GPU
多卡挖矿时需要请注意以下硬件设备硬件层面:
电源:电源是关键,不能省钱。建议按照「1 人民币 =1 瓦」的标准来购买,并尽量使用金牌电源。挖矿时根据显卡的数量选择 1500W 到 2000W 的电源,或者使用多个电源,但多个电源需要额外的启动线连接主板才能正常供电。否则无法正常启动。
功耗信息
线材:在高功耗的环境下,电源线容易损坏,所以笔者建议使用质量更好的电源线。另外,不同品牌的模块电源使用的线材接口是不一样的,不能通用。如果使用了不同品牌的线材,可能会导致设备损坏或烧毁。因此,线材必须与电源的品牌保持一致,确保兼容性。
电源线老化损坏
主板:主板的每个通道(不论 x1、x8、x16)只能支持一张显卡。比如有几个通道就能支持几张显卡。以太坊挖矿时期流行的 B85 主板是不错的选择。
笔者参与以太坊挖矿时留下的B85平台,已报废
CPU:因为需要同时处理多个任务,CPU 的线程越多越好。在使用 Docker 启动挖矿时,初期会占用大量的 CPU 资源。如果使用多张显卡,必须按顺序逐一启动,否则系统可能会崩溃或卡死。
年轻人就要上i9,没有必要为了面子上e5
显卡:一个 Docker 进程大约占用 6 GB 显存(官方文档写 8 GB,实际上 6 GB 即可运行),如果显卡有 12GB 显存,你可以在一张显卡上运行两个 Docker 进程。挖矿时,显卡的工作负载会占用 50% 到 90%,并且显卡的温度应保持在 85 度以内,才是合理和安全的。
PCIE 转接线:建议使用 x1 转 x16 的 PCIE 转接线,x1 插主板,x16 插显卡。如果使用 40 系列显卡,需要使用 x16 的延长线。
网络连接质量:网络连接质量会对挖矿效率产生很大影响。笔者测试发现,使用新加坡的网络节点接收到的算力任务比香港节点更多,也就是说,选择更好的网络节点可以提高挖矿效率。
挖矿过程中如果出现故障情况,首先要检查主板和软件的运行状况。如果问题出现在软件层面,可以通过查看终端错误信息来判断,可能是内存错误,需要重启电脑;或者是因为官方文件更新,本地矿机未及时更新代码导致,解决方法是更换节点或更新代码。
运行错误
在硬件层面,如果矿机无法开机,首先检查主板上的故障灯。以华硕主板为例,最常遇到的是 VGA 亮白灯,其表示显卡电源有问题,遇到这种情况可以尝试重新插拔 PCIE 和显卡电源线。不过,有时白灯可能会亮起但机器依然正常运行。
总结
虽然笔者把 io.net 称作「空中楼阁」,意指它的市值被严重高估,但它确实凭借 10 亿美元的估值成功融资了 4000 万美元。然而,io.net 上线后,出现了很多仿盘,这些仿盘的产品和背后的资方都无法经受严格考证,说明 io.net 的成功并不是每个项目都能轻易复制的。
基于这个观察,笔者一直在寻找一个更有实际价值的挖矿项目。最终,笔者发现了 Kuzco。Kuzco 首先得到了 a16z 的孵化和支持,这增加了其的可信度和潜力。其次,Kuzco 的挖矿机制实实在在通过 GPU 提供算力服务。
更重要的是,从宏观角度来看,Kuzco 所在的领域,大型语言模型(LLM)是当前大众使用最广泛的 AI 产品,全球每天都有无数人在使用这些模型,而这些模型需要巨大的算力支持。笔者认为,为这样庞大的需求提供算力,不仅非常有意义,而且具有实际的商业价值,因此,Kuzco 是一个值得关注的项目。
再就是参与 GPU 算力网络的成本较低,特别是 40 系列显卡在二手市场的价格稳定,折旧成本低,因此值得购买。不过,笔者提醒不要选择租用显卡,因为租卡的费用比买二手显卡要高很多。同时,Kuzco 的空投激励不明确,如果贸然大规模租卡会存在较高的风险。
并且矿机本身有很高的实用价值,不仅仅能用来挖 Kuzco ,还比直接投资高风险 ALTCoin 更稳定可靠。由于矿机有很好的扩展性,除了挖 Kuzco 以外,还可以用来挖其他 GPU 项目,或者用它成为区块链的节点验证者,运行一些脚本和服务来增加更多的收益。这意味着即使不再挖 Kuzco,矿机依然可以继续产生价值。
最后很多人问挖矿一天能获得多少收益,这个问题没有明确的答案,除了项目方,没人能准确知道最终的收益是多少。挖矿的回报有很大的不确定性,可能会有很高的收益,也可能低于预期,所以无法提前确定具体能赚多少钱。