PANews 10月11日消息,全链数据网络 Chainbase 近日宣布在 HuggingFace 开源其专为加密领域打造的大语言模型 Theia-Llama-3.1-8B 。该模型在困惑度(Perplexity)和 BERT 评分上均超越了市场主流模型,对crypto世界的理解能力超过大多主流开源大模型。
Chainbase 团队独创性地构建了首个专业 Web3 数据集,收录了 CoinMarketCap 前 2000 项目的各类资料。数据集经过手动和算法过滤,确保训练数据的准确性、多样性和专业性。基于此数据集,团队采用 LoRA 技术高效微调模型,并利用 DeepSpeed 等工具加速训练过程。此外,模型量化为 Q8 GGUF 格式,大幅降低了内存占用,提升了推理速度。
据悉,Theia-Llama-3.1-8B 是 Chainbase 在加密领域大模型的初步尝试且该模型已成功应用于 Chainbase DEMO 交互应用 TheiaChat,目前日活用户超过 30 万。
内容来源:PANews
财华网所刊载内容之知识产权为财华网及相关权利人专属所有或持有。未经许可,禁止进行转载、摘编、复制及建立镜像等任何使用。
如有意愿转载,请发邮件至content@finet.com.hk,获得书面确认及授权后,方可转载。
更多精彩内容,请登陆
财华香港网(https://www.finet.hk/)
财华智库网(https://www.finet.com.cn)
现代电视(http://www.fintv.hk)