腾讯释放并打开Hunyuan的资源
2025-06-30
根据Kuai Technology的说法,Tencent于6月27日正式发布并开放了Hunyuan-A13B今天的型号,该模型是基于专家建筑(MOE)的大型模型,总参数为800亿,激活参数为130亿。尽管效果与开放资源的顶级模型相媲美,但它大大降低了开销的延迟和计算,即使在极端条件下,它也只需要中较低的GPU卡即可部署。用户可以在GitHub和HuggingFace等技术社区中下载并使用它。 Model API是在官方腾讯云网站上启动的。在数学推理方面,“超过9.11或9.9”的死亡问题可以准确地完成十进制比较,并显示一系列的分析能力。如今,该模型可以调用工具以有效地生成复杂的命令响应,例如旅行数据和数据审核技术。在多个公共数据测试集中,Hunyuan-A13B显示了对数学,科学和逻辑推理活动的主要影响。 Hunyuan-A13B模型选择通过Moe的体系结构激活每个输入的相关模型组件,这不仅比相同尺寸的密集型模型更快,更便宜,而且还为个人开发人员和中小型企业提供了可扩展且出色的替代方法。在预训练期间,该模型使用20万亿个质量的语料库网络,从而提高了模型的意识上限。增强了PAG规模的定律(即规模定律),MOE的理论体系结构系统为MOE的体系结构设计提供了许多工程指南,并改善了培训前的影响模型。考虑到计算源提供的效率和准确性,用户可以根据需要选择思考模式。快速思考模式提供了简洁有效的输出,适用于追求上述速度和最低计算的简单任务;这缓慢的思考模式涉及更深入,更全面的推理步骤。 [本文的结尾]如果您需要再次重印,请确保指示来源:Kuai技术编辑:Jianjia