
科大讯飞近日宣布,深度推理大模型——讯飞星火X1迎来全新升级,在数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务上效果显著提升,在模型参数比业界同类模型小一个数量级的情况下,整体效果对标OpenAI o1和DeepSeek R1,这表明,基于国产算力训练的全栈自主可控大模型具备登顶业界最高水平的实力和持续创新的潜力。
例如,在数学答题和复杂的数理逻辑推理方面,星火X1能够准确识别出复杂的数学公式,不仅给出完整的解题思路,输出结果也严谨清晰;在逻辑推理时全方位思考,思考可能出现的每一种假设,表现出更强的严谨性和准确性。代码能力上,星火X1不仅提高了代码生成的准确率,对生成代码逻辑理解也进一步提升,能够应对更复杂的编程需求,思考问题的多种可能性,帮助开发者快速实现功能。在语言理解方面,模型输出内容、格式更加符合用户指令要求,能够给到更加准确且深度思考的结果,生成内容更加连贯、准确。
此外,星火X1的长思维链能力支持图像输入,可以对输入的图像进行关联思考,对于图像中的多种复杂元素,探究可能的含义和目的,进行更深层次的信息整合和推理。
本次星火X1升级不仅提升了通用能力,也同步增强了面向行业的解决方案能力,助力产业智能化转型。由于融入了更多场景复杂类型数据,模型的泛化性也取得了进步,多个行业任务上展现出了业界领先的能力。在重点行业,如教育、医疗、司法等进一步扩大了领先优势。以司法行业为例,对于行业专业需求,例如根据材料总结案件事实以及判决理由,升级后的星火X1能够精准把握用户指令,详细分析争议点,快速定位关键信息,并输出准确内容,为行业用户提供专业、可靠的智能支持。
在技术创新和模型部署方面,星火X1首发“快思考、慢思考统一模型”,由一个模型同时支持两种思考模式,提升了模型处理不同复杂度任务的能力,满血版星火X1仅需4张卡(华为910B)即可部署,简化了私有化部署流程。
同时,星火X1还全新升级了模型定制优化工具链,支持SFT(监督微调)、强化学习两种模型定制优化方案,只需16张卡(华为910B)即可完成行业定制优化,降低了企业AI的定制门槛。
南方+记者 郜小平
【作者】 郜小平
【来源】 南方报业传媒集团南方+客户端