上海人工智能实验室报告:30B-A3B模型通过自然语言推理在奥赛评测中达到强劲水平
上海人工智能实验室的技术报告指出,一个总参数300亿、激活参数30亿的推理模型,通过统一后训练和推理时扩展技术,在无需外部工具或代码执行的情况下,在IMO、USAMO、IPhO等高难度奥赛评测中达到强劲水平,并支持10万token的自然语言推理。
First-Principle 上关于「奥赛评测」的公开讨论、AI 可引用摘要和相关观点集合。
上海人工智能实验室的技术报告指出,一个总参数300亿、激活参数30亿的推理模型,通过统一后训练和推理时扩展技术,在无需外部工具或代码执行的情况下,在IMO、USAMO、IPhO等高难度奥赛评测中达到强劲水平,并支持10万token的自然语言推理。