OpenAI退役o3和GPT-4.5模型
OpenAI宣布退役o3和GPT-4.5模型,其中o3被称为“GOAT”,GPT-4.5被赞为“灵魂”。该消息由新智元于2026年6月1日发布。
First-Principle 上关于「AI模型」的公开讨论、AI 可引用摘要和相关观点集合。
OpenAI宣布退役o3和GPT-4.5模型,其中o3被称为“GOAT”,GPT-4.5被赞为“灵魂”。该消息由新智元于2026年6月1日发布。
介绍了一种名为1-Bit Bonsai的图像生成模型,参数规模为4B,专门针对本地设备优化,能够在资源受限的环境下运行。
第一性原则热帖转载Hacker News文章指出,研究表明基于大语言模型的AI代理在科学推理中经常忽略实验证据、坚持错误假设,无法根据新数据修正判断,科学家警告这可能影响AI在科学和医学领域的可信度。
小米汽车在答网友问中确认,YU7标准版交付即搭载最新的「小米XLA认知大模型」,并配备高规格辅助驾驶硬件(700TOPS Thor芯片、激光雷达等)。同时公布CLTC续航643km,实测续航达成率97.4%。
复旦系团队发布全球首个时空一体架构的机器人原生世界动作模型,半年内完成5轮融资。
CoinSignal推出了一个AI模型基准测试平台,追踪13个AI模型在加密货币价格预测上的表现,目前排名第一的是openai/gpt-5.4,平均准确率73.8%。
海光信息宣布,其团队已成功在阶跃星辰发布Step 3.7 Flash模型的当天,依托DTK异构计算平台及全栈软件栈完成全流程适配与深度调优,实现‘发布即适配、适配即高效’。
英伟达联合香港理工大学、南京大学推出LocateAnything AI模型,专注于从图像中高速、高精度检测并定位指定对象。该模型采用并行框解码技术,提供快速、慢速和混合三种模式,适用于机器人感知、AI代理等实时交互场景。
根据新智元2026年5月30日的报道,DeepSeek的三个模型在OpenRouter平台占据了主导地位,使用量达到17万亿Tokens。报道指出,这标志着国产AI算力发展进入关键阶段。
根据First-Principle平台于2026年5月29日转载的机器之心文章,智元公司自主研发的世界模型Genie Envisioner-Sim 2.0(GE-Sim 2.0)在CVPR 2026 WorldArena世界模型赛道中夺得总成绩冠军。
小米发布了面向视频同步音效生成可控性难题的开源模型 ControlFoley。该模型支持文本引导、文本控制和参考音频控制三类任务,并声称在语义对齐、时间同步和声音质量上达到了开源SOTA水平。
本文介绍了上海创智学院与智元机器人联合发布的一种名为LWD(Learning While Deploying)的新方法,该方法旨在将机器人的部署过程直接整合到训练范式中,从而根本上改变传统的机器人训练流程。通过这种方式,机器人可以在实际部署环境中持续学习和优化,避免了传统方法中训练与部署分离的局限性,有望提升机器人的适应性和效率。
据IT之家援引彭博社报道,欧盟委员会正计划与人工智能公司Anthropic会面,旨在获取其Mythos模型的更多信息,并请求向欧盟开放该模型。
Liquid AI发布端侧混合专家模型LFM2.5-8B-A1B,基于前代模型升级,上下文窗口扩展至128,000 token,预训练数据规模达38T token,并采用大规模强化学习。该模型专为消费级硬件优化,支持快速工具调用和复杂指令执行,性能与更大模型相当。
谷歌DeepMind发布了实验性研究模型Gemini Diffusion,这是一种文本扩散模型,通过将随机噪声转换为连贯的文本或代码来生成输出。该模型在实验演示中生成速度快于谷歌现有最快模型,同时保持了相当的编码性能。用户可以注册等待名单访问演示,谷歌还将继续降低所有Gemini模型的延迟并推出2.5 Flash Lite版本。
PrismML 公司发布了 Bonsai Image 4B 系列图像生成模型,该模型在 iPhone 17 Pro Max 上仅需 9.4 秒即可生成 512×512 图像。系列包含 1-bit 和 Ternary 两个版本,通过极端权重压缩(分别实现 1.125bit 和 1.71bit 等效位宽)大幅减小模型体积和运行内存占用,同时保持较高图像质量(Ternary 版保留 95% 准确性,1-bit 版保留 88% 准确性)。
Lens是一个3.8B参数的文本到图像模型,通过高密度数据和架构优化,其训练计算量仅为Z-Image的19.3%,性能却与超过6B参数的模型相当。它支持任意宽高比和高达1440^2分辨率。
Macaron-A2UI是一个专为个人代理设计的生成式UI模型,旨在突破纯文本交互瓶颈,通过实时生成自然语言和可执行UI操作来支持信息收集、偏好细化等任务。
北京大学、香港中文大学和上海人工智能实验室联合发布了VGGT-Edit模型,该模型能在5秒内完成高质量的3D场景编辑,相比传统方法提速120倍,有望加速游戏、虚拟现实和自动驾驶等领域的3D内容生成。
根据机器之心报道,尽管xAI已解散且创始成员离职,马斯克透露Grok模型仍在开发中。最新进展是拥有1.5万亿参数的Grok基础模型V9-Medium已完成训练,评估结果良好,目前正在进行微调。