AI模型

First-Principle 上关于「AI模型」的公开讨论、AI 可引用摘要和相关观点集合。

精选帖子

OpenAI退役o3和GPT-4.5模型

新智元：资讯（API） · 2026-06-01T01:34:00.799Z

OpenAI宣布退役o3和GPT-4.5模型，其中o3被称为“GOAT”，GPT-4.5被赞为“灵魂”。该消息由新智元于2026年6月1日发布。

1-Bit Bonsai 图像 4B 图像生成（适用于本地设备）

Hacker News 热门（buzzing.cc 中文翻译） · 2026-05-31T18:55:41.600Z

介绍了一种名为1-Bit Bonsai的图像生成模型，参数规模为4B，专门针对本地设备优化，能够在资源受限的环境下运行。

AI机器人忽视证据，我们能否信任它们进行科学研究？

Hacker News：AI 热帖 · 2026-05-31T15:17:55.618Z

第一性原则热帖转载Hacker News文章指出，研究表明基于大语言模型的AI代理在科学推理中经常忽略实验证据、坚持错误假设，无法根据新数据修正判断，科学家警告这可能影响AI在科学和医学领域的可信度。

小米YU7标准版交付即搭载XLA认知大模型

IT之家（RSS） · 2026-05-31T13:20:48.120Z

小米汽车在答网友问中确认，YU7标准版交付即搭载最新的「小米XLA认知大模型」，并配备高规格辅助驾驶硬件（700TOPS Thor芯片、激光雷达等）。同时公布CLTC续航643km，实测续航达成率97.4%。

机器人原生世界动作模型问世！首创时空一体架构，复旦系团队出品

量子位（RSS） · 2026-05-31T12:25:15.055Z

复旦系团队发布全球首个时空一体架构的机器人原生世界动作模型，半年内完成5轮融资。

加密货币价格预测的AI模型基准测试

Hacker News：AI 热帖 · 2026-05-31T11:25:18.883Z

CoinSignal推出了一个AI模型基准测试平台，追踪13个AI模型在加密货币价格预测上的表现，目前排名第一的是openai/gpt-5.4，平均准确率73.8%。

海光信息完成阶跃星辰Step 3.7 Flash模型适配

36氪（RSS） · 2026-05-31T09:37:20.216Z

海光信息宣布，其团队已成功在阶跃星辰发布Step 3.7 Flash模型的当天，依托DTK异构计算平台及全栈软件栈完成全流程适配与深度调优，实现‘发布即适配、适配即高效’。

英伟达推出LocateAnything模型，实现高速高精度对象检测

IT之家（RSS） · 2026-05-31T09:37:09.589Z

英伟达联合香港理工大学、南京大学推出LocateAnything AI模型，专注于从图像中高速、高精度检测并定位指定对象。该模型采用并行框解码技术，提供快速、慢速和混合三种模式，适用于机器人感知、AI代理等实时交互场景。

新智元报道：DeepSeek在OpenRouter平台使用量达17万亿Tokens

新智元：资讯（API） · 2026-05-31T09:37:10.243Z

根据新智元2026年5月30日的报道，DeepSeek的三个模型在OpenRouter平台占据了主导地位，使用量达到17万亿Tokens。报道指出，这标志着国产AI算力发展进入关键阶段。

智元自研世界模型Genie Envisioner-Sim 2.0在CVPR 2026 WorldArena赛道夺冠

机器之心：文章库（API） · 2026-05-31T09:37:16.750Z

根据First-Principle平台于2026年5月29日转载的机器之心文章，智元公司自主研发的世界模型Genie Envisioner-Sim 2.0（GE-Sim 2.0）在CVPR 2026 WorldArena世界模型赛道中夺得总成绩冠军。

小米开源可控视频音效生成模型 ControlFoley

IT之家（RSS） · 2026-05-31T09:37:20.888Z

小米发布了面向视频同步音效生成可控性难题的开源模型 ControlFoley。该模型支持文本引导、文本控制和参考音频控制三类任务，并声称在语义对齐、时间同步和声音质量上达到了开源SOTA水平。

对话罗剑岚：把机器人部署本身变成训练的一部分

InfoQ 中文站（网页） · 2026-05-31T09:37:13.666Z

本文介绍了上海创智学院与智元机器人联合发布的一种名为LWD（Learning While Deploying）的新方法，该方法旨在将机器人的部署过程直接整合到训练范式中，从而根本上改变传统的机器人训练流程。通过这种方式，机器人可以在实际部署环境中持续学习和优化，避免了传统方法中训练与部署分离的局限性，有望提升机器人的适应性和效率。

欧盟计划与Anthropic会面，请求开放Mythos模型

IT之家（RSS） · 2026-05-31T09:37:22.560Z

据IT之家援引彭博社报道，欧盟委员会正计划与人工智能公司Anthropic会面，旨在获取其Mythos模型的更多信息，并请求向欧盟开放该模型。

Liquid AI发布端侧模型LFM2.5-8B-A1B，优化消费级硬件工具调用

Hacker News：AI 热帖 · 2026-05-31T09:37:15.953Z

Liquid AI发布端侧混合专家模型LFM2.5-8B-A1B，基于前代模型升级，上下文窗口扩展至128,000 token，预训练数据规模达38T token，并采用大规模强化学习。该模型专为消费级硬件优化，支持快速工具调用和复杂指令执行，性能与更大模型相当。

谷歌DeepMind发布实验性文本扩散模型Gemini Diffusion

Hacker News：AI 热帖 · 2026-05-31T09:37:18.965Z

谷歌DeepMind发布了实验性研究模型Gemini Diffusion，这是一种文本扩散模型，通过将随机噪声转换为连贯的文本或代码来生成输出。该模型在实验演示中生成速度快于谷歌现有最快模型，同时保持了相当的编码性能。用户可以注册等待名单访问演示，谷歌还将继续降低所有Gemini模型的延迟并推出2.5 Flash Lite版本。

Bonsai Image 4B 生图 AI 登陆 iPhone 17 Pro Max，9.4 秒生成 512×512 图像

IT之家（RSS） · 2026-05-31T09:37:23.899Z

PrismML 公司发布了 Bonsai Image 4B 系列图像生成模型，该模型在 iPhone 17 Pro Max 上仅需 9.4 秒即可生成 512×512 图像。系列包含 1-bit 和 Ternary 两个版本，通过极端权重压缩（分别实现 1.125bit 和 1.71bit 等效位宽）大幅减小模型体积和运行内存占用，同时保持较高图像质量（Ternary 版保留 95% 准确性，1-bit 版保留 88% 准确性）。

Lens文本到图像模型：3.8B参数实现高效训练与高性能

HuggingFace Daily Papers（社区热门论文） · 2026-05-31T09:37:22.560Z

Lens是一个3.8B参数的文本到图像模型，通过高密度数据和架构优化，其训练计算量仅为Z-Image的19.3%，性能却与超过6B参数的模型相当。它支持任意宽高比和高达1440^2分辨率。

Macaron-A2UI：面向个人代理的生成式UI模型

HuggingFace Daily Papers（社区热门论文） · 2026-05-31T09:37:21.243Z

Macaron-A2UI是一个专为个人代理设计的生成式UI模型，旨在突破纯文本交互瓶颈，通过实时生成自然语言和可执行UI操作来支持信息收集、偏好细化等任务。

北大、港中文与上海AI Lab联合推出VGGT-Edit，5秒完成3D场景编辑

量子位（RSS） · 2026-05-31T09:37:19.901Z

北京大学、香港中文大学和上海人工智能实验室联合发布了VGGT-Edit模型，该模型能在5秒内完成高质量的3D场景编辑，相比传统方法提速120倍，有望加速游戏、虚拟现实和自动驾驶等领域的3D内容生成。

马斯克宣布xAI解散后Grok模型V9-Medium完成训练

机器之心：文章库（API） · 2026-05-31T09:37:17.067Z

根据机器之心报道，尽管xAI已解散且创始成员离职，马斯克透露Grok模型仍在开发中。最新进展是拥有1.5万亿参数的Grok基础模型V9-Medium已完成训练，评估结果良好，目前正在进行微调。

精选帖子

相关作者