维其互联 > 信息聚合 > 卡内基梅隆大学推出 AI 模型“乐高 GPT”,敲敲键盘就能生成可搭建积木

卡内基梅隆大学推出 AI 模型“乐高 GPT”,敲敲键盘就能生成可搭建积木

2025-05-09 22:07:13来源: IT之家

IT之家 5 月 9 日消息,据外媒 Tom's Hardware 今日报道,卡内基梅隆大学的研究团队开发出一款名为 LegoGPT 的 AI 模型,能够根据文字指令生成可实际搭建的乐高设计。IT之家附项目地址:LegoGPT: Generating Physically Stable and Buildable LEGO Designs from TextGitHub:https://github.com/AvaLovelace1/LegoGPT/根据介绍,团队训练了一种自回归大型语言模型,通过预测下一个 token 的方式,判断下一块该放置什么积木。团队还为模型增加了有效性校验和带有物理感知的回滚机制,确保生成的设计不会出现积木重叠或悬空等问题,也就是说最终结果始终可行且结构稳固。不仅如此,LegoGPT 输出的设计,既能由人手搭建,也支持机器人操作。用于训练 LegoGPT 的数据集被命名为 StableText2Lego,构建流程也相当复杂:系统会先将文本提示转化为 ShapeNetCore 网格模型,再将其嵌入一个 20×20×20 的体素网格中,从而生成初步的乐高积木布局。在保持整体造型不变的前提下,系统对这些布局做出变化,随后剔除掉结构不稳定的设计。保留下来的样本会从 24 个不同角度进行渲染,最终交由 GPT-4o 生成相应的描述文本。该数据集包含超过 47000 个乐高建构样本,涵盖了 28000 多种三维造型,包括书架、桌子、椅子、汽车、船

关注公众号
标签: AI