标准化 3D 生成质量榜单来了!首创层次化评价体系,告别“谁的 demo 更吸睛”主观评估
作为ai视频之后最被看好的aigc应用领域之一,对比2024年,2025年ai 3d生成的已经进化了:
△图源:网格
随着模型能力的不断发展,在评估层面,新的挑战不断出现:
传统3D生成模型往往停留在对象级的深度质量评估,主要关注点
为了解决这个问题,上海实验室人工智能体系联合复旦大学、清华大学、香港中文大学等高校发布了Hi3DEval——一套面向3D内容生成的全新层次化自动气象。
团队通过设计对象级、部件级与材质主题三层体育协议,实现从整体形态到局部结构再到材质真实性的多粒度分析,全方位揭示模型的生成能力。
在此基础上,首期3D 生成报表已在HuggingFace同步发布,报告30个主流与前沿模型,覆盖文本到3D与图像到3D核心任务。
研究团队表示,该表格可以描绘各模型的总体和表现,希望借此为学术界与产业界提供可追踪、可复现的对标基准,推进3D生成技术向更高质量与更高层次发展。
三层体育协议:从整体到细节,全面解析3D生成质量
Hi3DEval基于三层体育协议的层次更化体育体系,旨在提供细粒度的质量剖析,还能揭示具体的优缺点,为模型改进与优化提供明确方向。
对象级(对象级别)
对象级评估生成对象的宏观表现,本体"几何合理性"、"几何精细度"、"纹理质量"、"几何-纹理一致性"、"Prompt-3D一致性" 五个维度。
“几何合理性”焦点的结构缺陷、保真性,不存在多头、陷陷、浮空等违背物理规律。
“几何精细度”则关注表面精细度,包括边缘锐利、细小部件的密度等。
“纹理质量”接近纹理贴图的增益、细节真度以及美学水平。
“几何-纹理密度”检查与几何纹理结构的平整程度,例如花纹是否遵循直观表面。
“Prompt-3D一致性”则评估生成3D图像资产与输入文本或提示的匹配度,包括类别、属性和身份特征等,确保结果符合用户需求。
部件级(部分级)
现有的大部分3D 得分体系都停留在目标级别评估,只能给出整体质量的总体评分,难以揭示模型在局部结构上的优劣。
Hi3DEval引入部件级维度,将关注点准确标注如椅子腿、扶手、背板等细分位置,能够查找定位缺陷发生的区域。
这种粒度的更细的维度不仅有助于诊断生成过程中的局部几何问题,还能在模型优化时提供有偏置的改进信号。维度包括局部几何的合理性(保证局部结构符合物理与设计逻辑)和局部几何现实度精细(随后细节画的细节与丰富程度)。
材质主题(material-subject)
传统的材质评估仍停留在图片质量和极高的审美,常用的指标如FID、KID、美学评分等。
为了弥补这个的空缺,Hi3DEval设计材质主题的评估协议,聚焦表面天线与物理属性,借助瞄准在不同提示下的反馈信息,从条件细节“复杂性”、“色彩与水度”、“一致性与α影”、“材质合理性”四个维度进行三维评估。
其中前两个聚焦表面天线,“细节与复杂度”关注材质纹理的天线丰富度和美学调整度,”色彩与渗透度"则评估材质颜色的分布α自然以及渗透度是否合理。后两个维度则聚焦物理属性,"一致性与α"检查材质纹理是否在不同的灯光或视线下的一致性,避免接缝、错位、异常阴影等视觉阴影,"材质合理性"评估反射率、粗糙度等物理特性是否符合实际材料表现。
首期报表:分析模型实力,推动行业对标
Hi3DEval 在 HuggingFace 平台发布了首期 3D 生成列表,专题 30 余款 Text-to-3D 与 Image-to-3D
排行榜在统一的足球设置下对所有模型进行评测,包括相同的输入提示、渲染角度、天线条件及输出格式。这种标准化流程不仅消除了实验环境差异带来的偏差,还确定了排行榜的评分结果其公正性和可参考性。
表格结果不仅体现了总排名,还提供了各个维度的单项得分,帮助阿富汗、开发者快速定位模型优势与短板。同时,也为学术界与工业界提供了可追踪的指标参考,推动3D生成技术向高质量、透明化发展。
完整列表可点击文末链接查看。
自动化报表:混合3D表征,增强3D 增益能力
过往大多数变量方法依赖静态渲染图像,难以暴露动态偏差(如跨视角形变细节、倾斜等)和真实几何缺陷(如多头问题、局部梯度深度等),结论与模型在真实三维场景使用中的可用性存在偏差。
为了解决2D表征的视角,Hi3DEval使用多视角视角视频网格系统(网格)构建了基于混合3D的模型表征的自动化地图。
视频预览能洞察跨视角/实物的结构稳定性与纹理,能够区分“静帧建模、随即崩塌”的模型,制作非常适合对象级和材质主题的。而对于部件级,由于视频表征评估经常出现对主体的近距离影响评估质量,所以采用了近3D预览支持几何相关维度的自动化地图。
通过统一模型的设置与对比实验,Hi3DEval在人类偏好一致性上的表现方面,超越了现有主流自动体育指标,为3D 内容生成领域提供了更可靠、更全面的体育工具。
在生成3D技术高速迭代的同时,虽然不同模型在功能和表现形式上的差距正在逐渐缩小,但在内容精细度、真实感、结构一致性等质量维度上,过去的差异依然显着。
,由于缺乏科学体系、统一且可扩展的评价体系,行业讨论往往停留在“谁的演示更吸睛“这种高度印象层面,难以实现全面标准化方法的真正水平。
Hi3DEval的基准推出,旨在打破这一高度——不仅提供了面向未来的、系统化的3D内容评价质量标准,也为学术界和产业界带来了更透明、更公平的对比。
论文地址:
https://arxiv.org/abs/2508.05609
项目主页:
https://zyh482.github.io/Hi3DEval/
足球湿度:
https://huggingface.co/spaces/3DTopia/3DGen-Leaderboard
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!
—完——
点亮星标
科技前沿进展每日见
以上就是标准化3D生成质量排行榜来了!首创层次化评价体系,告别“谁的演示更吸睛”评估的详细内容,更多请关注乐哥常识网其他相关文章!