理解人工智能价值对齐的三种路径及其反思

刘培; 池忠军

重庆邮电大学学报（社会科学版） ›› 2025, Vol. 37 ›› Issue (06) : 128 -139.

理解人工智能价值对齐的三种路径及其反思

刘培, 池忠军

作者信息 +

Author information +

文章历史 +

摘要

当前，效用对齐、伦理对齐与人工智能民主化是阐释人工智能价值对齐的三种主要方式。技术路径下的效用对齐致力于构建使机器更准确地理解并实现人类意图与偏好的机制，但其背后隐含的工具性智能观、单向对齐模式与对偏好合理性的忽视，引发了一系列规范性和技术性挑战，导致出现“对齐却不安全”的悖论。伦理路径下的伦理对齐以设计具备道德判断能力的人工智能行动者为目标，将道德机器作为价值对齐的前景，却面临普遍主义道德观局限、道德计算主义、人工智能道德行动者伦理对齐不足以及时空跨越中对齐“事实迁移”等困境，引发对其可行性及适用边界的质疑。技术政治路径下的人工智能民主化以“技术之外”的视角，将价值对齐的问题域从技术与伦理问题转变为关乎所有利益相关者平等参与的政治议题。然而，由于其分析未能从“权力黑箱”深入至“资本黑箱”，且对“人工智能民主化”概念的使用存在模糊性，导致其难以有效落地。对此，应立足中国人工智能发展的现实语境与审慎立场，通过明确价值对齐适用于有限人工智能场景、揭示其背后的意识形态真相，并以顶层系统规划与具体实践相结合的方式，推进中国主权人工智能价值对齐建设，从而构建适应中国发展道路的价值对齐方案。