基于多模态视觉语言模型的老旧社区环境特征解析——以重庆市中心城区为例

李彦锦, 罗丹, 肖竞, 李玮

中国城市林业 ›› 2026, Vol. 24 ›› Issue (01) : 9 -19.

PDF
中国城市林业 ›› 2026, Vol. 24 ›› Issue (01) : 9 -19.

基于多模态视觉语言模型的老旧社区环境特征解析——以重庆市中心城区为例

作者信息 +

Author information +
文章历史 +
PDF

摘要

【目的】针对老旧社区环境特征识别中传统方法效率低、受主观因素影响较大的局限,提出一种融合多模态视觉语言模型(VLM)与带地理信息的众源图像的创新方法框架,识别与提取老旧社区环境特征,并对其进行量化与归类。【方法】以重庆市中心城区为研究区,通过构建众源图像数据集,利用多模态视觉语言模型提取图像语义转化为文本,结合BERTopic主题建模技术提取聚类,将聚类结果映射到地理空间分析特征分布和共现结果。【结果】提取50个聚类得到涵盖空间骨架、微观细节、绿化形式及场所氛围的17组环境感知特征主题,识别出7类典型的特征空间共现模式,为空间定向改造提供建议。【结论】老旧社区环境具有复杂的异质性特征,并受历史风貌与公共生活的深度影响;多模态分析框架能够有效对老旧社区环境图像进行语义理解,实现低成本、高通量且精细化的环境特征挖掘。未来可以进一步结合社会学数据构建完整的更新闭环,真正服务于“好房子、好小区、好社区、好城区”的系统性建设。

关键词

多模态视觉语言模型 / 老旧社区 / 众源图像 / 空间特征 / 重庆市中心城区

Key words

引用本文

引用格式 ▾
李彦锦, 罗丹, 肖竞, 李玮. 基于多模态视觉语言模型的老旧社区环境特征解析——以重庆市中心城区为例[J]. 中国城市林业, 2026, 24(01): 9-19 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

AI Summary AI Mindmap
PDF

0

访问

0

被引

详细

导航
相关文章

AI思维导图

/