时空大数据支持下的存量规划方法论

2016-08-04 09:53:44    作者:段冰若 等     来源:上海城市规划     浏览次数:

  1.3非监督分类与矩阵分解在研究中的使用

  分时人口密度数据作为曲线类数据,其自身特点非常适合使用机器学习的方法进行非监督分类。笔者将数据整理为休息日的24小时分时人口数据与工作日的24小时分时人口数据,共48个时刻,结合20种不同类型POI的数量,对3层空间尺度的研究单元进行k-means聚类分析。

  为了能够确定k-means中k的取值,笔者对每组数据均进行了silhouette检验,寻找每组合适的k值,保证在分类过程中,既不会出现因为k值过小而忽略某些特征,也不会出现因为k值过大使得多组分类结果高度重合的情况。

  为了对时间活动的趋势规律和地块人口活动规模进行进一步区分,笔者分别使用了归一化的48个时刻数据和未归一化的数据进行非监督学习,使分类结果更加详细。在进行48个时刻的非监督分类同时,笔者也尝试了使用非负矩阵分解(NMF)的方法,将每个研究单元48个时刻中的特征提取出来,在放大特征的基础上进行非监督分类。

  2研究结果

  2.1地块尺度研究结果

  地块尺度的分类方法是,采用非负矩阵分解(NMF)的方法先对归一化后的48个变量进行降维(降成5维),然后采用k-means聚类的方法对降维之后的5个变量进行聚类。多次进行silhouette检验,发现k=9时,分类精度最高。

  从地块尺度分类结果图可以看出,该方法对商务办公、商业商务混合、商业识别度最高,对游憩—公园、居住主导、商住混合—居住为主等功能的地块也有较好的识别度,而混合—居住主导及其他两类混合类则无法准确判断,实际上这3类在五环内的地块中所占比例非常小,可以说,总体上基于地块尺度的地块分类方法具有较高的精度。

时空大数据支持下的存量规划方法论

地块尺度分类结果

  除对典型的功能区有较高的识别度之外,该分类对非典型功能区中精细地块也能有较好的识别。以奥林匹克森林公园所在区域为例,这块区域包括了居住、商业、办公、游憩公园等多种类型。

  地块1经过机器学习识别出的结果是游憩公园类型,所表现的曲线特征为周末人多、平时人少、高峰在下午14—17点,与人们游憩娱乐的行为习惯一致,进一步对比百度地图的结果,发现该地块为奥林匹克森林公园南园所在地,为绿地类型用地。

  地块2经过机器学习识别出的结果是商务主导用地,曲线特征为明显的周末几乎无人、平时人多、10—18点长高峰的特征,与人们工作的行为习惯一致,而在百度地图中显示该地块为京东总部未搬迁之前的办公所在地,为商务办公用地类型。

  地块3识别的结果是商业主导的用地类型,曲线表现为周末、平时略突出的双高峰特征,由于该购物中心为片区级购物中心,主要服务周边居住、办公的人群,因此商业特征相较商业中心不太明显,但仍表现为商业主导的特征,而百度地图上显示该地块为漂亮阳光广场,为商业服务业用地类型。曲线以及地图实景均验证了本部分所用分类方法在精细地块尺度上具有较高的识别度。

时空大数据支持下的存量规划方法论

  奥林匹克森林公园区域地块识别功能、对应曲线、实际功能

编辑:lianqi

凡注明“风景园林网”的所有文章、项目案例等内容,版权归属本网,未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权者,应在授权范围内使用,并注明“来源:风景园林网”。违反上述声明者,本网将追究其相关法律责任。

相关阅读