用大数据看透一座城市
- 来源:中国信息化周报 smarty:if $article.tag?>
- 关键字:大数据 smarty:/if?>
- 发布时间:2017-01-15 13:59
如何读懂一座城市?人们把生活构建在大大小小的城市中,城市不仅为人们提供工作机会,更寄托着休闲、娱乐、教育等诸多期待。在这个复杂的网络、动态的系统之中,每个人只能看到自己周围的生活,而几乎无法了解整个城市的场景。尤其是,如果你生活在一个特大城市,例如常住人口超过2300万的北京,可能穷尽一生都无法彻底读懂这座被尊称为帝都的城。
如今,我们有了“ 大数据 ”这样的信息时代新利器,每日都能直观俯视城市日新月异的变化,不必只从平面地图和县志中来间接理解城市。毕竟,房子和土地只是表象,人的聚集才是城市的本质。就像使用卫星地图监控城市的土地开发那样,我们现在利用大数据,在不同层次监测人口聚集,更好地回答“人在哪儿”的基本问题。
传统的宏观统计
以前我们只能看到宏观统计,例如采用县级统计年鉴数据库分析全国尺度的区县域人口密度(2012),宏观表现全国人口分布的京津冀、珠三角、长三角和成渝经济圈四极大结构。如果把尺度放得更小一些,我们又能看到什么?我们采用街道尺度的第六次人口普查数据,分析了北京市域街道层面的人口总量和人口密度分布(乡镇街道立体图中,高度和颜色分别表示人口的数量和密度)。
从人口总量看,昌平区的回龙观、东小口镇(天通苑)、北七家镇(天通苑以北),海淀区的学院路、北太平庄街道,以及大兴区的黄村地区,都聚集了大量人口;而从人口密度看,高密度区主要集中在海淀区和西城区。因聚集了大量的优质教育资源,海淀区在总量和密度上均呈现较高的值,所谓“宇宙中心”,果然不虚。上述数据可以让我们了解城市的脉络,但从中终究无法看到时间如何在城市中流逝、人们在城市中如何运动。由此,我们在这里尝试用大数据去回答城市中“人在哪儿”,把时间维度放进城市空间分析,重新理解城市中人的活动。
北京 在哪儿上班,在哪儿睡觉
我们采用百度(百度热力图)和腾讯(宜出行平台)实时网格人口数据,选择工作日上午10点和夜间23点,分别代表上班工作和下班居家的活动状态,由此得出城市的职住中心。如下图所示,为上午10点人口分布(即就业分布),清晰可见人口集聚区及稀疏区。
就业中心主要集中在:中关村、知春路、朝阳门-建国门-国贸一带、王府井-东单、金融街、西单、西直门、上地、望京、东直门、亮马桥、朝阳路十里堡段、惠新西街南北口、五道口、六道口等(北京南站因处于交通枢纽而聚集较多的人群)。
从夜间23点的人口分布(即居住分布)可以发现,居住中心主要集中在中关村、回龙观、西小口、六道口、五道口、牡丹园、清河、知春路、大钟寺、学院南路、劲松-潘家园、宋家庄-石榴庄、京沪高速与南六环等相交地点、十里堡、望京、北苑、立水桥、天通苑、芍药居、小营等地点。
通过对比,我们可以发现城市白天和黑夜的不同形态。第一种空间,白天熙熙攘攘的金融街、国贸、西单、王府井等商业就业中心,到了晚上一片寂静;第二种空间,集商业、就业、居住于一体的中关村、五道口、六道口、知春路等地,无论白天黑夜均集聚大量人气;第三种空间,回龙观、天通苑、北苑、宋家庄等主要以居住为主的地区,体现了睡城的基本特征。由此,大数据可以帮助我们了解城市居民如何使用城市空间,进行实时动态监测。
奥林匹克森林公园南园哪里人多,哪里人少?
大数据不光能识别宏观的职住分布,还可以分析微观的公共空间,如小区公园、购物商场的使用情况。同样,我们采用百度景区热图数据,配以实时人流动画作为表现形式,便可得出人们对微观空间的使用情况。例如,由清华同衡规划设计研究院主持规划设计的奥林匹克森林公园南园,除了地铁站森林公园南门以外,人流主要沿 5 km 的规划环道分布,到了晚上表现尤为明显,而 3 km 的规划环道上并未形成明显的人流集聚。同时,在以南门、西门和东门为核心的周边区域,有部分人流集聚,仰山所在中心区域则明显十分稀疏。
对比工作日周五和周六的人流量,可以发现,周五的人流量主要集中在外围 5 km 的环道,周六的人群分布则更为广泛,更加深入到奥森公园内部的各处景点。同时对比早间和晚间的人流量,周五早上8:30的人流量要明显高于夜晚20:30,而在周六早上和夜晚的人流量差异较小。
其实设计者也无法准确预测到这些现实使用情况,这不禁让人思考,是否 3 km 的规划环道以及仰山所在中心区域的设施配套不足,导致使用率低? 5 km 环道,是否因塑胶跑道而吸引了大部分人群;而仰山所在中心区域因灯光昏暗,且较少道路连通园门口,所以人群较少?这可能是设计师的精心安排,但有些可能是疏忽。在规划实施评估和未来的规划改进中,可以有针对性地进行优化。这是利用大数据发掘微观尺度空间使用模式的例子。
三里屯太古里和SOHO,各自的商业特征如何?
三里屯太古里与三里屯 SOHO 均处三里屯核心地段,在地理位置上几无优劣之分,仅隔一条工体北路。但人们可能会有一种体会:SOHO 门可罗雀,太古里时尚繁华。
但实情和观感一致吗?暂把7月14日优衣库事件对人流的影响放在一边,通过图表(数据来自腾讯宜出行平台和百度景区热力图,人口数值经技术处理,不完全代表人数),我们可以发现,无论工作日还是周末,三里屯 SOHO 人流量均高于太古里人流量。当然,您可以在图里清楚读到太古里在事件后收获的人流增量。
我们只感受到太古里川流不息的观光购物人潮,却没有看到 SOHO 的高楼里“藏匿”的上班族和住客。从用地性质看,太古里和 SOHO 均属商业用地,规划图纸上标注的是同一种颜色,但它们真的一样吗?从具体使用功能上,我们发现,太古里和 SOHO 运营的其实是不同类型的商业项目。太古里定位是综合休闲娱乐区,是以开放式购物区为主的商业综合体;而 SOHO 则是集商业、办公、居住为一体的综合社区。这两个地块随时间变化的人流量曲线,体现了它们承担功能的差异。
人流日变化图看起来像一团缠在一起的毛线。我们又做出工作日和周末的人流量拟合曲线,可以更加直观清晰地对比太古里和 SOHO 的人流变化。
在太古里,周末人流量大于工作日;而日间人流量随时间推移缓慢增多,午间13点左右增至最高峰,晚间22点之后,人群逐渐散尽。所以,太古里是人们休闲娱乐的去处,夜幕降临后大家各回各家。而在 SOHO,与太古里相反,工作日人流量大于周末;SOHO 达到人流量高峰的时间段,也比太古里提前,在早间10点左右攀至最高峰,这正是上班族们陆续到达单位进行打卡开始一天工作的时间段。
可见,精细化的实时网络数据能精确刻画不同使用模式地块的人口时空特征,是我们厘清复杂城市系统线团的一根解锁线头。当然,以上分析只是简单示意,我们还将使用机器学习等技术对其进行更深入的分析和建模,以及实践应用。
基于上述三个用大数据进行的“人在哪儿”的分析,我们的城市从二维的地图和文字中活了起来。我们可以观察到城市在全天24小时的不同面貌,人流在公园等公共空间如何聚集,纯商业项目和综合社区在不同时间段以及时间点人流量的差异。
如果说,传统统计数据特征是平面、静态和粗放的,那么大数据则让城市的数据维度走向立体、动态和精确,利于大数据自下而上的问题解决。
大城市人地矛盾的确已十分突出,政府政策制定时往往首先想到疏解人口。但事实上,依靠数据提升精细化的规划和管理水平后,我们的城市也可以和东京等城市一样,更好地满足不同人群的基础设施和公共服务需求,最大化发挥有限设施的服务水平,提高其使用效率。可以说,大数据让城市和生活更加融合,让空间和市民更加贴近,最终能让我们的城市生活更加美好。
佚名