城市设计/数据分析/技术分享/摄影记录

0%

城市热力图的获取及分析

热力图简介

 人是城市经济活动的载体和城市化进程中最活跃的因素,人口分布空间格局对城市研究有着重要的意义,而互联网地图的热力图作为新兴的大数据产品,基于了上亿手机用户地理位置,能够对实时的人群集聚、人群分布进行可视化表达。虽然不能代替实际的人口密度数据,但一定程度还是反映出每天、每小时甚至每分钟人群在城市空间中相对集聚的位置和分布趋势,为城市研究和规划提供了全新的视角。

 热力图(Heat Map)是通过密度函数3进行可视化用于表示地图中点的密度的热图。

数据来源

 目前可以采集到的有百度热力图和腾讯宜出行热力图数据,两种数据源各有优缺,应对不同的需求,比如范围大小,精度要求等,选择合适数据源进行分析。

百度热力图:基于获取移动端用户的定位信息(手机中安装百度系APP的人群),以不同颜色表达人口集聚程度的相对高低,颜色越暖则表示该区域人口分布相对密集,而越冷则说明该区域人口越稀少,通常15分钟更新一次,快速准确的反映了人口在连续时空尺度上的分布特征。

腾讯宜出行:基于海量的腾讯系产品的用户定位次数信息而发布的不同区域的热力图数据,展示了不同区域的实时的定位人数,反映人群的相对集聚区和人口对的分布趋势。

数据采集

百度热力图功能仅支持手机移动端使用,通过采集工具调用手机接口,可进行图示化的采集界面,设置采集范围及精度,输出格式为图片形式。采集到的热力图片需要在ArcGIS中进行处理,对热力图片进行重分类操作,即对不同颜色赋予不同的热力值(表达式如图所示),其次根据需要对热力图进行矢量化操作,将相同的热力值的栅格合并为一个矢量多边形,将热力进行分区表达。具体操作步骤如下:

  1. 安装百度数据采集工具及PIL程序,并获得激活码(付费工具,购买于公众号:规划大数据笔记,界面如图1所示

  2. 获取采集范围经纬度坐标,分别是左下角和右上角坐标(可通过百度坐标拾取获取:

  3. 选取地图缩放级别,精度要求高选取17即可(热力图采集不要选取18,因为最高17,底图可以选取18

  4. 根据需要选择输出坐标系、文件位置(输出坐标系支持WGS84、BD09、GCJ02三种,输出文件类型为栅格TIF格式

  5. GIS中加载下载好的热力图TIF(在GIS中加载定义好坐标的百度热力图第1波段、第2波段和第3波段,通过图层到添加数据

  6. 栅格热力图数据重分类打开栅格计算器,根据实际参数情况修改公式,默认情况下修改TIF文件名即可,如果TIF颜色没有8种,则需要进行修改公式数量,如图4所示

1
2
3
4
5
6
7
8
9
#示例代码,按需修改

Con(("17.tif - Band_1" == 205) & ("17.tif - Band_2" == 78) & ("17.tif - Band_3" == 0),
6,Con(("17.tif - Band_1" == 205) & ("17.tif - Band_2" == 205) & ("17.tif - Band_3" == 0),
5,Con(("17.tif - Band_1" == 0) & ("17.tif - Band_2" == 205) & ("17.tif - Band_3" == 0),
4,Con(("17.tif - Band_1" == 0) & ("17.tif - Band_2" == 205) & ("17.tif - Band_3" == 205),
3,Con(("17.tif - Band_1" == 0) & ("17.tif - Band_2" == 82) & ("17.tif - Band_3" == 205),
2,Con(("17.tif - Band_1" == 0) & ("17.tif - Band_2" == 0) & ("17.tif - Band_3" == 205),
1,0))))))
  1. 输出结果进行矢量化(调用GIS的栅格转面工具

  2. 叠加规划区底图,以进行后续分析(如图5所示


腾讯位置数据是通过微信-城市服务-城市热力图提供的数据进行采集,输出格式为csv的热力散点图,利用Python编写程序进行接口调用,范围输入,数据获取,数据整理三个部分。由于每个QQ采集数量每天有限制,需要通过多个QQ产出COOKIES,所以该方法普遍适用小范围高精度的需求,以便不断循环采集,如果需要大范围的使用,则需要大量的QQ号。这里我们使用网友分享的打包后的程序,可直接运行程序进行采集(需要主要的是,由于腾讯会不断更新系统,采集的源代码也会不断更新,由于程序是源代码打包,所以不能确保永久有效),具体步骤如下:

  1. 打开config文件,进行配置,主要有QQ号及密码的输入(注意格式,格式不能出错),爬取的间隔时间、采集范围(WGS84坐标)、设置文件夹名字,最后进行保存(如图1所示);

  2. 安装谷歌浏览器,确保程序启动后可自动弹出;

  3. 运行宜出行.exe文件,程序开始运行;

  4. 采集后得到不同时间的CSV格式的经纬度数据表;

  5. 通过GIS添加XY数据(File-Add Data-Add XY Data),根据表头设置XY,Z无需设置,由于采集坐标系为WGS84,此处添加一个地球坐标系WGS84,无需设置投影坐标,数据就成功添加到GIS中了;

  6. 添加规划底图,并将点数据通过核密度分析,生成热力图。


数据分析

 通过上述的流程,我们已经采集到百度热力图的多时段图片或者宜出行多时段的定位点文件了,如何运用这些数据对城市进行分析也是关键和最为重要的一步。

 数字时代中,多元的数据可以增强我们认知城市的能力,还能看到人们在时间中的空间选择,能看到转瞬即逝的变化是如何发生的,这也是我们获取热力数据的根本原因。在苏州城市设计中,把一周中每天6-12小时的人流集聚及波动进行判断,将这一流动与实际的物理空间对应的来看,就可能找到城市的问题,比如人为什么在一个地方集聚?那些人集聚的地方的空间载体和环境是否较差?那些看起来很好的地方为什么很少有人集聚?由此我们可以产生更多的思考,产生的原因,错位的原因等等。

 应对多种思考,我们分析的方向未来也将更加多元。在苏州项目中,我们分析得到场地人群活动分布特征、人群时空分布特征,进而找到规律及问题所在,并结合设计策略指引方案的生成。当然,我们针对不同的需求,叠加多种数据,还可以有更多的分析导向,比如人群分布趋势分析、人群重心变化分析、职住分析、商业区吸引力等等。

 种种数据联系起来,可以让我们对城市、对人有更多准确的认知,但我们始终也无法达到精准和完美的程度,因为城市和人,都是复杂的对象,但对于这个复杂对象的认知过程是有价值的,越精准,越靠近真实的过程很重要,城市设计不会有唯一解,通过对人群活动的认知,可以加快我们对城市内在场域的理解,更好的布局城市的人行视角下的空间。


分析思路

1研究周末(周六、周天)人群活动的时间变化和空间变化规律;
2研究周内(周一至周五)人群活动的时间变化和空间变化规律;

周末/周内人群活动的空间变化规律

为了准确描述人群空间分布特征,利用GIS计算每一天全天规划区氛围内的聚集度平均值和标准差值
热力图平均值能反映规划区域内每个点的聚集程度,平均值越大,聚集的人数越多,即聚集效应就越强;反之,聚集效应就越弱。(如图1所示

图1:周一人群活动的热力平均值及主要集聚区域

 热力图标准差反映了每个点的聚集程度变化。标准差越大,说明不同时间的人口变化较大,即点的聚集效应具有时效性;标准差越小,说明点的人流量变化较为平稳,则该点的功能相对复合。(如图2所示

图2:周一人群活动的热力标准差值及主要集聚区域

 结合分析发现规划场地呈现出了冷热不均的现象,外围的乐桥、三元坊、临顿路地铁站,以及凤凰街、十梓街、五卅路的交汇点是全天都较为活跃的区域。而片区内部则是在公园、学校、办公区、体育馆出现不同时间段的活动集聚。十梓街南部的生活片区,整体活力都较弱。

周末/周内人群活动的时间变化规律

 为了进一步了解各个时段的人群活动特点,可以将人群活动时间划分为7:00-11:00、11:00-14:00、14:00-20:00、20:00-00:00四个时间段(也可以是其他时间段),利用GIS工具分别计算各个时间段的热力平均值,分别进行周内与周末的叠加分析,结合调研、问卷等,以判定各时间段的人群空间分布变化。
 由此可以看出,在周内除去站点交通大量聚集的因素,平日白天的苏州公园是片区最具人气的场所,以老人及儿童休闲娱乐活动为主。晚间,中青年人群成为主角,人们在体育场和市民健身中心积极的开展各种运动健身项目。在周末图书馆、十全街、第一中学区域,大量年轻热人到访,阅读、交友休闲、补习、培训是他们的主要好活动。这些人群活动目的单纯、活动区域划分鲜明,更多的集中在片区外围,且不同热点之间也少有交叉互动。(如图3所示

图3:周一人群活动的热力标准差值及主要集聚区域

研究总结

 通过一系列的数据获取及分析,并且对分析结果进行比较可以发现,周末和工作日规划区范围内的人群分布和空间使用具有以下特点:

 1) 无论周内还是工作日,地铁站及道路交汇处都是最为活跃的,片区内部在不同的时间聚集,南部片区整体都较弱。
 2) 基于热力图的采集原理,被采集的手机数量在周末和工作日差别不会太大,但是工作日人群的大多聚集在点状区域,单位面积的人口密度就会越大,面积也就越小;反之周末人群大多聚集在线状区域、面状区域,单位面积的人口密度越小,聚集面积也就越大。同时,由于片区内老年人较多,被采集的手机数量会有一定偏差。
 3) 对时空差异进行分析后,可以看出周内与周末的活动地点与人群构成存在一定差异,老年人的活动时间相对集中和完整,不受时间影响,中青年的活动时间则相对分散,在周末则相对集中。

不足之处:

 1) 采用了聚集度单因子进行分析,结果会与实际情况有一定的出入;
 2) 未对聚集面积进行统计分析,缺少一天内区域聚集面积变化的情况,从而对区域内一天中人群时间变化缺少支撑。

未来展望:

 1) 结合片区用地布局、空间特色、建筑情况、文化景观等条件分析人群活动特征,进而更加合理的规划公共服务设施;
 2) 融合更多的开放数据,比如天气数据、PM2.5、研究不同天气情况下人群的活动特征,进而完善基础设施规划布局;
 3) 结合交通数据、手机信令数据综合分析人群活动特征,研究局部空间及道路的优化。

本文部分内容摘自:规划大数据笔记、感谢作者提供这么好的工具。
特别声明:本文原创,版权所有,转载请联系,谢谢。

吃颗糖
  • 本文作者: Erek
  • 本文链接: https://erek.top/2020/002-js/
  • 版权声明: 本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!