互  动
博文
当前位置: 首  页 > 互  动 > 博文
博文
【会议放送】大数据时代定量城市研究的四个变革
发布时间:2015-1-1514:33:35来源:北京城市实验室BCL(新浪微博)作者:点击量:3334   

随着信息通讯技术的广泛应用和我国推动多年的政务公开运动的不断完善,大数据和开放数据的可获得性不断提高,这些为微观个体层面的数据开展定量城市研究提供了新的机遇和挑战。

 

定量城市研究的四点变革及相关实践

我们认为定量城市研究是在一些理论基础上,采用各种数据,各种技术方法,致力于科学理解城市。我们希望所做的定量城市研究工作,能够致力于科学理解城市,找到城市是不是有一些一般的规律,然后诊断城市,比如说城市存在一些什么样的问题,然后模拟城市,构建一个政策实验室,不同政策对城市的发展有什么样的作用可以评估,通过评估相关的政策,寻找解决方案。

所以总体上我们认为可以致力于支持城乡规划现状的分析,方案的编制和评估。但是现在一个观点是做城市研究工作,或者做定量城市研究工作,出口规划只是一个,有时候不能说规划或者说规划编制中没有用到定量城市研究,没有用到城市研究的结果,你做这个研究是没有用的,这是不对的。相当于我们致力于找到城市客观规律,可能规划是没有,但是我们对于学科或领域的发展,或者对于人类探索城市、探索地球是有推动作用的,所以我们现在总的一个观点是规划只是定量城市研究,或者说规划只是城市研究一个出口而不是他的全部。不能说规划上没有采用,我们做这个研究工作就是一无是处,这是不一样的。


这样的时代、数据、国家政策方面变化背景下,我们发现定量城市研究有四个方面的变革:

  • 一是空间尺度上的变化:跨越区域分析和城市研究的大模型

原来只关注一个城市,现在慢慢我们可以做一些研究工作,有这样数据支持,做大量的城市,甚至做中国所有的城市,这都是有可能的。

已有的关于城市研究或者区域分析这个工作,无外乎两种,一是是针对一个城市做非常深入的工作,比如说我们研究广州城市贫困问题、研究北京的公共服务设施的配套水平或服务半径。

另外一个方面就是区域分析,比如说中国很多偏宏观经济的学者做的大量工作,覆盖中国的整个国土范围,但是他们的研究单元是比较粗的,或者以县为单元,或者以省为单元。

所以在城市研究区域分析,一直都有一个折中,就是或者你的范围很大,但是研究很粗;或者你的范围很小,但是研究很细。上图能够看到研究的空间范围和研究分辨率是有差别的,是一个所谓的曲线,城市内和区域是不一样的。

 

是不是有可能做一种分析或者研究工作,可以把地域范围覆盖到整个中国,或者中国大多数城市。如果研究地域范围很大,研究力度是不是还同样可以到项目,空间可以到地块,所以我们就推出来大模型这样一个研究范式。

大模型的定义

我们认为大模型是由大规模数据来驱动,用简单直接的建模方法,既能兼顾研究大尺度,又能兼顾精细化研究单元,这样一种做城市和区域研究的工具,它代表了一种新的研究范式。

大模型我们希望考虑很多城市,同时每个城市可以能够到地块或block这样一些尺度,可以做到传统研究工作只针对一个城市的工作,也可以针对一个国家所有国土,或者说一个大洲的范围。

在大模型中无所谓你是做城市内还是做城市间,因为它覆盖大量的城市,我们可以用已有的城市间的空间相互作用、城市间的投入产出、省和省之间的投入产出,来研究城市间的问题。同样,我们也可以用微观模拟的方法来研究城市内部的问题。

大模型的愿景

我们希望用大模型来解决科学的一些问题,同时我们也认为它本身就是一个科学的问题,值得我们探讨。

从实践需要上看,我们的很多研究、咨询工作都是关注大城市,而对于一些二三线甚至更小的城市,很难有非常深入的研究。但是小城市也需要我们做客观的城市研究工作,小城市的居民也需要改善生活质量,所以大模型的一个愿望是,希望用大模型缓解已有大中小城市技术上和数字上的一些鸿沟。通过大模型我们能够覆盖大量的城市,它能够建模大城市和中小城市,“普天之下,莫非王土”,所有的城市,所有的地域我们都需要来得到关注。

另外,我们希望通过大模型来找到中国城市系统发展的一般规律,如果能够在一个非常细的尺度上,中国有654个城市,我们可以做一个小项,通过大模型这样手段找到每一个城市的规律和规则,后续渗入统一分析规律。这样一来我们就能够试图来回答中国城市在过去10年、20年和现在发展存在的问题,有什么样的客观规律,这是我们作为科研工作者一个非常重要的命题。因此我们只研究一个城市是不够的,不同的学者研究的方法不一样,很少有人在一样的力度和尺度下来研究中国所有城市。

当然仅仅抛出大模型的概念这还是不够,后续要做大量的大模型实证的研究工作。针对中国一些不同方面的问题我们做了大量大模型的工作。


大模型应用

1)覆盖全国所有城市的地块尺度的城市增长模型MVP-CA

 

MVP模型里覆盖中国654个城市,我们能够回答在不同政策下,每一个城市再过五年开发那个地块可能会被城市化,由农村转变城市。在这里我们做了大量工作,包括对城市历史的梳理、对城市现状禀赋的评估以及对城市未来发展趋势的预测。

2) 利用道路网和兴趣点POI生成全国297个城市的用地现状图

 

我们做一个城市的规划,可能有时这个城市的CAD或者GIS格式的城市现状图是拿不到的,特别是有外资背景的事务所,是非常难以接触到中国城市的土地使用现状图的。在这里,我们用开放的数据生成了中国300个城市的土地使用布局,如用地功能、城市范围、开发密度、混合使用程度。这些数据放在网上,所有人都可以免费下载,甚至把土地给你配好,直接打开这个MSD文件就可以了。

3) 地块尺度建成区界定

不同的城市做规划实施评估,主要还是空间方面实施评估,因为规划实施评估覆盖的范围,覆盖的专业,覆盖的方面太广,我们只关注UTB对城市增长的一个控制,但大多数城市是没有机会有人帮它做客观规划实施的。

因此我们收集了中国200个城市的数据,通过众包的方式,让志愿者把不同城市的总规用地规划图的数据下载过来,我们把它数字化,然后放到中国国土上面。

 

这张图也是放到网站上,可以像百度、谷歌地图一样放大缩小。这样就可以知道我们关注的每一个城市,什么地方被规划成为城市。如果配上城市现状路网,现状地名来看我们的规划,和我们看规划地块图这是不一样的。我们关注什么现状的地方规划是什么,它是不是被规划成为城市,所以说开发商通过这个能够初步对不同城市规划政策有一些判断。

 

当然我们这个成果已经出来了,因为知道中国过去十年,每一个城市什么地方发生了扩张,那么我们可以试想,每一个城市,200个城市我们每个城市都知道扩张出来,和规划范围做一个比对,不就能知道中国每一个城市规划对城市开发控制大概是多少。我们发现一个规律,一般中国的城市,城市规划边界或者UTB,对城市开发控制作用一般都是50%,就是说这是我们认为中国规划实施的第一个定律,我们认为中国规划实施或者中国UTB的实施是有两个方面的规则或者说普适规律。

 

第一个规则就是50%,中国大多数城市,都是50%是合法的,50%是非正式的,我们也不能说他是非法的,非法可能是太敏感了。这对政府、规划局刺激还稍微小一些,所以我们认为,采用大模型我们可以比对,什么城市规划实施效果好,什么城市规划实施效果差,它们有什么规律?是不是真正沿海的规划控制有效,内地控制相对弱一些,我们是可以做一些这样分析,只做一个城市或几个大城市是不能发现的,很难找到中国规划系统的一般规律。那么我们做200个,还是有足够样本来分析,然后当然除了做这个,我们做规划实施评估,也可以做这样一些数据,我们来看用地规划师一个偏好,等等。

4) 全国公交覆盖率评价

 

用类似方法,我们采用大量微观数据做了公交覆盖的一个评估,用这个评估一个城市系统,公交服务怎么样,我们关注的是500米范围内有多少人,它覆盖多少人,什么范围内是可达的。北京86%城镇用地范围内是可以500米之内做成公交车的,上海是75%,从这一点发现北京公共交通提供服务质量,从空间服务的范围,这个比例比上海要好一些。

500米是公交都市的一个标准,500米范围内是不是有人,有多少人,他们是不是坐公交车,有可能500米范围内你覆盖的是开私家车的,反而是远离公交站点的人,比如800米的是需要做公交车的,所以说能够看到这个所谓被剥削这样一个现象,或者公共服务设施不平等,很多方面都可以来探讨。

5) 都市区范围研究

长久以来我们一直在问,每个城市的研究,行政上的范围是不是反映都市区的范围,因为我们一直在讨论燕郊是不是应该属于北京都市圈的范围。这样一个问题,中国学者已经研究很多年,针对个别大城市,我们能够回答都市区的范围是在什么地方,但是真正很多城市我们没有数据,因为一个城市,一个地方属于一个主要城市的都市区的定义是你得有10%或者15%的劳动者到城市的中心上班,才能划入这个城市劳动力的市场,所以说我们用一些公共服务的数据试图画出中国不同的城市,他们都市区的范围是哪里。

我们现在可以做多个城市,采用大模型这样一个视角,试图找到中国城市系统的一般规律,我们也能够来支持一些中小城市,缓解他们一些基础上、治理上、人才上的鸿沟。


  • 二是时间尺度上的变化:理解不同时间尺度的城市发展动态

原来可能只关注一年城市发展的规划,或者说一周一个变化,在大数据时代是能够来试图来理解和感受不同时间尺度上的变化。

我们现在做一个规划,用统计年鉴的数据,它反映的是一个城市一年内的变化或者这一年结束时城市的状态。而我们如果做一些城市更新、城市改造或小地域范围的一些小规模调研工作,你可能会问一个人过去24小时他都干什么,它反映城市动态是一日的一个动态。

我们很多大数据,如公交刷卡,它反映能够到秒,就是每一秒钟城市的动态都能够反馈出来,我们可以设想一下,我们每一笔刷卡的记录能够到秒,如果你这张信用卡,10年不变,20年不变,再过20年之后我们还是用这张卡,然后我们如果有一个图,就可以有相应的数据来支持你,在过去20年中你每一年的消费,每一年不同月份的消费。这是真正的大数据。

如果数据积累20年我们是能够看到这个时代的变化,假设到现在为止我们用信用卡用20年,是能够看到传统商业的萎缩,能看到传统书店消失,逐渐被在线所代替,也能够看到吃饭的地方逐渐由传统的非连锁性小餐厅或者中等餐厅逐渐地过渡到连锁性的餐饮。它反映的是我们时代的变化,或者说城市的变化,就是说当大数据积累大量年份之后,我们看到的不止于可视化,能够看到技术的进步对人类生活的改变或者对城市的改变,对生活方式的影响。

 

用一周北京市公交刷卡的数据我们能做什么?我们通过北京10万居民抽样调查数据发现北京有95%以上全职工作是超过6个小时的,我们用6个小时作为标准能够识别每个持卡人,住在什么地方,在什么地方上车,当然我们也发现99.5%的人早晨第一次出行都是从家开始的,只有0.5%是从宾馆、车站等其他类型地方开始的。

 

我们可以用传统数据找到一些规则,再用于大数据挖掘。北京有一千万持卡人和上亿次出行记录,通过这些我们能够看到城市通勤的主要流向,它反映城市一周的动态,我们发现CBD辐射的范围,要远超上地和金融街;通州人每天通勤1个多小时,等等。

 

如果用六年数据我们能够看到什么, 2008年有上千万人一亿次的出行, 2014年也有上千万人一亿次的出行,但这两者并不一样,因为坐公交车的人少了。北京公交出行的总次数是衰败的,更多人逐渐选择坐地铁。

2008年到2014年城市发生什么变化,通过一些调查,我们发现大多数人是不换卡的,因为没有动力来换卡,除了损坏。所以说正常情况下一卡对应一人,所以说通过2008年和2014年的出行,我们能够看到你是不是搬家了,换没换工作,是不是失业了,跳槽跳到什么地方,能够做这样一个判断。

这只是数据层面的一个反映,另外我们也有社会经济属性的调查数据,我们发现在北京,有体面的工作和身份,是不会忍受每天通勤往返三个小时,所以我们的一个假设是,在北京反复坐公交和轨道交通的长距离通勤的,都是属于社会的底层或者准底层。

所以总体上通过北京10万人调查,我们发现,坐公交车次数越多,在公交车上花的时间越长,他的收入越低,他的职业也是更处于处剥削的或者体制外的,在北京有11.2万这样的人每天为了生计在城市里奔波。这六年中他们有80%的人换了居住的地方,只有13%的人没有换工作。所以我们发现一个结论:在过去6年北京这样一个社会中,这11.2万人是多么动荡的一个群体,应该给他们样关注?我们做城市设计、城中村改造和保障房设计时,有仔细的考虑过他们的出行、他们在这个城市里面身份的变化以及他们对城市的认识吗?我们希望我们的工作并不是只是在表面上发现这样一个现象,我们希望在不同的政策设计和规划方案上我们应该考虑很多方面。

用这种多年数据,我们能够推测,2008年城市不同站点的功能怎么样,在20132014年又是怎么样,这样我们就能够评估轨道交通的演进,对城市功能的改变和促进以及城市规模变大变小等很多方面的作用。

用这种多年的数据我们是能够做这样工作,如研究城市的演进、不同政策对城市功能的影响、人对空间的使用产生什么样影响以及政策评估,等等。


  • 三是研究粒度变化:研究以人为本的城镇化

新型城镇化规划,是以人为本城市化,要回到人的尺度,研究粒度要细化,以往很多规划,很多政策的设计是“见物不见人”,更多是粗放性的扩张。我们发现中国一线城市,很多城市是没有什么土地了,以后可能更多会是一些小型的城市更新、城市改造、城市再开发这样的项目,如果在这样的项目下,原有工作手段可能并不一定比较适合。做类似项目必不可少的一个环节,就是做精细化尺度上的工作。

 

所以我们做关注人的工作,做乡镇和街道办事处尺度上人口密度,这是中国,学界上和咨询界从来没有得到一个图,就是中国乡镇和街道办事处尺度上人口密度上一个变化,蓝色反映人口没有增长,是减少的,它发生了什么,至少不是繁荣的。我们发现,中国有三分之一的国土人口密度是减少的,并不是说在过去10多年中国蓬勃发展城市化过程中所有地方都是繁荣的,这就是此消彼涨,人都往大城市走了,广大小城市人口密度是收缩的。

 

空心村现在耳熟能详,我们用数据探索的方法,发现中国另外一个尺度上发生的所谓空心化,不仅村子里没有人了,在乡镇和街道办事处这个尺度上,有另外一个尺度的空心化,并不是说人口密度下降都是乡或者是镇,我们发现有大量街道办事处这种行政上承认是城镇范围的地方,人口密度也是少的,并不是说只有乡村范围人少。我们发现中国654个城市,有180个城市人是少的。

 

这对于城市规划有什么样启示?一个地方做规划的时候人口必须要增长,人口不增长就没有土地。我们规划预测的时候,你怎么证明人口肯定要增长,不增长政府不会同意,为什么找你做规划,他们是要土地,中国的城市化模式或者说财政的模式就是这样。但是如果我们到中国180个收缩城市做规划的时候,我们规划的手段,是不是要突破人口必须要增长。

我们做一个初步预测,过去10年有这样图,我们认为再过10年还是这样图,就是说人口向大城市聚集的这种速度,无论中国怎么促进中小城市的发展,中部崛起、西部开发、东北振兴,还是不能阻碍城市发展客观规律的,大多数城市都是没有那么大的,这是很多国家城市发展的普遍规律,英国只有伦敦一个城市是超大城市,第二城市可能尺度只有二分之一或者三分之一。所以我们用客观规律是能够诊断出这个系统存在的一些什么问题,城市也不例外,因此我们预测再过十年中国城市的发展,中国人口向大城市推进的速度还是一样。

在这180个城市做规划,规划手段是不是不一样,是不是应该回到目标不是为了拿到更多的土地,最核心的是关注剩下那些居民的生活质量,怎么样提高居民生活质量增加就业,我们在国内规划界推收缩的城市,也成立了中国收缩城市研究网络。

 

当然我们也关注鬼城,小区空置的程度,我们用百度地图、微博来评估一个小区周边500米范围内、1公里范围内是不是没有人。中国654个城镇,1000多个县城,大多数过去10年的开发规模超越他们过去100年,空置现象还是非常严重的。

 

我们现在致力于采用各种大数据手段来探测中国80万个楼盘的空置程度,能够初步来给出楼盘空置比例,然后所有城市排行,做了一个评估,也可以找到一般规律。比如说什么城市空置率比较高,什么地方城市,我们可以用计量经济学的一些手段,我们可以做一些分析工作,影响的因素,这样能够支撑我们政策设计。

 

回到人的尺度,北京虽然可能有很多建设用地是属于规划,但是用各种大数据我们发现, 50%是非正式的,但是95%的人类活动和移动还都在规划边界里,虽然规划物理空间上控制不住了,但是在社会空间上是可以控制住的。我们用人类活动和移动数据,发现通州相比顺义是没有优势的,联系通州和主城的可能更多是通勤的联系,但是顺义作为北京副中心我们认为还是OK的,因为顺义除了和中心城的联系,它也承接北京东北三线或者三个区域的联系。

 

关于中国每个乡镇PM2.5,我们有中国每日PM2.5浓度数据,除了用监测站的数据、空气质量APP的数据,还用到遥感数据,针对中国每个乡镇和街道办事处来评估。很少有人关注一年这个城市到底发生什么,到底超标多少?所以这个图反映中国不同乡镇和街道办事处一年PM2.5超标多少月份,这不能用日来说明,因为超标太多了。

PM2.5这个分布上,邢台就是中心中的中心。虽然我们一直抱怨北京PM2.5差,但是超标日数上,它和武汉、成都差不多的,就是没有那么惨的。无论从平均浓度,还是从一年超标的日数,因为不是从一个时间段,而是关注一年每一日的浓度,当然我们也可以判断不同的月份到底怎么样。

 

  • 四是研究方法的变革:利用众包开展和验证研究

 

我们的研究发现了收缩城市,每个城市为什么收缩,背后原因是什么?很难说一个课题组花20年的时间走遍中国180个收缩城市就能知道他们的原因,可能20年之后他们也不收缩了。所以采用众包手段,我们不是预测中国654个城市,再过五年什么地方会被开发,什么地方会变成城市用地,我们把成果放到网上,由当地居民来评估我们成果是不是可靠。

所以在654个城市增长模拟模型里我们也邀请热爱微博的网民,在微博上看模拟是不是靠谱,有的人说你们这个模拟还不错,和我想法差不多。

 

我们一直在做大模型,中国600多个城市那么大范围,不可能研究人员、设计人员对每一个城市都有非常丰富的知识。所以可以邀请有当地知识的人参与到工作里面,来验证工作,参与设计。


定量城市研究的再思考

  • 大数据和开放数据有偏差

我们所做的研究工作,不都是大数据或者开放数据来做,很多还是用小数据来做,即便是用大数据或者开放数据做,也是可以用多种数据来探讨的,发微博的人可能是年轻人,但是坐公交车可能属于工作人员。

另外就是所谓“盲人摸象”,用一种数据可以摸到城市系统“大象的腿”,一种数据可以摸到“鼻子”,最后通过团体不断努力,这个城市系统整个完整的面貌,会经过大家不懈努力会逐渐显示出来。科学研究工作是不断来积累,是一个人站在另外一个人的肩膀上不断来做的过程。

  • 多现状和近期研究,少远景判断

现在做工作更多还是给现状和短期未来一个判断,有一部分是对城市过去发展回顾,很少做城市20年之后怎么样,这实际上很难。我们还需要依赖传统方法,需要结合传统的一些方法来针对城市愿景的未来做一些判断。

  • 多认识城市,少规划启示

我们现在做工作更多是认识城市,中国城市系统到底怎么样,一般规律是什么?存在什么样的问题,规划上到底该怎么办?实际上我们已经思考一部分,比如关于收缩城市、空心镇,后续工作需要特别关注规划到底怎么样,虽然规划只是城市研究的一个出口,但这个出口是不应该放弃的。我们还要有一部分工作重点要回归规划。

  • 理论何在?

很多人质疑理论何在,批判大数据没有理论。其实有没有理论和用什么数据没有太大关系,因为小数据同样也是一样,会遇到这样问题,这和研究者采用的方法、设计框架有关系。

  • 学科发展需要的反思

在这样一个时代我们可以做定量城市研究工作,那么在学科专业设置、课程设置、人才培养上,是不是应该有一些思考。

以后本科生专业培养规范和培养方案跟原来不一样,有很多关于数量分析、GIS、城市发展模拟方面的课程,这就意味着这些人本科、硕士或博士毕业后,他们的知识体系和我们会相差甚远。我们希望通过做一些学术工作能够改善规划的一些方法,给规划老师一些参考。当然并不是说靠一些城市研究工作者或者规划支持,更多还是需要靠教育从根本上改变。


小结

纵观人类发展几千年的历史,我们从来也没有如此清晰看待社会系统,所以我们认为在当下,规划还是会有一些改变。大数据和原来一直在说的CADGIS、决策支持系统等规划支持系统只是本质上的差别,大数据改变城市系统本身,改变商业业态,人的出行方式等等。

定量城市研究四个方面的变革还存在很多局限性,我们致力于科学理解城市的尝试,并不是做规划信息化工作,我们没有开发任何一个系统,也不是做规划新技术,所以总体上我们还是致力于做客观定量城市研究工作。

 

(本文原文由清华同衡整理)