其实地产大数据这个话题在行业里面已经是非常热的一个概念。中国指数研究院其实只是刚刚开始在做一些工作,应该说我们是这个行业的小学生,因为我看到今天后面的这些演讲嘉宾,包括清华同衡,其实在大数据这个领域做的非常不错,也是我们的学习对象。所以,今天我也是抱着学习的态度来参加这个会。
其实地产大数据这个话题在行业里面已经是非常热的一个概念。中国指数研究院其实只是刚刚开始在做一些工作,应该说我们是这个行业的小学生,因为我看到今天后面的这些演讲嘉宾,包括清华同衡,其实在大数据这个领域做的非常不错,也是我们的学习对象。所以,今天我也是抱着学习的态度来参加这个会。
虽然今天我们这个会场人不多,我估计如果我们改一个话题,比如说这个时候是否该买房,可能其他会场人都会聚到这个会场来了。但是,我想分享的东西也是把我们现在在做的一些事情,然后包括在大数据方面做的一些探索跟大家做一个分享。因为我们跟其他几家不一样,在做真正的大数据的整合,比如说外部数据、人口数据、交通流量的数据、气象的数据等等做整合和应用。我们其实是把体系内部的数据,通过业务运营的这种数据做了内部的这种大数据应用现在更多一点,我们也在积极探索外部的数据整合,也希望在接下来的时间能够跟行业里的这些同仁一块来探索,怎么样去为地产这个行业做大数据的应用。
首先,简单介绍一下中指,中指在房地产这个领域,因为我们是做中国房地产系统起家的,1994年就开始做,因为要做中国房地产指数系统,我们其实从2000年开始就搭建了数据库,是房地产专业领域的数据库,所以这块也在为行业提供相应的服务。
经过20多年的发展,我们也有500多位行业的专业分析师来为行业做研究的服务,同时我们有600多个城市的房地产的数据系统。这个数据系统其实很早就已经开始为行业做应用了,目前国内的房地产的开发企业,国内的这些金融机构,包括银行、券商、投资公司、证券,然后资管公司,以及国外的一些投行等等都是我们的房地产数据系统的用户。
因为他们要研究中国的房地产市场必须需要基础数据的支持,我们在这方面为他们提供了相应的数据支持服务。另外,我们为政府部门提供多方面的行业研究,尤其是最近房地产政策频出,这是大家非常关心的问题,包括北京最近商住的限购等等其实引发了很大的社会关注。其实我百分之七八十的时间在做房地产市场的交流,最近包括我们跟一些机构办了有20多场的市场形势的交流,有机会我们可以在这方面多做一些沟通。
再介绍一下房天下,我说一下我们之间的关系。其实房天下是目前房地产领域互联网的专业平台,我们覆盖了新房、二手房、租房、金融、家居,以及研究的全产业链的业务。几个数字,一个是在去年中国互联网百强企业中排名16位,房地产互联网行业排名第一。房天下是1999年成立的,2010年9月在纽交所上市,中国指数研究院是房天下控股的研究集团,我们主要是为B端提供行业研究这个相应的服务,我们也是和房天下控股一起在2010年9月在纽交所上市。
这个关系就是说,我们其他的几个集团,包括新房、二手房、家居,以及金融都是基于房天下的网络平台做它的业务。而我们现在运用的所有的数据,很大一部分都是基于房天下的顶层数据,顶层数据其实围绕的是房和人这两个数据来为行业提供服务的。研究院是在这个基础上做B端的数据平台,为B端客户提供行业研究的服务,所以这是为什么我既是指数研究院的副总裁,又是房天下中心的总经理。所以我们做应用的时候是用了整个底层数据来做这个内容。
数据基础其实是来源于我们自身的业务,这个自身的业务包含了我们新房,二手房的研究,金融和家居业务,而我们这块的业务从原来搜房网房天下一直做媒体平台,2014年之前一直做媒体平台,2014年之后,我们还做交易平台和金融平台,来为这个行业提供交易平台的服务。也是因为这个业务的转型,我们从数据的角度上来讲,除了原来我们只做比如楼盘的基础信息,我们下层为交易提供服务,为经纪人提供交易平台的服务,所以这样形成我们自己房屋的交易的一个闭环。
所以,今天为什么我题目里面重点说的是叫“房地产互联网化”,这个互联网化除了我们原来的媒体平台的属性,我们现在一直在提倡交易平台的属性。也就是说,把房屋的,特别新房、二手房买卖的交易环节搬到线上了,为这个买房人和卖房人提供交易环节的线上服务,这样我们会积累出更多的跟房屋相关的数据,而且这个数据是非常鲜货的。所以,我们在这个基础上形成了我们的数据系统,然后这个数据系统,从我们产品的角度上来讲,我们做了一些应用,服务于我们的B端客户,就是机构客户。另外,最主要服务于我们C端的客户,也就是普通的购房者。
下面,我就把我们这个房天下,包括我们中指数据当中三个部分的数据给大家做一个分享,我们做了一些应用。
土地大数据,很多行业里面人在做地理信息数据,我这边的数据是我们16年以来积累的2300多个城市所有的土地的信息数据,国家在2004年831之后要求所有的商业用地进行招牌挂,从那时候开始我们把每一宗地都进到我们的系统里面,然后实时监测全国所有的土地信息的推出和成交的衡量。而且在我们的数据里面,其实我们是会跟踪这块地,它从土地开始一直变到项目,然后项目的情况,以及拿这个地的企业的情况做地块项目和企业的三级联动。这个数据我们现在在数据库当中已经有超过70万宗的土地数据,也是目前国内商业领域,除了国土资源部以外,国内商业领域我们的土地数据是非常全面的。
土地信息这块我们其实也做了一些,除了一些招牌挂的基本信息之外,其实我们也会把,比如说在重点城市,我们有所有这些土地的标书,就是招标的文件信息,因为这个如果做地产,土地的文件信息其实是会更加详细的。另外,我们在今年开始对重点的一些地块做航拍的处理,让它尽量的可视化,关于地产的可视化的这个部分的工作,这样也会为我们用户去更加清晰的来判断这个地块周边的一些情况做一些相应的工作。
在这个基础之上,其实在四五年前开始,我们就在想怎么样去帮地产行业解决拿地的问题。我们传统的比如从评估领域的角度上来讲,我们都会对一个地块做土地价值评估,但是原来的土地价值评估的模型解决不了这个问题,也就是说现在这个行业里面出现的面粉与面包汇的情况,无论从假设开发法,还是从市场比较法,从评估领域的方法来讲,你对一个地块的价值到底是一个什么样的,你是很难去,你算算价格永远比市场价要低多很多。这种问题到底怎么去解决,其实我们一直在想。
所以,我们后来发现城市,其实很多开发商原来在拿地的时候更考虑是未来能给他带来的价值,说的好听点就是判断一个城市价值对开发商的未来的收益的影响。说话用土话说就是要赌一把土地,基本上在北京赌的基本都赌对了,一个是判断城市。
另外,不同的企业对土地价值的认识肯定也是不一样的。所以,我们会融合更多的城市的数据和企业的数据来判断,就是如果是一个优秀的房地产开发企业,在一个潜力的城市对一个地块是会有一个什么样的判断?然后去做这样一个模型。这个四五年以前就已经在我们系统里面为用户提供服务了,会比原来传统的这个系统要更加靠谱一点。但是,说句实话,这个模型现在在北京也不靠谱,应该是昨天,北京刚刚开了两块地,台湖一块地,1.7万,全部自住房,但是要求的统一售价是两万块钱,然后这个密云也拍了一块地,也是竞争激烈,基本上所有的商品房面积差不多被记成自住房的面积,剩下可能就是一万多平纯商品房的面积,而且价格很高。
出现这种情况,就是现在在地产这个领域对于土地这个价值的认识其实在有些城市已经超出了这个项目本身,它不仅仅是这个项目本身能带来多少收益,带来多少利润,可能对于大企业来讲,关心的是整个一盘棋里面我能带来多少的销售规模。一个项目的销售规模对整个企业来讲是至关重要的,因为我们知道行业的变革是在快速的发生变化,行业集中度是在提高的,规模称王。也就是你有规模,你的资金成本更低,你在其他城市拿地的受欢迎程度更高,政府也愿意跟你合作。所以,它必须要出于其他方面的目的来获得一线城市的土地。所以,可能就要完全脱离于这个现有的这种模型来算单个地块的价值。
所以,在土地这个方面,我们也做了一些探索,现在一些模型也是在开发商,包括一些金融机构去用。我们也通过这个系统其实是提示金融机构和地产商关于土地的风险问题,就是这次行业的政策的调整其实政府是下了很大力度的,首先是必须管,第二是肯定要关注。所以,现在在高价拿地的企业,在很多城市我们都还是提示企业要非常谨慎的,这是土地方面的一个应用。
说一下房产数据,房产数据也是房天下看家的东西,我们有两个大的核心的数据库,一个是基于楼盘的数据库,就是以小区为单位,包括楼盘的位置,开发商、物业配套等等这些情况,这些东西基本上都是开放的,相信现在很多大中型公司也在用我们的数据做一些分析。
另外,房源数据,是到每个房屋的信息。比如说,在北京、上海这些大的城市,我们现在已经基本上做到对所有小区,就是这个不仅是新房,包括二手房的、存量房的小区,它的小区内有多少栋楼,每栋楼有多少单元,每个单元有多少户,然后这个户的面积是多少,朝向是什么样子,楼层是怎么样的,在数据库里都做了底层的数据,形成我们底层的房源的数据库。
为什么要做这么细?其实也是为我们的交易平台去做服务的。比如说,将来怎么去解决,因为我们的交易平台将来要开放给外部经纪人在使用,所以我们必须有一个真实房源的顶层数据。基于这个数据,其实我们来构建我们为B端和C端的用户服务。我们在这些数据方面的运用其实就有了一些自己的尝试。楼盘数据的内容,就是楼盘数据库,我们大概覆盖了全国442个城市,覆盖的新房大概有16万个,二手房楼盘大概有6万多个。这是现在的一个北京的房价分布图,这个不是点,是每个小区边界所构成的。每个小区其实都把它从边界的角度全部在地图上标注出来,同时在底层数据库里面,这个小区是可以放大到楼栋的,楼栋可以点进去看单元和房号。比如百度POI,现在也在做小区边界,或者说楼栋的命名,但是他里面的数据没有,我们是把里面的数据都做进去,每一套房屋又通过我们的系统做实时的构架,构架完之后,是北京市房价的分布图,这是上海的,红色是单价超过8万的楼盘的分布情况,所以这是从楼盘数据库的角度。
房源数据库,我们现在大概做了28个城市,有6500万户的户数据。北京我们现在大概有600多万,上海大概有700多万,到单户的数据,不完全覆盖,但是市场上主流的,或者80%到90%的存量房的房源数据都已经在这个数据库里面做了相应的记录。
除了这个之外,我们还会有一些动态的数据,比如成交案例,比如说挂牌的案例,这些案例其实是构成了我们后边会说我们基于这些数据来做的一个估价模型,为B端和C端房屋提供实时房屋估值。这是一个案例,房屋动态和静态是不是有一些信息,对每栋楼都会有相应的标注,比如小区的信息到楼栋,到单元,到房号是静态数据,动态数据就是状态,处在挂牌,还是成交,还是租赁,价格是成交价、租赁价,或者挂牌价,等等这些情况。另外,通过我们平台完成交易的买房和卖房在我们底层数据都存的。这个很有意思,不一定北京市所有的成交都在里面有,但是我存的量足够我分析市场上交易人的行为,就是卖房人的行为和买房人的行为,这个我们其实是可以做很多相关研究的。
后面是两个动图,是北京30年楼盘变迁的过程,我们拿每一栋房屋建成年代算的,可以看到北京逐步外扩的过程,现在存量房到一个什么样的状态。这个是上海的,这是30年的楼市的变迁,它的存量房逐步的在扩大,这是我们看到顶层数据映射在地图上的结果。
我们说一个应用,其实只是这个底层房源数据应用的一个方面,这个就是说,基于我们的底层数据,我们原来有一个估价模型,我们在前面开始,我们跟清华一起,对我们的评估模型做了提升,运用到了一些算法构建我们的系统,也是用大数据选样的方式,通过这个为社会提供房地产估值。这个模型不介绍了。
从应用方面有几个方面,尤其对金融机构,银行,所有人买二手房,银行给你一个估值,是你可以在银行贷款的估值,有这样一个依据,原来所有都是传统方式,比如找一个估价公司去现场勘,勘完之后给出一个现场估值,然后再按照这个估值进行贷款,现在估值是可以通过大数据的方式解决的。我们为金融机构提供在线估值的系统,他们可以快速对一个房子做快速的评估,而且不受人为因素的干扰,不可能说这个房子你给我们高估一点,可能市场的估值是怎样就是怎样的,同时我们提高效率,这个可以运用于金融机构的贷前也可以应用于贷后,贷后就是帮助金融机构去防范风险,也就是我历史上所有的抵押物都可以做一轮的价值复估,了解现在这个房产的抵押物在市场上的风险,这个其实是为B端客户去提供的。
另外,C端,这个应用在我们房天下,无论是APP端,还是PC端都看到了,可以为房子做一个快速的评估,或者你想买一个房子做一个快速的评估。这是从房屋角度的一个应用。
另外,就是用户。其实用户的数据,其实这个用户量,我们从大的用户量上来讲,可能我们这还是小的,为什么?因为比如说像三大运营商的数据等等,或者说像银联的数据,是非常大范围的数据,而我们的用户数据是基于房天下的,也就是三端的客户,PC端,APP端和Web端三端的客户,现在无线端已经占到房天下整个流量的60%,大概我们现在有1.5亿APP的装机量。我们可能有一个好处是,这些用户基本上都是来看房子的,同时他的轨迹其实是对房屋的需求,比如想看什么样的区位,什么样的总价,什么户型的房子,或者想看二手房,还是新房,这些信息都会来在我们数据库里。同时,我们通过分析他的位置,判断他的居住地和工作地,这个对研究房地产非常有用处。还有用户通过我们平台直接去想买二手房,或者看新房,可以直接做预约。通过这个形成我们体系内部的用户大数据,这个用户的大数据,就是说我们现在大概每天会记录14亿用户数据的行为,这个量其实是很庞大的,我们也一直在考虑怎么样运用,我们现在的运用应该说还是一个比较初步的应用,将来我们在这方面也需要做很大的挖掘。
我们会把我们的活跃用户,这是一个活跃用户的热点分布图,我们可以了解用户在居住和办公地不同的位置,我们会通过一个算法去算他工作在什么地方和居住在什么地方,这个便于我们一方面是,比如我们可以告诉他,在CBD工作的人喜欢望京的房子,还是喜欢亦庄的房子,还是喜欢通州的房子,我们可以通过这些做一些相应的分析。然后,用户访问的时间,从我们的APP来讲比较集中在十点,比如晚上十点是一个高峰点。
通过用户数据我们也会看到政策对于市场的这些影响,就是各个城市,因为限购、限贷的政策,我们可以看到用户访问我们网站,特别是楼盘,无论是新房、二手房的一些变化,能够去实时反映政策的效果的影响。包括最近的政策,其实很明显,我相信这个市场未来可能会有一个速冻的过程。
在用户数据的应用,其实我们做的更多是为C端客户做的一些相应的应用,B端的客户我们现在也在做一些用户数据的应用的开发,未来我们也会面向B端客户去提供。首先,因为我有了这个用户的数据,所以当我们的客户,就是C端客户在房天下上做房屋交易的过程,我们把交易的过程逐步的全流程化管理放到线上记录用户交易行为的过程。
除了这个之外,我们还会有一些动态的数据,比如成交案例,比如说挂牌的案例,这些案例其实是构成了我们后边会说我们基于这些数据来做的一个估价模型,为B端和C端房屋提供实时房屋估值。这是一个案例,房屋动态和静态是不是有一些信息,对每栋楼都会有相应的标注,比如小区的信息到楼栋,到单元,到房号是静态数据,动态数据就是状态,处在挂牌,还是成交,还是租赁,价格是成交价、租赁价,或者挂牌价,等等这些情况。另外,通过我们平台完成交易的买房和卖房在我们底层数据都存的。这个很有意思,不一定北京市所有的成交都在里面有,但是我存的量足够我分析市场上交易人的行为,就是卖房人的行为和买房人的行为,这个我们其实是可以做很多相关研究的。
后面是两个动图,是北京30年楼盘变迁的过程,我们拿每一栋房屋建成年代算的,可以看到北京逐步外扩的过程,现在存量房到一个什么样的状态。这个是上海的,这是30年的楼市的变迁,它的存量房逐步的在扩大,这是我们看到顶层数据映射在地图上的结果。
我们说一个应用,其实只是这个底层房源数据应用的一个方面,这个就是说,基于我们的底层数据,我们原来有一个估价模型,我们在前面开始,我们跟清华一起,对我们的评估模型做了提升,运用到了一些算法构建我们的系统,也是用大数据选样的方式,通过这个为社会提供房地产估值。这个模型不介绍了。
从应用方面有几个方面,尤其对金融机构,银行,所有人买二手房,银行给你一个估值,是你可以在银行贷款的估值,有这样一个依据,原来所有都是传统方式,比如找一个估价公司去现场勘,勘完之后给出一个现场估值,然后再按照这个估值进行贷款,现在估值是可以通过大数据的方式解决的。我们为金融机构提供在线估值的系统,他们可以快速对一个房子做快速的评估,而且不受人为因素的干扰,不可能说这个房子你给我们高估一点,可能市场的估值是怎样就是怎样的,同时我们提高效率,这个可以运用于金融机构的贷前也可以应用于贷后,贷后就是帮助金融机构去防范风险,也就是我历史上所有的抵押物都可以做一轮的价值复估,了解现在这个房产的抵押物在市场上的风险,这个其实是为B端客户去提供的。
另外,C端,这个应用在我们房天下,无论是APP端,还是PC端都看到了,可以为房子做一个快速的评估,或者你想买一个房子做一个快速的评估。这是从房屋角度的一个应用。
另外,就是用户。其实用户的数据,其实这个用户量,我们从大的用户量上来讲,可能我们这还是小的,为什么?因为比如说像三大运营商的数据等等,或者说像银联的数据,是非常大范围的数据,而我们的用户数据是基于房天下的,也就是三端的客户,PC端,APP端和Web端三端的客户,现在无线端已经占到房天下整个流量的60%,大概我们现在有1.5亿APP的装机量。我们可能有一个好处是,这些用户基本上都是来看房子的,同时他的轨迹其实是对房屋的需求,比如想看什么样的区位,什么样的总价,什么户型的房子,或者想看二手房,还是新房,这些信息都会来在我们数据库里。同时,我们通过分析他的位置,判断他的居住地和工作地,这个对研究房地产非常有用处。还有用户通过我们平台直接去想买二手房,或者看新房,可以直接做预约。通过这个形成我们体系内部的用户大数据,这个用户的大数据,就是说我们现在大概每天会记录14亿用户数据的行为,这个量其实是很庞大的,我们也一直在考虑怎么样运用,我们现在的运用应该说还是一个比较初步的应用,将来我们在这方面也需要做很大的挖掘。
我们会把我们的活跃用户,这是一个活跃用户的热点分布图,我们可以了解用户在居住和办公地不同的位置,我们会通过一个算法去算他工作在什么地方和居住在什么地方,这个便于我们一方面是,比如我们可以告诉他,在CBD工作的人喜欢望京的房子,还是喜欢亦庄的房子,还是喜欢通州的房子,我们可以通过这些做一些相应的分析。然后,用户访问的时间,从我们的APP来讲比较集中在十点,比如晚上十点是一个高峰点。
通过用户数据我们也会看到政策对于市场的这些影响,就是各个城市,因为限购、限贷的政策,我们可以看到用户访问我们网站,特别是楼盘,无论是新房、二手房的一些变化,能够去实时反映政策的效果的影响。包括最近的政策,其实很明显,我相信这个市场未来可能会有一个速冻的过程。
在用户数据的应用,其实我们做的更多是为C端客户做的一些相应的应用,B端的客户我们现在也在做一些用户数据的应用的开发,未来我们也会面向B端客户去提供。首先,因为我有了这个用户的数据,所以当我们的客户,就是C端客户在房天下上做房屋交易的过程,我们把交易的过程逐步的全流程化管理放到线上记录用户交易行为的过程。
买房定制,就是你在房天下的行为轨迹,我们也好,包括一些电商网站也好,也在做这个方面的事,其实逻辑是一样的,就是你关注我什么,我记录下你的关注行为之后,将来你再来上的时候,我首先推荐给你的是同类似的,比如同区位,同价位,或者同总价的新房和二手房,根据你的工作地,根据你的经济状况和喜好来向你推荐相应的房源。
卖房就是我们会为用户,其实我们估价系统就是做的这些应用,你所在的小区它的成交价格的参考,自身的房源竞争力的分析,包括你在线的房源的管理和调价都可以在APP上完成,为卖房人提供相应的服务。
租房定制,我们从租房这个角度,会根据用户的情况,他的信用等级等等给予相应的一些,比如说免押金,或者是无条件续约,见面一部分租金等等这种方式,为这个用户提供相应的优惠,这些都是基于我们对用户的分析和判断来做的。
另一方面,基于把我们所有的找房、买房完成交易的整个过程都在线上进行完成,也就是你可以定制整个看房安排过程,以及交易当中,所有的辅助交易,包括整个交易流程,贷款的审批和合同的备案等等这些方式都可以在我们线上去做。通过这些方式,我们来为用户提供一整套的线上服务。
然后,这个就是说未来我们可以基于这些用户行为数据做更多的事情,应该说我们的应用,在大数据方面的应用也是刚刚开始。所以,今天也是很想听听各位专家在大数据领域的应用,有机会我相信我们可以一起合作来做一些事情。
我想有很多人在说预测,其实我感觉接下来大数据是让这个市场更加透明,让大家对于房地产的了解,或者对于信息的了解更加透彻。我们也希望在这些方面能为行业,或者能为普通消费者做一些我们力所能及的事。谢谢大家!
浏览4041次
浏览11236次
浏览5220次
浏览9395次
浏览4110次
浏览5913次
2025-01-08 昆明
2025-04-19 南京
2024-12-27 上海
2025-10-23 上海
打开微信扫一扫,分享到朋友圈