这份数据一共有 45 列,其中第一列为空字段名索引列,通常是导出 CSV 时自动写入的行号,并不是业务字段,建模或分析前建议删除。真正有价值的业务字段包括:
1️⃣ 房源基础信息小区名称、区域位置、经度、纬度、房屋户型、所在楼层、建筑面积、建筑类型、房屋朝向、建筑结构、装修情况、梯户比例、配备电梯等。
2️⃣ 价格与交易信息总价、单价、挂牌时间、交易权属、上次交易、房屋用途、房屋年限、产权所属、抵押信息、房本备件等。
3️⃣ 文本描述信息核心卖点、小区介绍、适宜人群、周边配套、户型介绍、装修描述、税费解析、权属抵押、售房详情、交通出行等。
这些字段使得数据不只适合做简单统计,还可以延伸到机器学习建模、自然语言处理和推荐系统练习。