2021-10-25 17:03 已编辑滴滴_测试开发工程师

关注

基于基站定位数据的商圈分析

数据集链接: https://pan.baidu.com/s/1lYtcc2zlk07Cv9fnto99DA 提取码: sy92
去除冗余属性以及数据离差标准化

#-*- coding: utf-8 -*-
#数据标准化到[0,1]
import pandas as pd

#参数初始化
filename = 'D:/下载/data/input/business_circle.xls' #原始数据文件
standardizedfile = 'D:/下载/data/output/standardized.xls' #标准化后数据保存路径

data = pd.read_excel(filename, index_col = u'基站编号') #读取数据

data = (data - data.min())/(data.max() - data.min()) #离差标准化
data = data.reset_index()

data.to_excel(standardizedfile, index = False) #保存结果

模型构建并画出谱系聚类图

#-*- coding: utf-8 -*-
#谱系聚类图
import pandas as pd

#参数初始化
standardizedfile = 'D:/下载/data/input/standardized.xls' #标准化后的数据文件
data = pd.read_excel(standardizedfile, index_col = u'基站编号') #读取数据

import matplotlib.pyplot as plt
from scipy.cluster.hierarchy import linkage,dendrogram
#这里使用scipy的层次聚类函数

Z = linkage(data, method = 'ward', metric = 'euclidean') #谱系聚类图
P = dendrogram(Z, 0) #画谱系聚类图
plt.show()

采用层次聚类算法分析数据

#-*- coding: utf-8 -*-
#层次聚类算法
import pandas as pd

#参数初始化
standardizedfile = 'D:/下载/data/input/standardized.xls' #标准化后的数据文件
k = 3 #聚类数
data = pd.read_excel(standardizedfile, index_col = u'基站编号') #读取数据

from sklearn.cluster import AgglomerativeClustering #导入sklearn的层次聚类函数
model = AgglomerativeClustering(n_clusters = k, linkage = 'ward')
model.fit(data) #训练模型

#详细输出原始数据及其类别
r = pd.concat([data, pd.Series(model.labels_, index = data.index)], axis = 1)  #详细输出每个样本对应的类别
r.columns = list(data.columns) + [u'聚类类别'] #重命名表头

import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False #用来正常显示负号

style = ['ro-', 'go-', 'bo-']
xlabels = [u'工作日人均停留时间', u'凌晨人均停留时间', u'周末人均停留时间', u'日均人流量']
pic_output = 'D:/下载/data/output/type_' #聚类图文件名前缀

for i in range(k): #逐一作图，作出不同样式
  plt.figure()
  tmp = r[r[u'聚类类别'] == i].iloc[:,:4] #提取每一类
  for j in range(len(tmp)):
    plt.plot(range(1, 5), tmp.iloc[j], style[i])
  
  plt.xticks(range(1, 5), xlabels, rotation = 20) #坐标标签
  plt.title(u'商圈类别%s' %(i+1)) #我们计数习惯从1开始
  plt.subplots_adjust(bottom=0.15) #调整底部
  plt.savefig(u'%s%s.png' %(pic_output, i+1)) #保存图片

全部评论

推荐最新楼层

04-14 20:50

已编辑

华南师范大学 Java

27暑期腾讯-微信支付

一面八股？ MongoDB是不是关系式的场景题数据库 面对一亿个用户存储场景应如何设计存储结构？ 在上述存储设计中，如果存储用户密码，会如何考虑和设计，尤其需要考虑哪些安全问题。此处特别举例讨论了如果攻击者获取数据库权限后，通过复制加密密码来冒用他人账户的场景，询问如何防范？ 询问在MySQL中，当数据量达到几百万条时，使用limit分页查询到1万页以后是否还能高效执行，以及原因。计算机网络 询问在浏览器输入一个域名后，请求是如何一步步到达服务器的，以及服务器IP是否会直接对外暴露java中的集合 询问Java中hashmap的扩容机制，特别是在扩容过程中如何处理并发读写的问题一面强度太大了，...

查看6道真题和解析

点赞评论收藏

分享

04-09 16:19

上海交通大学游戏后端

秋招失利别慌，好offer不怕晚

大家好，我是25届985硕。记得当时秋招结束后，我把自己关在宿舍整整三天。因为投递得晚，很多公司都已经招满了。简历投了40多家，面试了七八轮，最终全军覆没。室友们陆续拿到offer，只有我还在刷招聘软件，那种焦虑和挫败感，相信现在正在准备春招的你一定懂。 当时我甚至开始怀疑，是不是自己真的不行。但后来我明白了一件事：秋招失利不代表终点，好offer不怕晚。 转机出现在次年2月底，我在牛客上刷到巨人网络的春招信息。因为我一直很喜欢游戏，算是《太空杀》的忠实玩家，就想着投递游戏开发试试看。没想到，7天内收到了笔试邀约，然后很快收到了邀请到巨人网络园区面试，当天把所有面试流程走完，也顺利拿到了off...

ros275229：秋招结束可以等春招，问题是现在春招都要结束了

巨人网络成长空间 113人发布

点赞评论收藏

分享

03-07 20:50

中国科学技术大学 Java

今年字节实习来了波大的

刚刷到字节跳动官方发的消息，确实被这波阵仗吓了一跳。在大家还在纠结今年行情是不是又“寒冬”的时候，字节直接甩出了史上规模最大的转正实习计划——ByteIntern。咱们直接看几个最硬的数，别被花里胡哨的宣传词绕晕了。首先是“量大”。全球招7000多人是什么概念？这几乎是把很多中型互联网公司的总人数都给招进来了。最关键的是，这次的资源分配非常精准：研发岗给了4800多个Offer，占比直接超过六成。说白了，字节今年还是要死磕技术，尤其是产品和AI领域，这对于咱们写代码的同学来说，绝对是今年最厚的一块肥肉。其次是大家最关心的“转正率”。官方直接白纸黑字写了：整体转正率超过50%。这意味着只要你进去了，不划水、正常干，每两个人里就有一个能直接拿校招Offer。对于2027届（2026年9月到2027年8月毕业）的同学来说，这不仅是实习，这简直就是通往大厂的快捷通道。不过，我也得泼盆冷水。坑位多，不代表门槛低。字节的实习面试出了名的爱考算法和工程实操，尤其是今年重点倾斜AI方向，如果你简历里有和AI相关的项目，优势还是有的。而且，转正率50%也意味着剩下那50%的人是陪跑的，进去之后的考核压力肯定不小。一句话总结： 27届的兄弟们，别犹豫了。今年字节这是铁了心要抢提前批的人才，现在投递就是占坑。与其等到明年秋招去千军万马挤独木桥，不如现在进去先占个工位，把转正名额攥在手里。

喵_coding：别逗了 50%转正率仔细想想就是转正与不转正

字节7000实习来了，你...

点赞评论收藏

分享

04-04 11:52

已编辑

北京邮电大学 Java

27后端简历求锐评

最近才准备开始投，没实习，八股只看了一点点形势有点严峻😇

你的简历改到第几版了

点赞评论收藏

分享

04-14 02:08

University of Auckland 人力资源专员/助理

26届硕士找不到工作

给26届的秋招建议

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 有哪些公司在面试时考察AICoding？ #

9868次浏览 200人参与

# 你认为小厂实习有用吗？ #

137682次浏览 745人参与

# 厦门银行科技岗值不值得投 #

24422次浏览 511人参与

# HR面都在聊什么？ #

7886次浏览 91人参与

# 如何快速融入团队？ #

48105次浏览 301人参与

# 父母问你工作找得怎么样，怎么回 #

16301次浏览 195人参与

# AI“智障”时刻 #

35077次浏览 155人参与

# 找工作如何保持松弛感？ #

137020次浏览 1469人参与

# AI时代还有必要刷leetcode吗？ #

6926次浏览 113人参与

# 想从事Agent应该学习哪些技术？ #

4325次浏览 141人参与

# 那些我实习了才知道的事 #

286893次浏览 1810人参与

# 什么人最适合大厂？ #

8618次浏览 85人参与

# 哪些公司面试还在问八股？ #

8757次浏览 85人参与

# 从投递到OC，你用了多久 #

15341次浏览 137人参与

# 顺丰求职进展汇总 #

84451次浏览 362人参与

# 查收我的offer竞争力报告 #

292656次浏览 1738人参与

# 如果没找到工作，考公是你的退路吗 #

70615次浏览 458人参与

# 双非本科的出路是什么？ #

227743次浏览 1651人参与

# 哪一刻你突然觉得实习“有点值了” #

9137次浏览 74人参与

# 我的求职进度条 #

1038659次浏览 7131人参与

# 秋招踩过的“雷”，希望你别再踩 #

196286次浏览 1752人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务