数据分析学习记录-----DAY2
6.查看牛客网哪些用户使用Python:
df['Language']=='Python'返回的是判断,即每一列的language是否是python,返回true/false
返回python的整列的时候则要df[df['Language']=='Python']
n=Nowcoder['Language']=='Python' #n理解为判断为true的index
print(Nowcoder.loc[n,:]) #通过index找到对应的列
7.牛客网Python用户的成就值:
Nowcoder[Nowcoder['Language'] == 'Python']参照上题为language为Python的所有行信息
Nowcoder[Nowcoder['Language'] == 'Python']['Achievement_value']从这些行中,提取出'Achievement_value'这一列所在的位置信息
(df['Achievement_value']代表的是这一列的所有数据信息,不包含名称)
8.文件最后用户的部分数据:
data.iloc[-5:][['Nowcoder_ID', 'Level', 'Achievement_value', 'Language']]
!!多列是2个中括号
或者:df.iloc[-5:,[0,1,2,5]]
9.2020年毕业的人中最喜欢用Java的用户:
query查询:df.query("一组销量 > 二组销量")
p.s. dtype=object前面似乎说是防止将日期解析为小数???
pd.set_option:
pd.set_option('display.max_rows',20000) #20000代表你想展示的行数
pd.set_option('display.precision', 2) #展示两位小数点
# 可以用于格式化任何浮点列 设置数字精度
pd.set_option('display.float_format','{:.3f}'.format) #设置3位小数
pd.set_option('display.max_columns', None)# 显示所有的列,而不是以……显示
pd.set_option('display.max_rows', None)# 显示所有的行,而不是以……显示
pd.set_option('display.width', None) # 不自动换行显示