Pandas的数据结构之Series

pandas纳入了大量库和一些标准的数据类型,提供了高效的操作数据集所需的工具,pandas提供了大量能使我们快速便捷的处理数据的函数和方法,它使Python成为强大而高效的数据分析环境的重要元素之一。

Series

Series 是一种类似于一维数组的对象,由下面的两部分组成:
values: 一组数据(ndarray类型)。
index: 相关的数据索引标签。

import pandas as pd
from pandas import Series
import numpy as np

nd = np.array([1, 2, 3])
print(nd)    # [1 2 3]

# Series的创建 有两种创建方式:
# 1)由列表或numpy数组创建 默认索引为0到N-1的整数型索引
s = Series(nd)
print(s)

s.index = list("abc")
print(s)

s1 = Series(nd, index=["张三", "李四", "王五"])
print(s1)

# Data must be 1-dimensional Series中存放的数据必须是一维的
# s2 = Series(np.random.randint(0, 10, size=(5,2)), index=list("abcde"))
''' 特别地,由ndarray创建的是引用,而不是副本。对Series元素的改变也会改变远啦的ndarray对象中的元素。 列表中没有这种情况 '''

# 2)由字典创建
s2 = Series({
  "name": "林雪", "age": 18, "gender": True, "address": "湖北武汉"})
print(s2)

'''练习:使用多种方法创建以下series,命名为s1:语文150,数学150,英语150,理综300 '''
nd = np.array([150, 150, 150, 300])
s1 = Series(nd, index=["语文", "数学", "英语", "理综"])
print(s1)

s1 = Series({
  "语文": 150, "数学": 150, "英语": 150, "理综": 300})
print(s1)


# Series的索引和切片
''' 可以使用中括号取单个索引(此时返回的是元素类型),或者中括号里一个列表取多个索引(此时返回的仍然是 一个Series类型)。分为显示索引和隐式索引: (1)显式索引: ---使用index中的元素作为索引值 ---使用.loc[](推荐) 注意:此时是闭区间 '''
s = Series(np.random.random(10), index=list("abcdefghij"))
print(s)
print(s["d"])
print(s[3])   # 可以使用index和整数来进行查找
# 显式索引
print(s.loc["e"])  # 而loc[]中不可以使用整数来进行查找
# 进行切片
print(s.loc["a":"f"])
print(s[0:6])

'''(2)隐式索引: ---使用整数作为索引值 ---使用.iloc[](推荐) 注意:此时是半开区间 '''
# 隐式索引,可以直接使用数字来进行操作
print(s.iloc[4])

# Series的基本概念
'''可以把Series看成一个定长的有序字典,可以通过shape,size,index,values等得到series的属性 '''
# Series.values,就是一个ndarray包含关系,升级的关系,有了索引之后更加的方便
print(s.shape, s.size, s.index, s.values)  # 维数、长度、索引、索引值

# 可以通过head(),tail()快速查看Series对象的样式
df = pd.read_csv("winequality-red.csv")  # df == DataFrame
print(df)
print(type(df))
print(df.head(5))
print(df.tail(5))

# 当索引没有对应的值时,可以出现缺失数据显示NaN(not a number)的情况
s = Series([25, 26, None, np.nan], index=list("them"))
print(s)
print(s.sum())

# 可以使用pd.isnull(),pd.notnull(),或自带isnull(),notnull()函数检测缺失数据
print(s.isnull())
print(s.notnull())
print(s[s.notnull()]) # 如果数据为真,则提取出来

# Series对象本身及其实例都有一个name属性,作用:name用于区分,在DataFrame中,主要是列名
s.name = "Python"
print(s)

# Series的运算
# (1)适用于numpy的数组运算也适用于Series
print(s+5)
# 在进行算术运算时,如果包含Nan,那么fill_value默认将Nan设置为等号(=)后面的值
print(s.add(5, fill_value=0))

# (2)Series之间的运算
''' 在运算中自动对齐不同索引的数据,如果索引不对应,则补NaN '''
s1 = Series([2, 3, 4, 5], index=[0, 1, 2, 3])
s2 = Series([5, 6, 7, 8], index=[2, 3, 4, 5])
# Series索引值,进行相加时,索引相同进行相加
print(s1 + s2)

# 注意:想要保留所有的index,则需要使用.add()函数
print(s1.add(s2, fill_value=0))

nd = np.array([[1, 2, np.nan]])
# ndarray中如果有nan,没有办法进行操作
print(nd.sum())
全部评论

相关推荐

02-25 09:55
已编辑
门头沟学院 Java
2.4 一面2.6 二面2.9 三面(hr面)2.13 oc1.15号收到面试电话那会就开始准备,因为一开始没底所以选择推迟一段时间面试,之后开始准备八股,准备实习可能会问的东西,这期间hot100过了有六七遍,真的是做吐了快,八股也是背了忘,忘了背,面经也看了很多,虽然最后用上的只有几道题,可是谁知道会问什么呢自从大二上开始学java以来,一开始做外卖,点评,学微服务,大二下五六月时,开始投简历,哎,投了一千份了无音讯,开始怀疑自己(虽然能力确实很一般),后来去到一家小小厂,但是并不能学到什么东西,而且很多东西都很不规范,没待多久便离开,大二暑假基本上摆烂很怀疑自己,大三上因为某些原因开始继续学,期间也受到一俩个中小厂的offer,不过学校不知道为啥又不允许中小厂实习只允许大厂加上待遇不太好所以也没去,感觉自己后端能力很一般,于是便打算转战测开,学习了一些比较简单的测试理论(没有很深入的学),然后十二月又开始继续投,java和测开都投,不过好像并没有几个面试,有点打击不过并没有放弃心里还是想争一口气,一月初因为学校事比较多加上考试便有几天没有继续投,10号放假后便继续,想着放假应该很多人辞职可能机会大一点,直到接到字节的面试,心里挺激动的,总算有大厂面试了,虽然很开心,但同时压力也很大,心里真的很想很想很想进,一面前几天晚上都睡不好觉,基本上都是二三点睡六七点醒了,一面三十几分钟结束,问的都不太难,而且面试官人挺好但是有些问题问的很刁钻问到了测试的一些思想并不是理论,我不太了解这方面,但是也会给我讲一讲他的理解,但是面完很伤心觉得自己要挂了。但是幸运的是一面过了(感谢面试官),两天后二面,问的同样不算难,手撕也比较简单,但也有一两个没答出来,面试官人很好并没有追问,因为是周五进行的二面,没有立即出结果,等到周一才通知到过了,很煎熬的两天,根本睡不好,好在下周一终于通知二面过了(感谢面试官),然后约第二天三面,听别的字节同学说hr面基本上是谈薪资了,但是我的并不是,hr还问了业务相关的问题,不过问的比较浅,hr还问我好像比较紧张,而且hr明确说了还要比较一下,我说我有几家的面试都拒了就在等字节的面试,三面完后就开始等结果,这几天干啥都没什么劲,等的好煎熬,终于13号下午接到了电话通知oc了,正式邮件也同时发了,接到以后真的不敢信,很激动但更重要的是可以松一口气了,可以安心的休息一下了终于可以带着个好消息过年了,找实习也可以稍微告一段落了,虽然本人很菜,但是感谢字节收留,成为忠诚的节孝子了因为问的比较简单,面经就挑几个记得的写一下一面:1.实习项目的难点说一下2.实习中用到了哪些测试方法3.针对抖音评论设计一下测试用例4.手撕:合并两个有序数组二面:1.为什么转测开2.线程进程区别,什么场景适合用哪个3.发送一个朋友圈,从发出到别人看到,从数据流转的角度说一下会经历哪些过程4.针对抖音刷到广告视频设计测试用例5.手撕:无重复字符的最长字串
厂办龚彪:锲而不舍 金石可镂
查看8道真题和解析
点赞 评论 收藏
分享
这个简历还有救吗,考研失利了,完蛋蛋了
helloWord大...:每次看见你们9爷隔着嚷嚷找不到工作,我真的分不清是串还是装
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务