发布网友 发布时间:2024-09-26 05:47
共1个回答
热心网友 时间:2024-09-27 20:37
导读:本篇文章首席CTO笔记来给大家介绍有关python查看一列数据有多少值的相关内容,希望对大家有所帮助,一起来看看吧。
python查看dataframe每列有多少个不同元素方法一:
mylist=set(say)??????#say为所要统计的列表??
foriteminmylist:??#将列表中的元素无重复的抽取出来,赋值给另一个列表
printitem+str(say.count(item))???#list.count(item)?输出item在list中出现的次数
方法二:
counts={}?????????#字典
forxintime_zones:???#time_zones为列表
if?xincounts:
counts[x]+=1
else:
counts[x]=1
print?counts
方法三:
(Series与Datafram用法相同)
importnumpyasnp?
importpandasaspd?
frompandasimportDataFrame?
frompandasimportSeries?
ss=Series(['Tokyo','Nagoya','Nagoya','Osaka','Tokyo','Tokyo'])???
ss.value_counts()??#value_counts直接用来计算series里面相同数据出现的频率
扩展资料:
python函数的其他高级用法
1.使用函数变量:
Python的函数也是一种值:所有函数都是function对象,这意味着可以把函数本身赋值给变量,就像把整数、浮点数、列表、元组赋值给变量一样。
2.使用函数作为函数形参:
有时候需要定义一个函数,该函数的大部分计算逻辑都能确定,但某些处理逻辑暂时无法确定,这意昧着某些程序代码需要动态改变,如果希望调用函数时能动态传入这些代码,那么就需要在函数中定义函数形参,这样即可在调用该函数时传入不同的函数作为参数,从而动态改变这段代码。
3.使用函数作为返回值:
程序中,定义了一个get_math_func()函数,该函数将返回另一个函数。接下来在get_math_func()函数体内的①、②、③号粗体字代码分别定义了三个局部函数,最后get_math_func()函数会根据所传入的参数,使用这三个局部函数之一作为返回值。
在定义了会返回函数的get_math_func()函数之后,接下来程序调用get_math_func()函数时即可返回所需的函数。
python取数据框某列唯一值的方法
有时候列太长,想知道列里面有哪些值,可以用以下几种方法:
1.?data.drop_duplicates(['a','b'])
#data根据’a','b'组合列删除重复项,默认保留第一个出现的值组合。传入参数keep='last'则保留最后一个
data.drop_duplicates(['a','b'],keep='last')
2.?np.unique(data['a'])
这个可以直接看到它的值;
3.a列如果是类别型的时候,可以用data['a'].value_counts()
第一列则是值出现的种类。
python一列数据中有几个数如果是list,有max(list)也可以自己写排序算法,比如冒泡排序a=[3,4,2,6,3]foriinrange(0,len(a)):forjinrange(i+1,len(a)):first=int(a[i])second=int(a[j])iffirst
怎样用python,读取excel中的一列数据用python读取excel中的一列数据步骤如下:
1、首先打开dos命令窗,安装必须的两个库,命令是:pip3install?xlrd;Pip3installxlwt。
2、准备好excel。
3、打开pycharm,新建一个excel.py的文件,首先导入支持库importxlrdimportxlwt。
4、要操作excel,首先得打开excel,使用open_workbook(‘路径’),要获取行与列,使用nrows(行),ncols(列),获取具体的值,使用cell(row,col).value。
5、要在excel里写入值,就要使用write属性,重点说明写入是用到xlwt这个支援库,思路是先新建excel,然后新建页签B,然后将一组数据写入到B,最后保存为excel.xls。
pythonpanda统计一列有多少数据创建数据
通过Python的zip构造出一元组组成的列表作为DataFrame的输入数据rec。
In[3]:importpandasaspd
In[4]:importrandom
In[5]:num=random.sample(xrange(10000,1000000),5)
In[6]:num
Out[6]:[244937,132008,278446,613409,799201]
In[8]:names="hellothecruelworlden".split()
In[9]:names
Out[9]:['hello','the','cruel','world','en']
In[10]:rec=zip(names,num)
In[15]:data=pd.DataFrame(rec,columns=[u"姓名",u"业绩"])
In[16]:data
Out[16]:
姓名业绩
0hello244937
1the132008
2cruel278446
3world613409
4en799201
DataFrame方法函数的第一个参数是数据源,第二个参数columns是输出数据表的表头,或者说是表格的字段名。
导出数据csv
Windows平台上的编码问题,我们可以先做个简单处理,是ipython-notebook支持utf8.
importsys
reload(sys)
sys.setdefaultencoding("utf8")
接下来可以数据导出了。
In[31]:data
Out[31]:
姓名业绩
0hello244937
1the132008
2cruel278446
3world613409
4en799201
#在ipython-note里后加问号可查帮助,q退出帮助
In[32]:data.to_csv?
In[33]:data.to_csv("c:\\out.csv",index=True,header=[u"雇员",u"销售业绩"])
将data导出到out.csv文件里,index参数是指是否有主索引,header如果不指定则是以data里columns为头,如果指定则是以后边列表里的字符串为表头,但要注意的是header后的字符串列表的个数要和data里的columns字段个数相同。
可到c盘用Notepad++打开out.csv看看。
简单的数据分析
In[43]:data
Out[43]:
姓名业绩
0hello244937
1the132008
2cruel278446
3world613409
4en799201
结语:以上就是首席CTO笔记为大家介绍的关于python查看一列数据有多少值的全部内容了,希望对大家有所帮助,如果你还想了解更多这方面的信息,记得收藏关注本站。