python如何读取.mtx文件
作者:努力干活还不粘人的小妖精 时间:2023-11-17 21:26:55
mtx文件是按照稀疏矩阵格式存储的矩阵数据,可以按照以下步骤读取:
1、安装scanpy包
pip install scanpy
2、文件读取
import scanpy as sc
adata = sc.read(filename)
data = adata.X
第一行read之后返回的是annData,第二行通过.X操作得到的是矩阵数据
3、转换为稠密矩阵
data = data.todense()
直接得到的矩阵是稀疏形式的,通过todense函数可转换为稠密矩阵
补充:python读取各种文件方式
Json:
use_time=[]
with open(address,'r') as f: #ubuntu
mobile = json.load(f)
calls = mobile["transactions"][0]["calls"]
for call in calls:
use_time.append(str(call['use_time']))
Excel:
rawdata1=open_workbook(address)
rawdata=rawdata1.sheet_by_index(0)
for i in range(1,rawdata.nrows):
if rawdata.cell(i,date_index).value=="": #跳过空行
continue
else:
if ctype==3: #若为3,则用datetime模块处理日期
date1=rawdata.cell(i,date_index).value
date2 = xldate_as_tuple(date1,0)
date3=datetime(*date2)
if "." in str(rawdata.cell(i,phone_index).value):
phone1=str(rawdata.cell(i,phone_index).value)[:-2]
else:
phone1=str(rawdata.cell(i,phone_index).value)
写EXCEL:
Excel_file = xlwt.Workbook()
sheet = Excel_file.add_sheet('sheet0')
header=[u'号码','日期top1','日期top2','日期top3']
#写入标题行:
for i in range(len(header)):
sheet.write(0,i,header[i])
#开始按行写入数据:
for i in range(len(phonelist)):
sheet.write(i+1,0,phonelist[i])
sheet.write(i+1,1,dic[str(phonelist[i])])
#保存EXCEL:
Excel_file.save("C:/Users/Desktop/100个文件输出xls/"+str(fileName)+".xls")
CSV:
rawdata=pd.read_csv(address,skip_blank_lines=True) #参数为去除空行
if 'start_time' or 'begin_time' in rawdata.columns:
if 'start_time' in rawdata.columns:
start_time=rawdata['start_time']
elif 'begin_time' in rawdata.columns:
start_time=rawdata['begin_time']
txt:
rawdata=open(address,'r')
i=0
a=[] #c存放第一行的列名
for line in rawdata:
if i==1: #默认第二行开始存储通话数据
a=line.split(',') #逗号作为分隔符
for j in range(len(a)): #查找指定列名所在的列下标
if (('-' in str(a[j]))or('/' in str(a[j]))): #判断日期所在列数
date_index=j #保存日期的列下标
elif str(a[j]).isdigit() and len(str(a[j]))>5: #默认全为数字组成的字符串为电话号码
phone_index=j
else:
pass
break
else:
i+=1
i=0
for line in rawdata:#开始转存数据:
if len(line)<10: #跳过空行
continue
data_line=line.split(',') #txt默认以','分隔数据
if i==0:
pass #第一行为列名,跳过
i+=1
else: #从第二行开始保存数据
start_time.append(data_line[date_index])
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。如有错误或未考虑完全的地方,望不吝赐教。
来源:https://blog.csdn.net/qq_38402294/article/details/110959330
标签:python,读取,mtx
0
投稿
猜你喜欢
k8s在go语言中的使用及client 初始化简介
2024-02-03 18:10:51
centos7之Python3.74安装教程
2023-10-27 15:15:24
Python使用grequests并发发送请求的示例
2022-11-08 15:38:01
详解Python如何获取列表(List)的中位数
2022-02-01 02:35:37
一篇文章告诉你如何用Python控制Excel实现自动化办公
2022-02-03 17:07:59
Python通过poll实现异步IO的方法
2023-07-17 04:08:52
基于Python实现新年倒计时
2022-02-14 08:41:59
Python 字符串类型列表转换成真正列表类型过程解析
2021-07-28 18:06:52
python如何导出微信公众号文章方法详解
2022-10-01 00:31:27
matplotlib.subplot()画子图并共享y坐标轴的方法
2023-03-27 12:26:10
Python实现制作透明背景的电子印章
2022-01-20 08:11:24
在pandas多重索引multiIndex中选定指定索引的行方法
2023-07-07 22:04:16
python 定义函数 返回值只取其中一个的实现
2022-07-29 21:28:21
详解Python匿名函数(lambda函数)
2022-09-11 12:33:00
微信公众平台网页授权获取用户基本信息中授权回调域名设置的变动
2023-11-14 14:01:31
PHP设计模式中的命令模式
2023-05-27 21:13:43
axios请求的一些常见操作实战指南
2023-07-02 16:33:25
python3使用print打印带颜色的字符串代码实例
2022-01-20 10:30:49
利用Python实现自动生成数据日报
2022-08-26 11:12:48
在mac上如何使用终端打开XAMPP自带的MySQL
2024-01-17 15:41:53