python学习与数据挖掘应知应会的十大终端命令

作者:Python学习与数据挖掘 时间:2022-03-05 10:38:19 

IT界的每个人都应该知道终端(Terminal)的基本知识,数据科学家也不例外。有时,终端是你的全部,尤其是在将模型和数据管道部署到远程机器时。

让我们开始吧!

1、wget

wget实用程序用于从远程服务器下载文件。你可以用它来下载数据集,只要你知道网址,可以使用wget命令下载它,我以如下url为例:

https://raw.githubusercontent.com/jbrownlee/Datasets/master/airline-passengers.csv

python学习与数据挖掘应知应会的十大终端命令

如果你在Mac上,默认情况下wget不可用,请从终端执行brew install wget进行安装。数据集现在已经下载,让我们继续一些基本的探索。

2、head

如果你是Python用户,这会让您感到熟悉。否则,head命令用于打印文件的前N行。默认打印10行:

python学习与数据挖掘应知应会的十大终端命令

如果你想要一个不同的数字,比如说3,你可以使用-n参数。完整的命令是:


head -n 3 airline-passengers.csv

3、tail

tail命令与head命令非常相似,但它将打印最后N行。

默认打印10行:

python学习与数据挖掘应知应会的十大终端命令

与head一样,还可以使用-n参数指定要打印的行数。

我们现在已经介绍了基础知识,所以让我们继续讲一些更有趣的内容。

4、wc

有时你想知道文件中有多少个数据点。不需要打开它并手动滚动到底部。一个简单的命令可以为您节省一些时间:

python学习与数据挖掘应知应会的十大终端命令

总之,airline-passengers.csv文件包含144行。

5、grep

此命令用于处理文本,可以匹配字符串和正则表达式。我们将使用它只提取包含字符串“1949”的行。这是一个简单的数据集,所以我们不会有任何问题。默认情况下,grep命令将打印结果,但我们可以将其保存到另一个CSV文件:

python学习与数据挖掘应知应会的十大终端命令

6、cat

为了验证上一个操作是否成功,我们可以使用cat命令。它用于将整个文件打印到shell。你也可以用它来组合文件和更多,但这是另一个时间的主题。

现在,让我们打印整个文件。数据是按月汇总的,因此总共应该有12行:

python学习与数据挖掘应知应会的十大终端命令

7、find

你可以使用find命令搜索文件和文件夹。例如,执行以下命令将当前目录(由点指定)中的所有CSV文件打印到shell:

python学习与数据挖掘应知应会的十大终端命令

星号(*)表示文件名无关紧要,只要它以“.csv”结尾。

8、sort

顾名思义,sort命令可用于按某种标准对文件内容进行排序。例如,以下命令按乘客数量升序对数据集进行排序:

python学习与数据挖掘应知应会的十大终端命令

-k2参数指定对第二列进行排序。如果要按降序对文件排序,可以指定一个附加的-r参数:

python学习与数据挖掘应知应会的十大终端命令

9、nano

虽然技术上不是shell命令,但执行它会打开Nano编辑器。下面是如何创建Python文件:


nano pyfile.py

在这里,让我们编写一些简单的Python代码:

python学习与数据挖掘应知应会的十大终端命令

您可以在编辑器中编写任何Python代码,并进行对于简单终端命令来说过于复杂的分析。完成后,可以运行Python文件:

python学习与数据挖掘应知应会的十大终端命令

10、Variables

让我们用Variables来结束今天的文章。例如,当文件路径变长时,或者您需要多次使用它们时,它们可以派上用场。

下面是如何声明两个字符串变量并使用mv命令将airline-passengers-1949.csv文件重命名为new.csv:

python学习与数据挖掘应知应会的十大终端命令

ls命令用于列出目录中的文件,如我们所见,重命名操作成功。

来源:https://blog.csdn.net/weixin_38037405/article/details/118077361

标签:python,数据挖掘,终端命令
0
投稿

猜你喜欢

  • 判断Session的过期时间 采用JavaScript实时显示剩余多少秒

    2011-04-04 10:48:00
  • flask框架自定义过滤器示例【markdown文件读取和展示功能】

    2023-03-07 19:22:27
  • Python中的列表及其操作方法

    2022-05-24 06:19:41
  • python实现共轭梯度法

    2021-10-06 22:39:01
  • PyTorch的SoftMax交叉熵损失和梯度用法

    2023-06-17 12:46:49
  • Python学习笔记之Break和Continue用法分析

    2023-02-12 04:55:32
  • python difflib模块示例讲解

    2022-01-21 04:35:57
  • 卷积神经网络的发展及各模型的优缺点及说明

    2023-04-04 21:58:06
  • Golang正整数指定规则排序算法问题分析

    2023-07-12 09:12:03
  • 使用Javascript实现选择下拉菜单互移并排序

    2023-09-07 18:14:45
  • 了解一下python内建模块collections

    2022-03-19 08:32:37
  • python定时器(Timer)用法简单实例

    2021-01-10 15:43:04
  • Python绘制灯笼的示例代码

    2022-02-24 23:10:35
  • darknet框架中YOLOv3对数据集进行训练和预测详解

    2023-11-21 23:11:15
  • springMVC + easyui + $.ajaxFileUpload实现文件上传注意事项

    2023-09-04 09:17:26
  • 最基础的Python的socket编程入门教程

    2022-10-13 03:38:46
  • 如何让WML页面自己更新?

    2008-05-21 13:35:00
  • python 列表常用方法超详细梳理总结

    2022-04-18 20:34:27
  • Python获取当前公网ip并自动断开宽带连接实例代码

    2021-08-28 12:40:27
  • python查找特定名称文件并按序号、文件名分行打印输出的方法

    2023-11-27 03:35:35
  • asp之家 网络编程 m.aspxhome.com