Linux下如何对内容去重,用什么命令
Admin 2022-07-26 群英技术资讯 1019 次浏览
很多朋友都对“Linux下如何对内容去重,用什么命令”的内容比较感兴趣,对此小编整理了相关的知识分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获,那么感兴趣的朋友就继续往下看吧!大家可能经常遇到文件内容排序去重处理的事情,使用 linux 命令可以很方便的处理,sort 命令在处理文件排序和去重中起着非常重要的左右,是文件处理的利器。
比如有以下文件内容:
pythontab.com
4345 15 12121 4145 7 fdf 4245 5 dfsf 1345 76 432423 0693 2 4345 06a7 82 4e 06a9 58 e33 4345 68 343 06c1 56 453 06d7 145 45678 4345 117 21 06e3 280 76 4345 7 3434 4345 48 80 06f1 463 121 4345 3847 131 070b 1236 64 070d 3343 77 0713 104235 90 0715 6 12 0726 121 97798
想要按照第二列排序去重,怎么做呢?其实只需要 sort 命令就可以解决了
sort -t $'\t' -k 2 -u pythontab.com
sort 排序命令
-t 指定分隔符为‘\t’
-k 指定第三列
-u 去重
sort的其他一些选项:
-r 降序排列
-o 把排序结果输出到源文件
sort默认是把结果输出到标准输出,所以需要用重定向才能将结果写入文件,形如
sort filename>newfile
如果将结果输出到原文件,用重定向相当于清空
-n 看为数字来比较
你有没有遇到过10比2小的情况。我反正遇到过。出现这种情况是由于排序程序将这些数字按字符来排序了,排序程序会先比较1和2,显然1小,所以就将10放在2前面喽。这也是sort的一贯作风。
我们如果想改变这种现状,就要使用-n选项,来告诉sort,“要以数值来排序”!
-f 会将小写字母都转换为大写字母来进行比较,亦即忽略大小写
-c 会检查文件是否已排好序,如果乱序,则输出第一个乱序的行的相关信息,最后返回1
-C 会检查文件是否已排好序,如果乱序,不输出内容,仅返回1
-M 会以月份来排序,比如JAN小于FEB等等
-b 会忽略每一行前面的所有空白部分,从第一个可见字符开始比较。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
猜你喜欢
本文主要来教一教大家Linux VPS如何查看Inodes数目,有需要的小伙伴可以随时来参考阅读下,接下来的时间就让小编来大家一探究竟吧!千万不要错过了。
linux中wc命令的作用和用法是什么?一些对Linux电脑操作系统不熟悉的朋友可能不是很了解wc命令的作用和用法,因此这篇文章就给大家来详细的介绍一下wc命令,感兴趣的朋友就继续往下看吧。
linux中有main函数;linux中main函数的原型是“int main(int argc,char *argv[]){return 0;}”,C语言规定了main函数的参数只能有两个,一个是argc,一个是argv,由于main函数不能被其它函数调用, 因此不可能在程序内部取得实际值。
两种解决方法:1、利用getenforce查看selinux的状态并将状态设置为宽松状态。2、利用“head /var/log/messages”查看日志提示,将运行结果的第二行在“/etc/vsftpd/”目录下运行,然后重启vsftpd服务即可。
linux系统的结构是四个部分:1、内核,操作系统的核心负责管理系统的进程、内存、设备驱动程序等;2、shell,系统的用户界面,提供了用户与内核进行交互操作的一种接口;3、文件系统,文件存放在磁盘等存储设备上的组织方法;4、应用程序,包括文本编辑器、编程语言在内的程序集。
成为群英会员,开启智能安全云计算之旅
立即注册关注或联系群英网络
7x24小时售前:400-678-4567
7x24小时售后:0668-2555666
24小时QQ客服
群英微信公众号
CNNIC域名投诉举报处理平台
服务电话:010-58813000
服务邮箱:service@cnnic.cn
投诉与建议:0668-2555555
Copyright © QY Network Company Ltd. All Rights Reserved. 2003-2020 群英 版权所有
增值电信经营许可证 : B1.B2-20140078 粤ICP备09006778号 域名注册商资质 粤 D3.1-20240008