Python快速去重脚本是什么
发表于:2025-02-02 作者:千家信息网编辑
千家信息网最后更新 2025年02月02日,本篇内容介绍了"Python快速去重脚本是什么"的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!一、下载
千家信息网最后更新 2025年02月02日Python快速去重脚本是什么
本篇内容介绍了"Python快速去重脚本是什么"的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!
一、下载pyhon脚本到本地
二、用法
1、必须python2环境
2、把去重的文件和该python脚本放到一起
3、新建几个有重复内容的文件,放到一个与python脚本不在一起的位置/root/123
4、修改python脚本
#coding=utf-8import sys, re, osdef file_merge(): input_path = "/root/123/" #此处填好自己的路径,注意最后的"/" #使用os.listdir函数获取路径下的所有的文件名,并存在一个list中 #使用os.path.join函数,将文件名和路径拼成绝对路径 whole_file = [os.path.join(input_path,file) for file in os.listdir(input_path)] content = [] #对于每一个路径,将其打开之后,使用readlines获取全部内容 for w in whole_file: with open(w,'rb') as f: content = content+f.readlines() #构造输出的路径,和输入路径在同一个文件夹下,如果该文件夹内没有这个文件会自动创建 output_path = os.path.join(input_path,'合并所有文件.txt') #将内容写入文件 with open(output_path,'wb') as f: f.writelines(content) def getDictList(dict): regx = '''[\w\~`\!\@\#\$\%\^\&\*\(\)\_\-\+\=\[\]\{\}\:\;\,\.\/\<\>\?]+''' with open(dict) as f: data = f.read() return re.findall(regx, data) def rmdp(dictList): return list(set(dictList)) def fileSave(dictRmdp, out): with open(out, 'a') as f: for line in dictRmdp: f.write(line + '\n') def main(): try: dict = '/root/123/合并所有文件.txt' out = '/root/123/去重所有文件.txt' except Exception, e: print 'error:', e me = os.path.basename(__file__) exit() dictList = getDictList(dict) dictRmdp = rmdp(dictList) fileSave(dictRmdp, out) if __name__ == '__main__': file_merge() main()
5、python2 quchong.py运行脚本,会在/root/123目录下生成去重文件
6、工作原理
将当前目录下所有文件合并为一个文件:合并所有文件.txt,对该文件进行去重,最终生成去重所有文件.txt,该文件就是最后想要的文件。
"Python快速去重脚本是什么"的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注网站,小编将为大家输出更多高质量的实用文章!
文件
脚本
路径
内容
函数
文件名
文件夹
更多
目录
知识
生成
输出
实用
学有所成
接下来
位置
原理
困境
实际
就是
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
iis服务器应用池停止
根据网络安全法应当为公安
在湖州找软件开发工程师工作
包头市软件开发园企业
最近黑色玫瑰服务器
东莞市科思达软件开发有限公司
组织部网络安全应急处置
网络安全班会后期工作
需求分析属于软件开发时期吗
为数据库添加一个次要数据文件
电子商务网络技术基础文档
数据库读取柱状图
网络安全情况报送
上海互联网科技学院
sql数据库简介
软件开发项目成本资料
linux 服务器 教程
儿童网络安全知识手抄报
计算机网络技术学的框架有哪些
福永磁盘阵列服务器
浙江软件开发要多少钱
不属于网络安全法的事
思科网络技术学院教程1
济南餐饮软件开发公司有哪些
软件需求分析与软件开发属于
利用数据库实现队列
dns 服务器部署
qq网络安全中心怎么关
监控录像机和服务器的区别
软件开发技术基础书