陈某某的网络日志

活到老学到老,学习无止境

0%

简介

linux下的排序操作离不开sort,总结一下易用错的地方。

主要选项

1
2
3
4
5
6
7
8
9
10
11
12
-b:寻找排序的keys时忽略前导的空白字符(blank)
-c:检查文件是否已经按照顺序排序,如未排序,会提示从哪一行开始乱序
-d:只处理英文字母、数字及空格,忽略其他的字符
-h:使用易读性数字(例如:2K、1G)
-i:除了040至176之间的ASCII字符外(八进制0-177),忽略其他的字符(忽略无法打印的字符如退格/换页键/回车)
-k:指定要用来排序的位置
-m:将几个排序好的文件进行合并,只是单纯合并,不做排序
-M:将前面3个字母依照月份的缩写进行排序
-n:依照数值的大小排序
-r:降序
-u:忽略相同行
-t<分隔字符>:指定分隔符,默认的分隔符为空白字符和非空白字符之间的空字符
阅读全文 »

需求说明

2018年新个税起征点来了,19年1月专项扣除额也实施了,自娱自乐写了工具:个人所得税计算器(工资)。
GUI的程序之前也没怎么写过,用的是python自带的tkinter库,好处是使用简单,python自带不用再装第三方的库。
缺点是功能相对有限(对比pyqt5这类库),中文资料较少,查个文档都不是很方便,好在我这个功能巨简单,tk足够用了,边查就边写出来了。
使用就是输入:税前工资,扣掉的五险一金总额,专项扣除额,就可以了。

阅读全文 »

脚本需求说明

有一excel文件从某crm系统导出,某目标列中含有有效文字+客户手机号码(手机号码个数可能有多个,位置不定,中间可能有,.\等分隔符分隔),现考虑隐私要求删除手机号码(及无用分隔符空白符等)。数据行数在2000行左右。

实现思路

仍然是正则表达式匹配11位手机号,但这次不用python了,直接用excel的vba来完成,无需任何第三方环境。之前都没学过vba,边查资料边写出来了。

阅读全文 »

脚本需求说明

有一excel文件从某crm系统导出,某目标列中含有有效文字+客户手机号码(手机号码个数可能有多个,位置不定,中间可能有,.\等分隔符分隔),现考虑隐私要求删除手机号码(及无用分隔符空白符等)。数据行数在2000行左右。

实现思路

正则表达式匹配出11位手机号并删除,在学python,正则用python的re库,简单界面用python标准的tkinter,操作excel用第三方的xlwins。

阅读全文 »

简介

sed(stream editor,流编辑器),本质是一个面向字符流的非交互式文本编辑器。功能强大,可以用几行代码完成复杂的编辑任务。

阅读全文 »