数据科学家的呼吁行能力
全局搜刮正则表达式并输出,或行使grep;大噶?鲱知名的呼吁,而且有很好的来由。 Grep具有很强的手段,出格是在大型代码库中查找要领。在数据科学规模,它充当了其他呼吁的改造机制。但其尺度用法也很有效。
对包括word/pattern的行数举办计数
Grep行使or运算符- |来检索多个值.
有效的选项
大杀器 Sed和Awk是本文两个最有效的呼吁。为了简捷,我不会接头那些令人费解的细节。相反,我会接头各类百般的呼吁来证明他们令人印象深刻的气力。假如你想相识的更多,这本书就可以。 SED 在内核中sed是一个流编辑器。它善于替代,可是也可以用来重构。 最根基的sed呼吁包括了s/old/new/g。也就是全局搜刮旧值,替代新值。没有/g 我们的呼吁也许在第一次呈现旧值就会终止。 为了尽快相识它的手段,我们来看一个例子。在这个环境你会拿到下面的文件:
我们要做的第一件事就是移除美元符。-i 标识暗示当场修改。''就是代表一个零长度文件扩展,因此重写我们的初始文件。抱负环境下,你会单独测试这些并输出到一个新文件。
下一步,我们的balance列的逗号。
最终,Jack有一天起来并筹备告退了。以是,再会吧,我的伴侣。
就像你所看到的,sed成果强盛,可是爱好不止于此。 AWK 最好的放最后。Awk不只是一个简朴的呼吁:它是一个成熟的说话。在本文中包括的每一个呼吁中,awk今朝是最酷的。假如你发明它令你印象深刻,这有大量的资源- 看这,这,和这。 awk包括的常用案例:
Awk在其最初雏形可以与grep平行。
可能多行使一点邪术,让grep和cut团结。在这,awk对全部行通过word打印了以tab脱离的第三和第四列。-F,只是将脱离符变为逗号。
Awk具有大量有效的内置变量。譬喻, NF -字段数 - 和NR - 记录数。为了获取文件中这53个记录:
添加一个小秘诀可以基于一个值可能多个值过滤。下面的第一个例子,会打印这些记录中第一列为string的行数和列。
(编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |