亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

您的位置:首頁技術文章
文章詳情頁

Linux實現(xiàn)文件內(nèi)容去重及求交并差集

瀏覽:76日期:2024-04-12 17:31:13

一、數(shù)據(jù)去重

日常工作中,使用Hive或者Impala查詢導出來可能會存在數(shù)據(jù)重復的現(xiàn)象,但又不想重新執(zhí)行一遍查詢(查詢時間稍長,導出文件內(nèi)容多),因此想到了使用Linux命令將文件的內(nèi)容重復數(shù)據(jù)進行去除。

案例如下:

可以看到aaa.txx有3條重復數(shù)據(jù)

Linux實現(xiàn)文件內(nèi)容去重及求交并差集

想去掉多余的數(shù)據(jù),只保留一條

sort aaa.txt | uniq > bbb.txt

將aaa.txt文件中重復數(shù)據(jù)去掉,輸出到bbb.txt

Linux實現(xiàn)文件內(nèi)容去重及求交并差集

可以看到bbb.txt文件中只保留了一條數(shù)據(jù)

二、數(shù)據(jù)交、并、差

1)、交集(相當于user_2019 inner join user_2020 on user_2019.user_no=user_2020.user_no)

sort user_2019.txt user_2020.txt | uniq -d

2)、并集(相當于 user_2019.user_no union user_2020.user_no)

sort user_2019.txt user_2020.txt | uniq

3)、差集

user_2019.txt-user_2020.txt

sort user_2019.txt user_2020.txt user_2020.txt | uniq -u

user_2020.txt - user_2019.txt:

sort user_2020.txt user_2019.txt user_2019.txt | uniq -u

以上就是本文的全部內(nèi)容,希望對大家的學習有所幫助,也希望大家多多支持好吧啦網(wǎng)。

標簽: Linux系統(tǒng)
相關文章:
主站蜘蛛池模板: 在线精品自拍亚洲第一区 | 黄色一级片在线播放 | 国产卡一卡二卡三 | 亚洲国产精品婷婷久久 | 日韩亚洲人成在线 | 亚洲成在人线影视天堂网 | 无毒不卡在线观看 | 91网址免费入口 | 亚洲免费福利 | 伊人久久大杳蕉综合大象 | 国产在线综合一区二区三区 | 最刺激黄a大片免费观看 | 国产精品美女一区二区三区 | 日本一卡2卡三卡4卡 免费网站仙踪 | 亚欧精品一区二区三区四区 | 手机在线看黄色 | 亚洲免费视频播放 | 日韩精品一区二区三区中文 | 精品国产香蕉在线播出 | 久久 91| 久久久久久99 | 精品国产三级a∨在线观看 精品国产三级在线观看 | 非洲特黄一级毛片高清视频 | 精品一区二区三区视频 | 一级片视频网站 | 亚洲欧美激情小说另类 | 欧美一级精品 | 求一个黄色网址 | 国产精品免费久久久久影院 | 91精品国产露脸在线 | 久久这里只有精品免费播放 | 国产成人国产在线观看入口 | 美女久久 | 毛片在线播放网址 | 久久视屏这里只有精品6国产 | 在线国产一区二区三区 | 嗯!啊!使劲用力在线观看 | 国产亚洲福利精品一区二区 | 国产拍视频 | 成人伊人网 | 中文字幕亚洲欧美日韩不卡 |