問題一覧に戻る
中級テキスト処理
問題34: uniq/cut - 重複行の処理とフィールドの抽出

uniqコマンドは連続する重複行を処理し、cutコマンドはテキストから特定のフィールドや文字を抽出します。uniqは重複の削除やカウントに使用され、cutはCSVファイルやログファイルから必要な部分だけを取り出すのに使用されます。両コマンドともパイプラインでの使用が一般的です。

# 重複行を削除
sort data.txt |

# 重複行をカウント
sort log.txt |

# カンマ区切りの2番目のフィールドを抽出
-d',' file.csv

# 各行の1-10文字目を抽出
1-10 text.txt