Команда uniq
используется для удаления дублирующихся строк из отсортированного файла или потока данных. Она выводит только уникальные строки, что может быть полезно для обработки текстовых данных.
Базовый синтаксис команды выглядит следующим образом:
uniq [опции] [аргументы]
-c
: Предваряет каждую уникальную строку количеством её вхождений.-d
: Выводит только дублирующиеся строки.-u
: Выводит только уникальные строки, которые не имеют дубликатов.-i
: Игнорирует регистр при сравнении строк.uniq input.txt output.txt
uniq -c input.txt
uniq -d input.txt
uniq -i input.txt
uniq
убедитесь, что файл отсортирован, так как команда работает только с соседними дубликатами.sort
в комбинации с uniq
для обработки неотсортированных данных:
sort input.txt | uniq
uniq
с опцией -w
, чтобы игнорировать определенное количество начальных символов при сравнении строк.