Як змусити Uniq виділити між em- та en-dashes?

uniq (GNU coreutils 8.5) does not seem to distinguish between em- and en-dashes:

$ echo -e "a-b \ na-b" | uniq-c

  2 a–b

Чи існує який-небудь спосіб змусити цю різницю? Я спробував різні параметри для LC_COLLATE без успіху.

2

1 Відповіді

Працював для мене

echo -e "a–b\na—b" | LC_COLLATE=C uniq -c
      1 a–b
      1 a—b
3
додано
Я бачу. Я намагався провести різні підстановки LC_COLLATE = en_GB.utf8 , припускаючи, що він повинен бути utf8 для роботи. LC_COLLATE = C видає очікувані результати. Ура!
додано Автор user918938, джерело