HomeAbout
[LINUX] sed 명령어 사용법 : 변수 사용과 패턴 매칭, 실제 예제 패턴
Algorithm & CS & OS
[LINUX] sed 명령어 사용법 : 변수 사용과 패턴 매칭, 실제 예제 패턴
NASA1515
NASA1515
July 05, 2021
3 min

목차

01
✔ Sed(streamlined editor) ?
02
✌ Sed 동작
03
👍 Sed 사용법
04
🙌 SED subcommand 명령어 종류와 의미
05
🐱‍🏍 다양한 사용 예시

✔ Sed(streamlined editor) ?

sed는 대화형 기능이 없는 편집기입니다.

  • 명령행에서 직접 편집 명령어와 파일을 지정하여 작업한 후 결과를 화면으로 확인합니다.
  • sed 편집기는 원본을 손상하지 않는다.
  • 리다이렉션을 이용하여 편집 결과를 파일로 저장하여 확인할 수 있다.
  • sed 명령어는 streamlined editor를 의미합니다. streamlined = ‘능률적인’을 의미하듯 정말 편한 명령어입니다.

sed 명령어의 형식은 다음과 같습니다

$ sed [옵션] 스크립트 입력파일1 [입력파일2 ... ]


✌ Sed 동작

  • 패턴 스페이스(Pattern space)홀드 스페이스(hold space)

    sed 명령어는 동작시 내부적으로 두개의 워크스페이스를 사용하는데, (마치 복사 붙여넣기의 임시 저장소 클립보드와 같음)
    이 두 버퍼를 패턴 스페이스(=패턴 버퍼)홀드 스페이스(=홀드 버퍼)라고 합니다.


  • 패턴 버퍼: sed가 파일을 라인단위로 읽을 때 그 읽힌 라인이 저장되는 임시 공간입니다.
    우리가 sed명령어로 출력하라는 명령을 주면 여기 있는 버퍼 내용을 출력하는거고, 뭔가 조작을 하면 여기 저장되어 있는 내용을 조작하는 겁니다.
    원본을 건드는게 아닙니다.
    즉 이 버퍼는 현재 내가 담고 있는 정보를 갖고 있겠죠. 텍스트 1라인에서 2라인으로 넘어가 글을 읽게 되면 여기 패턴 버퍼에는 2라인 현재 내용이 저장되겠죠.

  • 홀드 버퍼 : 홀드 스페이스는 패턴 버퍼처럼 짧은 순간 임시 버퍼가 아니라 좀 더 오랜 기간 가지고 있는 저장소입니다.
    2라인 작업중이더라도 1라인을 기억하고 있을 수 있는 거예요. 즉, 어떤 내용을 홀드 스페이스에 저장하면,
    sed가 다음 행을 읽더라도 나중에 내가 원할 때 불러와서 재사용할 수 있는 버퍼가 홀드 버퍼가 됩니다.

👍 Sed 사용법

사용법 설명을 위해서 특정 정보가 들어가 있는 파일을 준비 했습니다

student@nasa1515:~/다운로드$ cat employees 
EMPLOYEE_ID FIRST_NAME  LAST_NAME   EMAIL   PHONE_NUMBER    HIRE_DATE   JOB_ID  SALARY  COMMISSION_PCT  MANAGER_ID  DEPARTMENT_ID
100 Steven  King    SKING   515.123.4567    03/06/17    AD_PRES 24000           90
101 Neena   Kochhar NKOCHHAR    515.123.4568    05/09/21    AD_VP   17000       100 90
102 Lex De Haan LDEHAAN 515.123.4569    01/01/13    AD_VP   17000       100 90
103 Alexander   Hunold  AHUNOLD 590.423.4567    06/01/03    IT_PROG 9000        102 60
104 Bruce   Ernst   BERNST  590.423.4568    07/05/21    IT_PROG 6000        103 60
105 David   Austin  DAUSTIN 590.423.4569    05/06/25    IT_PROG 4800        103 60
106 Valli   Pataballa   VPATABAL    590.423.4560    06/02/05    IT_PROG 4800        103 60
107 Diana   Lorentz DLORENTZ    590.423.5567    07/02/07    IT_PROG 4200        103 60
108 Nancy   Greenberg   NGREENBE    515.124.4569    02/08/17    FI_MGR  12008       101 100
109 Daniel  Faviet  DFAVIET 515.124.4169    02/08/16    FI_ACCOUNT  9000        108 100

sed 명령어 자주쓰는 대표적 사용법

편집기 기능을 모두 수행할 수 있다보니 sed의 subcommand
즉 sed와 같이 쓰이는 명령어 조합이 굉장히 많습니다.

자세한 옵션들은 하단에 쭉 다루도록하고 대표적으로 자주 쓰이는 명령어 조합부터 일단 살펴보겠습니다.


특정 범위만큼 파일내용 출력하기

1. sed -n '1p' employees;
employees파일에서 첫 번째 행만 출력해서 화면에 보여준다.

student@nasa1515:/home/won/script$ sed -n '1p' employees 
EMPLOYEE_ID FIRST_NAME  LAST_NAME   EMAIL   PHONE_NUMBER    HIRE_DATE   JOB_ID  SALARY  COMMISSION_PCT  MANAGER_ID  DEPARTMENT_ID

2. sed -n '1,3p' employees;
employees파일에서 1~3라인 범위의 내용을 출력해서 보여준다.

student@nasa1515:/home/won/script$ sed -n '1,3p' employees 
EMPLOYEE_ID FIRST_NAME  LAST_NAME   EMAIL   PHONE_NUMBER    HIRE_DATE   JOB_ID  SALARY  COMMISSION_PCT  MANAGER_ID  DEPARTMENT_ID
100 Steven  King    SKING   515.123.4567    03/06/17    AD_PRES 24000           90
101 Neena   Kochhar NKOCHHAR    515.123.4568    05/09/21    AD_VP   17000       100 90

3. sed -n '8,$p' employees;
employees파일에서 8라인부터 파일끝까지 출력해서 보여준다. $는 '끝'을 의미합니다.

student@nasa1515:/home/won/script$ sed -n '8,$p' employees 
106 Valli   Pataballa   VPATABAL    590.423.4560    06/02/05    IT_PROG 4800        103 60
107 Diana   Lorentz DLORENTZ    590.423.5567    07/02/07    IT_PROG 4200        103 60
108 Nancy   Greenberg   NGREENBE    515.124.4569    02/08/17    FI_MGR  12008       101 100
109 Daniel  Faviet  DFAVIET 515.124.4169    02/08/16    FI_ACCOUNT  9000        108 100
  • 3번 명령같은 경우 첫번째 헤더가 나오지 않아 어떤 데이터인지 구분하기가 힘드네요

4. sed -n -e '1p' -e '8,$p' employees
여러개의 편집 명령을 실행할 때 -e 옵션을 씁니다. 다음에 오는 것도 편집 명령어라는걸 알려줍니다.
첫 번째 행과 8~끝 행 두 부분을 출력해줍니다.

student@nasa1515:/home/won/script$ sed -n -e '1p' -e '8,$p' employees 
EMPLOYEE_ID FIRST_NAME  LAST_NAME   EMAIL   PHONE_NUMBER    HIRE_DATE   JOB_ID  SALARY  COMMISSION_PCT  MANAGER_ID  DEPARTMENT_ID
106 Valli   Pataballa   VPATABAL    590.423.4560    06/02/05    IT_PROG 4800        103 60
107 Diana   Lorentz DLORENTZ    590.423.5567    07/02/07    IT_PROG 4200        103 60
108 Nancy   Greenberg   NGREENBE    515.124.4569    02/08/17    FI_MGR  12008       101 100
109 Daniel  Faviet  DFAVIET 515.124.4169    02/08/16    FI_ACCOUNT  9000        108 100

위 실습한 명령에서의 p는 print의 약자로 출력을 의미합니다. 컴마 (`)는 주소 범위를 지정해요.

  • sed는 원본을 건드리지 않습니다.
    그런고로 sed로 작업한 부분만 억제해서 출력시키고 싶다면 -n옵션을 써줘야해요.
    그래서 보통 -n옵션p와 항상 같이 사용됩니다.

특정 단어로 시작하는 행들만 추출하기

보통 로그파일의 경우 데이터들의 구별하기 위해 unique한 값이 맨앞에 붙는 경우가 많습니다.
예를들어 log20200816 이라는 파일이 있는데 이 날짜에 처리된 거래들이 기록된다고 합시다.
당연히 거래를 구분하는 유니크값으로 상품코드, 거래코드등이 붙을 겁니다.


1. sed -n '/^107/p' employees
employees파일에서 107로 시작하는 행만 출력해서 화면에 보여줍니다.
여기서 ’^‘는 메타문자로 ‘시작’을 의미합니다.

student@nasa1515:/home/won/script$ sed -n '/^107/p' employees 
107 Diana   Lorentz DLORENTZ    590.423.5567    07/02/07    IT_PROG 4200        103 60

2. sed -n '/103/p' employees
employees파일에서 103을 포함하고 있는 행들을 출력해서 보여줍니다.

student@nasa1515:/home/won/script$ sed -n '/103/p' employees 
103 Alexander   Hunold  AHUNOLD 590.423.4567    06/01/03    IT_PROG 9000        102 60
104 Bruce   Ernst   BERNST  590.423.4568    07/05/21    IT_PROG 6000        103 60
105 David   Austin  DAUSTIN 590.423.4569    05/06/25    IT_PROG 4800        103 60
106 Valli   Pataballa   VPATABAL    590.423.4560    06/02/05    IT_PROG 4800        103 60
107 Diana   Lorentz DLORENTZ    590.423.5567    07/02/07    IT_PROG 4200        103 60

파일에서 공백으로 이루어지거나 빈줄 제거하기


  1. sed '/^$/d' employees
    employees파일에서 빈 라인들을 지운 후 내용을 출력해준다.

    student@nasa1515:/home/won/script$ sed '/^&/d' employees 
    EMPLOYEE_ID FIRST_NAME  LAST_NAME   EMAIL   PHONE_NUMBER    HIRE_DATE   JOB_ID  SALARY  COMMISSION_PCT  MANAGER_ID  DEPARTMENT_ID
    100 Steven  King    SKING   515.123.4567    03/06/17    AD_PRES 24000           90
    101 Neena   Kochhar NKOCHHAR    515.123.4568    05/09/21    AD_VP   17000       100 90
    102 Lex De Haan LDEHAAN 515.123.4569    01/01/13    AD_VP   17000       100 90
    103 Alexander   Hunold  AHUNOLD 590.423.4567    06/01/03    IT_PROG 9000        102 60
    104 Bruce   Ernst   BERNST  590.423.4568    07/05/21    IT_PROG 6000        103 60
    105 David   Austin  DAUSTIN 590.423.4569    05/06/25    IT_PROG 4800        103 60
    106 Valli   Pataballa   VPATABAL    590.423.4560    06/02/05    IT_PROG 4800        103 60
    107 Diana   Lorentz DLORENTZ    590.423.5567    07/02/07    IT_PROG 4200        103 60
    108 Nancy   Greenberg   NGREENBE    515.124.4569    02/08/17    FI_MGR  12008       101 100
    109 Daniel  Faviet  DFAVIET 515.124.4169    02/08/16    FI_ACCOUNT  9000        108 100
    

    추가적으로 빈 라인들을 삭제한 후 결과를 파일로 저장 하고 싶다면 아래 형식을 사용합니다.

    sed '/^$/d' employees > new_employees   
    # " > "(다이렉션)은 덮어쓰기 기능을 합니다.
    # " >> " (리다이렉션)의 경우 기존 파일이 존재하면 덧붙이게 된다.
    

2. sed '/^ *$/d' employees > new_employees
빈 라인들이나 공백으로 채워진 행들을 삭제한 후 파일로 저장합니다.

보이는 *는 메타문자로 앞의 문자를 0개 이상 찾습니다.
행의 시작이 0개 이상의 공백으로 이뤄지다 끝을 맺으니 공백이거나 빈 줄을 찾아낸다는 의미가 됩니다.

위의 예제에서의 'd' 서브명령어는 delete의 약자로 삭제를 의미합니다.
'/'사이의 단어를 포함한 모든 줄을 삭제시키는 의미입니다.
^ 는 행의 처음을 의미하고 $는 행의 끝을 의미하니까 행의 처음과 끝이 같이 만나있는 것인 빈 줄을 의미합니다.


단어 치환

1. sed 's/IT_PROG/DEVELOPER/g' employees IT_PROG라고 되어있는 단어를 DEVELOPER로 변경

student@nasa1515:/home/won/script$ sed 's/IT_PROG/DEVELOPER/g' employees 
EMPLOYEE_ID FIRST_NAME  LAST_NAME   EMAIL   PHONE_NUMBER    HIRE_DATE   JOB_ID  SALARY  COMMISSION_PCT  MANAGER_ID  DEPARTMENT_ID
100 Steven  King    SKING   515.123.4567    03/06/17    AD_PRES 24000           90
101 Neena   Kochhar NKOCHHAR    515.123.4568    05/09/21    AD_VP   17000       100 90
102 Lex De Haan LDEHAAN 515.123.4569    01/01/13    AD_VP   17000       100 90
103 Alexander   Hunold  AHUNOLD 590.423.4567    06/01/03    DEVELOPER   9000        102 60
104 Bruce   Ernst   BERNST  590.423.4568    07/05/21    DEVELOPER   6000        103 60
105 David   Austin  DAUSTIN 590.423.4569    05/06/25    DEVELOPER   4800        103 60
106 Valli   Pataballa   VPATABAL    590.423.4560    06/02/05    DEVELOPER   4800103 60
107 Diana   Lorentz DLORENTZ    590.423.5567    07/02/07    DEVELOPER   4200        103 60
108 Nancy   Greenberg   NGREENBE    515.124.4569    02/08/17    FI_MGR  12008       101 100
109 Daniel  Faviet  DFAVIET 515.124.4169    02/08/16    FI_ACCOUNT  9000        108 100

2. sed 's/it_prog/DEVELOPER/gi' employees
기능은 동일하지만 i옵션을 사용하면 대소문자를 구분하지 않습니다.
예제에서 s와 같이 쓰이는 g 플래그는 치환이 행에서 전체를 대상으로 이루어짐을 의미합니다.


🙌 SED subcommand 명령어 종류와 의미


명령어 표

subcommand의미
a현재 행에 하나 이상의 새로운 행을 추가합니다.
c현재 행의 내용을 새로운 내용으로 교체합니다.
d행을 삭제합니다.
i현재 행의 위에 텍스트를 삽입합니다.
h패턴 스페이스의 내용을 홀드 스페이스에 복사합니다.
H패턴 스페이스의 내용을 홀드 스페이스에 추가합니다.
g홀드 스페이스의 내용을 패턴 스페이스에 복사합니다. (패턴 스페이스가 비어있지 않는 경우 덮어쓴다)
G홀드 스페이스의 내용을 패턴 스페이스에 복사합니다. (비어있지 않은 경우에는 그 뒤에 추가)
l출력되지 않는 특수문자를 명확하게 출력합니다.
p행을 출력합니다.
n다음 입력 행을 첫 번째 명령어가 아닌 다음 명령어에서 처리하게 합니다.
qsed를 종료합니다.
r파일로부터 행을 읽어온다.
!선택된 행을 제외한 나머지 전체 행에 명령어를 적용합니다.
s문자열을 치환합니다.

sed s와 같이 쓰는 치환플래그

s와 쓰이는 플래그의미
g치환이 행 전체에 대해 이뤄진다.
p행을 출력합니다.
w파일에 쓴다.
x홀드 버퍼와 패턴 스페이스의 내용을 서로 맞바꾼다.
y한 문자를 다른 문자로 변환합니다. (y에 정규표현식 메타문자를 사용할 수 없다)


🐱‍🏍 다양한 사용 예시


1. (출력) p 예시

  • sed -n '/love/p' file
    file파일에서 love가 포함된 행들을 찾아 출력 (-n 옵션을 사용해야 패턴을 포함하는 줄들만 출력합니다)
  • sed -n '/west/,/east/p' file
    west가 나오는 행과 east가 나오는 행 사이의 모든 행들이 출력.
    (west가 east 다음에 나오면 west가 나오는 행부터 파일의 마지막까지 출력됩니다.)
  • sed -n '3,/^employee/p' file
    3번째 행부터 employee로 시작되는 행까지 출력.

2. (삭제) d 예시

  • sed '3d' file
    파일에서 3번째 행을 삭제. (나머지 행들이 출력)
  • sed '5,$d' file
    5번째 행부터 마지막 행까지 삭제, (나머지 행들이 출력)
  • sed '$d' file
    마지막 행을 삭제. (나머지 행들이 출력)
  • sed '/apple/d' file
    파일에서 apple 포함하는 모든 행을 삭제 (나머지 행들이 출력)

3. (치환) s 예시

  • sed 's/clere/clear/g' file
    clere라는 단어를 clear로 치환 (g 옵션을 사용해 행 전체)
  • sed -n 's/clere/clear/gp' file
    s-n,p조합이랑 같이 쓰면 변경이 일어난 행들만 출력.
  • cat file | sed 's/ */ /g'
    위와같이 다른 명령어와 같이 사용할 수도 있습니다. 공백이 여러개 존재 시 하나의 공백으로 치환해 출력 (원본 영향 없음)
  • sed -i 's/ */ /g' file
    -i옵션을 사용 시 파일에 직접 수정을 가능케 합니다. (원본 영향 있음)
  • sed 's/[0-9][0-9]$/&.5/' file
    [0-9][0-9]는 0~9까지의 두 자리 숫자를 의미합니다. 그 다음에 끝을 의미하는'$'를 사용하면
    '두 자리 숫자로 끝나는 행'이 바꿈의 대상이 됩니다. 여기서 '&'는 검색열에서 지정한 문자열을 대신합니다.
    그 문자열 뒤에 '.5'가 붙습니다. 즉 두자리 숫자로 끝나는 행 (ex 94) 를 찾으면 뒤에 점오를 붙인 단어로 (ex 94.5) 치환해 보여달라는 명령어입니다.
student@nasa1515:/home/won/script$ sed 's/[0-9][0-9]$/&.5/' datafile
northwest   NW  Charles Main        3.0 .98 3   34.5
western     WE  Sharon Gray     5.3 .97 5   23.5
southwest   SW  Lewis Dalsass       2.7 .8  2   18.5
southern    SO  Suan Chin       5.1 .95 4   15.5
southeast   SE  Patricia Hemenway   4.0 .7  4   17.5
eastern     EA  TB Savage       4.4 .84 5   20.5
northeast   NE  AM Main Jr.     5.1 .94 3   13.5
north       NO  Margot Weber        4.5 .89 5    9
central     CT  Ann Stephens        5.7 .94 5   13.5

다음과 같이 .5가 붙는 것을 확인할 수 있습니다.


(read) r 예시

  • sed '/Ernst/r test' file
    file파일로부터 Ernst라는 단어를 찾으면 패턴 찾은 행 뒤에 test의 내용을 붙여 출력합니다.

테스트 파일을 하나 생성후

student@nasa1515:/home/won/script$ echo test > test
student@nasa1515:/home/won/script$ cat test 
test

명령어를 테스트

student@nasa1515:/home/won/script$ sed '/Ernst/r test' employees 
EMPLOYEE_ID FIRST_NAME  LAST_NAME   EMAIL   PHONE_NUMBER    HIRE_DATE   JOB_ID  SALARY  COMMISSION_PCT  MANAGER_ID  DEPARTMENT_ID
100 Steven  King    SKING   515.123.4567    03/06/17    AD_PRES 24000           90
101 Neena   Kochhar NKOCHHAR    515.123.4568    05/09/21    AD_VP   17000       100 90
102 Lex De Haan LDEHAAN 515.123.4569    01/01/13    AD_VP   17000       100 90
103 Alexander   Hunold  AHUNOLD 590.423.4567    06/01/03    IT_PROG 9000        102 60
104 Bruce   Ernst   BERNST  590.423.4568    07/05/21    IT_PROG 6000    103 60
test           <----------------------- 출력확인
105 David   Austin  DAUSTIN 590.423.4569    05/06/25    IT_PROG 4800    103 60
106 Valli   Pataballa   VPATABAL    590.423.4560    06/02/05    IT_PROG 4800        103 60
107 Diana   Lorentz DLORENTZ    590.423.5567    07/02/07    IT_PROG 4200        103 60
108 Nancy   Greenberg   NGREENBE    515.124.4569    02/08/17    FI_MGR12008     101 100
109 Daniel  Faviet  DFAVIET 515.124.4169    02/08/16    FI_ACCOUNT  9000        108 100
student@nasa1515:/home/won/script$ 

위의 결과와 같이 Ernst 문자가 있는 행 아래 test라는 파일의 내용이 출력됨.


4. 문자열 추가(append) a\ 명령어 예시

  • sed '/test$/a\APPEND TEST' file
    file파일에서 test로 끝나는 행을 찾아 'APPEND TEST'을 추가합니다.
student@nasa1515:/home/won/script$ sed '/test$/a\APPEND TEST' test 
test
APPEND TEST

위와 같이 test 아래에 문자열이 추가되는 것을 확인할 수 있다.


5. 패턴스페이스홀드스페이스 예시

  • sed -e '/LDEHAAN/h' -e '$G' employees
    file파일에서 LDEHAAN라는 단어를 찾은 후 그 행들을 홀드스페이스에 저장해놓습니다. (h명령어)
    그리고 $는 마지막 행을 의미함으로 마지막 행에 홀드스페이스 내용을 패턴스페이스에 복사합니다.
    대문자G의 경우 패턴스페이스에 내용이 있을 경우 뒤에 추가하는 명령어이므로 텍스트 맨 뒤에 복사됩니다.
    즉, 패턴 LDEHAAN를 포함하는 행들은 모두 홀드 스페이스로 복사되었다가 파일의 마지막에 추가됩니다.
student@nasa1515:/home/won/script$ sed -e '/LDEHAAN/h' -e '$G' employees 
EMPLOYEE_ID FIRST_NAME  LAST_NAME   EMAIL   PHONE_NUMBER    HIRE_DATE   JOB_ID  SALARY  COMMISSION_PCT  MANAGER_ID  DEPARTMENT_ID
100 Steven  King    SKING   515.123.4567    03/06/17    AD_PRES 24000           90
101 Neena   Kochhar NKOCHHAR    515.123.4568    05/09/21    AD_VP   17000       100 90
102 Lex De Haan LDEHAAN 515.123.4569    01/01/13    AD_VP   17000       100 90
103 Alexander   Hunold  AHUNOLD 590.423.4567    06/01/03    IT_PROG 9000        102 60
104 Bruce   Ernst   BERNST  590.423.4568    07/05/21    IT_PROG 6000        103 60
105 David   Austin  DAUSTIN 590.423.4569    05/06/25    IT_PROG 4800        103 60
106 Valli   Pataballa   VPATABAL    590.423.4560    06/02/05    IT_PROG 4800        103 60
107 Diana   Lorentz DLORENTZ    590.423.5567    07/02/07    IT_PROG 4200        103 60
108 Nancy   Greenberg   NGREENBE    515.124.4569    02/08/17    FI_MGR  12008       101 100
109 Daniel  Faviet  DFAVIET 515.124.4169    02/08/16    FI_ACCOUNT  9000        108 100
102 Lex De Haan LDEHAAN 515.123.4569    01/01/13    AD_VP   17000       100 90

위의 예와 같이 102 번호를 가진 행이 맨뒤에 추가되었음을 확인 합니다.


Tags

#Linux
NASA1515

NASA1515

Data Engineer

Hello I'M Wonseok aka NASA1515

Expertise

Public Cloud
k8s/Docker
Python

Social Media

instagramwebsitelinkedingithub

Related Posts

[LINUX] 효율적인 리눅스 로그 관리: SYSLOGD와 RSYSLOG
[LINUX] 효율적인 리눅스 로그 관리: SYSLOGD와 RSYSLOG
2021-07-09
2 min

Topics

CloudDevelop

Social Media