Shell Script Regex Parameters | NASA1515 Blog

NASA1515 Blog

NASA1515 Blog

Shell Script Regex Parameters

Shell Script Regex Parameters

Shell Script Regex Parameters

NASA1515

NASA1515

July 06, 2021

1 min

목차

✔ 정규표현식 (REGEX)

✌ 정규표현식 표현방법

👍 정규표현식 사용 예제

✔ 정규표현식 (REGEX)

정규 표현식은 데이터 검색, 복잡한 패턴 매칭을 도와주는 특별한 문자입니다
정규표현식(regular expression)은 줄여서 'regexp' 또는 'regex' 라고도 합니다.
정규 표현식은 리눅스 뿐만 아니라 유닉스, SQL, R, Python 등 에서도 사용할 수 있습니다.

스크린샷, 2020-08-19 14-23-56

✌ 정규표현식 표현방법

정규표현식은 표준인 POSIX의 정규표현식과 POSIX 정규표현식에서 확장된 Perl방식의 PCRE가 대표적입니다
이외에도 수많은 정규표현식이 존재하지만 약간의 차이점이 있을뿐 대부분 비슷합니다.
정규표현식에서 사용하는 기호를 Meta문자라고 합니다.

Meta문자란 표현식 내부에서 특정한 의미를 갖는 문자를 말하며, 공통적인 기본 Meta문자의 종류로는 다음과 같습니다.

Meta 문자중에 독특한 성질을 지니고 있는 문자클래스'[ ]'라는 문자가 있습니다.
문자클래스는 그 내부에 해당하는 문자열의 범위 중 한 문자만 선택한다는 의미이며, 문자클래스 내부에서는 Meta문자를 사용할 수 없거나 의미가 다르게 사용됩니다.

POSIX에서만 사용하는 문자클래스가 있는데 단축키처럼 편리하게 사용할 수 있습니다.
대표적인 POSIX 문자클래스 입니다. 대괄호'[ ]' 가 붙어있는 모양이 표현식으로 문자클래스로 사용하면 대괄호를 씌워야만 정상적인 결과를 얻을 수 있습니다.

Flag의 종류
자주 사용하는 Flag는 밑의 3종류가 있으며 Flag를 사용을 하지 않을 수도 있습니다.
만약 Flag를 설정 하지 않을 경우에는 문자열 내에서 검색대상이 많더라도 한번만 찾고 끝나게 됩니다.

👍 정규표현식 사용 예제

우선 실습을 위해서 아래와 같은 텍스트 파일을 만들었습니다.

$ cat nasa1515.txt 
drum
photography
data science
greenplum
python
R
book
movie
dancing
singing
milk
english
gangnam style
new face
soccer
pingpong
sleeping
martial art
jogging
blogging
apple
grape
banana
tomato
bibimbab
kimchi
@email
123_abc_d4e5
xyz123_abc_d4e5
123_abc_d4e5.xyz
xyz123_abc_d4e5.xyz

기본 정규 표현식을 실습

정규표현식은 큰 따옴표(" ")안에 매칭할 문자와 함께 사용합니다.

1. 문자열의 처음 시작 부분 매칭: ^ , -n 은 행번호를 출력하라는 뜻입니다.

student@nasa1515:/home/won/script$ grep -n "^m" nasa1515   # m으로 시작하는 텍스트
8:movie
11:milk
18:martial art

2. 문자열의 끝 부분 매칭: $

student@nasa1515:/home/won/script$ grep -n "m$" nasa1515 
1:drum
4:greenplum

3. 점의 개수만큼 아무 문자나 대체: ...

# m 문자 뒤에 아무 문자 3개 이상이 존재하는 텍스트 검색

student@nasa1515:/home/won/script$ grep -n "m..." nasa1515 
8:movie
11:milk
13:gangnam style
18:martial art
24:tomato
25:bibimbab
26:kimchi
27:@email

# m 문자 뒤에 아무 문자 5개 이상이 존재하는 텍스트 검색
student@nasa1515:/home/won/script$ grep -n "m....." nasa1515 
13:gangnam style
18:martial art

# m 문자 앞에 2개 이상 + 뒤에 3개 이상이 존재하는 텍스트 검색
student@nasa1515:/home/won/script$ grep -n "..m..." nasa1515 
13:gangnam style
24:tomato
25:bibimbab
26:kimchi
27:@email

# m 문자 앞에 5개 이상이 존재하는 텍스트 검색
student@nasa1515:/home/won/script$ grep -n "....m" nasa1515 
4:greenplum
13:gangnam style
25:bibimbab

4. * 부호 앞의 문자와 여러개 매칭 : *

student@nasa1515:/home/won/script$ grep -n "app*" nasa1515 
2:photography
21:apple
22:grape
------------------------------------------------------------------------------------
student@nasa1515:/home/won/script$ grep -n "^app" nasa1515 
21:apple

5. 특수 문자와 매칭: \

student@nasa1515:/home/won/script$ grep "\@" nasa1515 
@email

6. a나 b로 시작하는 모든 행을 찾아서 출력 : ^[ab]

student@nasa1515:/home/won/script$ grep "^[ab]" nasa1515 
book
blogging
apple
banana
bibimbab

7. 0~9 사이 숫자로 시작하는 단어 : ^[0-9]

student@nasa1515:/home/won/script$ grep "^[0-9]" nasa1515 
123_abc_d4e5
123_abc_d4e5.xyz

8. x~z 사이 알파벳으로 끝나는 단어 : [x-z]$

student@nasa1515:/home/won/script$ grep "[x-z]$" nasa1515 
photography
123_abc_d4e5.xyz
xyz123_abc_d4e5.xyz

간격 정규 표현식 실습

간격 정규 표현식은 문자열 안에서 특정 문자가 몇 번 출현 했는지를 가지고 패턴 매칭할 때 사용합니다.

1. 앞의 문자와 ‘n’번 정확하게 매칭: {n}
grep -E "character"\{n} 의 형식으로 사용합니다.

# 기존 파일에서의 g 문자가 포함된 내역은 다음과 같다.
student@nasa1515:/home/won/script$ grep "g" nasa1515 
photography
greenplum
dancing
singing
english
gangnam style
pingpong
sleeping
jogging
blogging
grape

# 이번에는 g가 두번 반복되어있는 문자를 찾아봤다.
student@nasa1515:/home/won/script$ 
student@nasa1515:/home/won/script$ grep -E "g"\{2} nasa1515 
jogging
blogging

확장 정규 표현식 실습

확장 정규 표현식은 한 개 이상의 표현식을 결합하여 사용할 수 있게 해줍니다.

1. \+앞의 문자가 한번 이상 출현한 문자열과 매칭: \+

# 해당 파일에는 k 문자가 포함된 문자열은 다음과 같다.
student@nasa1515:/home/won/script$ grep "k" nasa1515 
book
milk
kimchi

# 문자 'k'의 앞에 'o'가 있는 문자열을 선별하고 싶은 경우 "o\+k" 정규표현식 사용

student@nasa1515:/home/won/script$ grep "o\+k" nasa1515 
book

Tags

NASA1515

NASA1515

NASA1515

Data Engineer

Hello I'M Wonseok aka NASA1515

Expertise

Public Cloud

k8s/Docker

Python

Social Media

instagram website linkedin github

Related Posts

My experience in getting LPIC

My experience in getting LPIC

My experience in getting LPIC

2021-07-12

1 min

LINUX - SYSLOGD

LINUX - SYSLOGD

LINUX - SYSLOGD

2021-07-09

2 min

Shell script Command line arguments

Shell script Command line arguments

Shell script Command line arguments

2021-07-05

1 min

Shell Script variables in sed

Shell Script variables in sed

Shell Script variables in sed

2021-07-05

3 min

NASA1515 Blog

NASA1515 Blog

© 2024, All Rights Reserved.

Topics

Tags

Social Media

github instagram linkedin