R의 문자열에서 이러한 요소를 제거하는 방법

키스시오 페스

내 열 중 하나에 다음 문자열이 포함되어 있습니다.

    259333154-Carat Programmatic»FCO»O»EV3»D&B - FCO Prospects ABM DDD 2020 D&B ABM ENDING 1/31/2020»NA+728 x 90»IN»UNV»TP»PM»dCPM»NAT»BTP»RON»NA»DB»N/A»ENG»M»P159WXZ
    238114259-Carat Programmatic»CPO XT5»O»EV2»END DATE 2/28/19 Google Custom Intent - XT5 CPO Google Custom Intent Audience/In Market Audience»NA+160 x 600»IN»DSK»TP»PM»CPM»NAT»BTS»RON»NA»DB»N/A»ENG»M»PX5LV6
    251368220-Carat Programmatic»XT6»O»EV1»END DATE 9/30/19 2019   Cadillac SMRT Always On - CRM - SMRT Segment XT6 Desktop Display»NA+160 x 600»IN»DSK»TP»PM»CPM»NAT»PRS»RON»NA»DB»N/A»ENG»M»P12LQG3
    235105211-Ebay»Silverado 1500»M»CON»ended   3/20 - ROS - eBay Run of Motors Desktop»NA+300 x 250»IN»DSK»TP»PM»CPM»NAT»SCR»ROS»NA»DB»N/A»ENG»M»PW79JH
    234990143-Carat Programmatic»XT4»O»EV2»Endemic - Loyalist|Edmunds&Oracle|N/A|Vehicle|N/A 2»NA+300 x 250»IN»MOB»TP»PM»CPM»NAT»BTO»RON»IMW»DB»N/A»ENG»M»PW7NSN

내 임무는 문자열에서 다음을 제거하는 것입니다.

  1. 날짜 (예 : 1/31/2020, 3/20)
  2. 문자열 좋아 Ending, ENDING, END, end, End, END DATE하지만하지 않은 문자열에서 "끝" endemic마지막처럼에
  3. 이중 공백 예 " "

나는 이것으로 정말 힘든 시간을 보내고 있습니다. 일부 작업을 수행하기 위해 다음과 같이 여러 줄의 코드를 사용하고 있지만이 작업을 더 간결하고 완전하게 수행하는 방법을 모릅니다.

dat = gsub("2017|2018|2019|2020", "" ,dat)
dat = gsub("»»", "»", dat)
dat = gsub("END ", "", dat)
dat = gsub("end ", "", dat)
dat = gsub("Ended ", "", dat)
dat = gsub("ENDED ", "", dat)
dat = gsub("DATE|date|Date", "", dat)

도와 주셔서 감사합니다!

Ryszard 체코

다음을 확인하십시오.

  • \b(?:0?[1-9]|1[012])(?:[-/.](?:0?[1-9]|[12][0-9]|3[01]))?[-/.](?:19|20)?\d\d\b "날짜 (예 : 2020 년 1/31/2020, 3/20)"사례를 처리해야합니다.
  • (?i)\bEnd(?: DATE|(?:ing)?)\b "Ending", "ENDING", "END", "end", "End", "END DATE"와 같은 문자열은 처리해야하지만 마지막 문자열과 같이 "endemic"이있는 문자열의 "end"는 처리하지 않아야합니다. 케이스
  • ([\s»]){2,}" 이중 공백 예 :" " "케이스를 처리해야합니다 .

모두 결합 :

gsub("\\b(?:End(?:\\s+DATE|(?:ing)?)|(?:0?[1-9]|1[012])(?:[-/.](?:0?[1-9]|[12][0-9]|3[01]))?[-/.](?:19|20)?\\d\\d)\\b|([\\s»]){2,}", "\\1", x, perl=TRUE, ignore.case=TRUE)

증거를 참조하십시오 .

설명

--------------------------------------------------------------------------------
  \b                       the boundary between a word char (\w) and
                           something that is not a word char
--------------------------------------------------------------------------------
  (?:                      group, but do not capture:
--------------------------------------------------------------------------------
    End                      'End'
--------------------------------------------------------------------------------
    (?:                      group, but do not capture:
--------------------------------------------------------------------------------
       DATE                    ' DATE'
--------------------------------------------------------------------------------
     |                        OR
--------------------------------------------------------------------------------
      (?:                      group, but do not capture (optional
                               (matching the most amount possible)):
--------------------------------------------------------------------------------
        ing                      'ing'
--------------------------------------------------------------------------------
      )?                       end of grouping
--------------------------------------------------------------------------------
    )                        end of grouping
--------------------------------------------------------------------------------
   |                        OR
--------------------------------------------------------------------------------
    (?:                      group, but do not capture:
--------------------------------------------------------------------------------
      0?                       '0' (optional (matching the most
                               amount possible))
--------------------------------------------------------------------------------
      [1-9]                    any character of: '1' to '9'
--------------------------------------------------------------------------------
     |                        OR
--------------------------------------------------------------------------------
      1                        '1'
--------------------------------------------------------------------------------
      [012]                    any character of: '0', '1', '2'
--------------------------------------------------------------------------------
    )                        end of grouping
--------------------------------------------------------------------------------
    (?:                      group, but do not capture (optional
                             (matching the most amount possible)):
--------------------------------------------------------------------------------
      [-/.]                    any character of: '-', '/', '.'
--------------------------------------------------------------------------------
      (?:                      group, but do not capture:
--------------------------------------------------------------------------------
        0?                       '0' (optional (matching the most
                                 amount possible))
--------------------------------------------------------------------------------
        [1-9]                    any character of: '1' to '9'
--------------------------------------------------------------------------------
       |                        OR
--------------------------------------------------------------------------------
        [12]                     any character of: '1', '2'
--------------------------------------------------------------------------------
        [0-9]                    any character of: '0' to '9'
--------------------------------------------------------------------------------
       |                        OR
--------------------------------------------------------------------------------
        3                        '3'
--------------------------------------------------------------------------------
        [01]                     any character of: '0', '1'
--------------------------------------------------------------------------------
      )                        end of grouping
--------------------------------------------------------------------------------
    )?                       end of grouping
--------------------------------------------------------------------------------
    [-/.]                    any character of: '-', '/', '.'
--------------------------------------------------------------------------------
    (?:                      group, but do not capture (optional
                             (matching the most amount possible)):
--------------------------------------------------------------------------------
      19                       '19'
--------------------------------------------------------------------------------
     |                        OR
--------------------------------------------------------------------------------
      20                       '20'
--------------------------------------------------------------------------------
    )?                       end of grouping
--------------------------------------------------------------------------------
    \d                       digits (0-9)
--------------------------------------------------------------------------------
    \d                       digits (0-9)
--------------------------------------------------------------------------------
  )                        end of grouping
--------------------------------------------------------------------------------
  \b                       the boundary between a word char (\w) and
                           something that is not a word char
--------------------------------------------------------------------------------
 |                        OR
--------------------------------------------------------------------------------
  (                        group and capture to \1 (at least 2 times
                           (matching the most amount possible)):
--------------------------------------------------------------------------------
    [\s»]                    any character of: whitespace (\n, \r,
                             \t, \f, and " "), '»'
--------------------------------------------------------------------------------
  ){2,}                    end of \1 (NOTE: because you are using a
                           quantifier on this capture, only the LAST
                           repetition of the captured pattern will be
                           stored in \1)

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정
0

몇 마디 만하겠습니다

0리뷰
로그인참여 후 검토

관련 기사

분류에서Dev

Python .remove의 목록에서 문자열 요소를 제거하는 방법이 작동하지 않습니다.

분류에서Dev

Excel에서 문자열의 여러 문자를 제거하는 방법

분류에서Dev

문자 배열에서 요소를 제거하거나 특정 요소없이 새 배열의 복사본을 만드는 방법은 무엇입니까?

분류에서Dev

BigQuery의 문자열 배열에서 문자를 제거하는 방법이 있나요?

분류에서Dev

R의 문자열에서 인덱스로 문자를 제거하는 방법이 있습니까?

분류에서Dev

'!'를 제거하는 방법 파이썬 목록의 각 문자열 끝에서?

분류에서Dev

Excel의 데이터 열에서 문자를 제거하는 방법

분류에서Dev

파이썬 문자열에서 특정 요소까지 요소를 제거하는 방법이 있습니까?

분류에서Dev

문자열 배열에서 요소를 "제거"하는 방법

분류에서Dev

자바의 문자열에서 [를 제거하는 방법

분류에서Dev

한 열의 여러 문자열을 다른 열의 여러 문자열과 일치시키는 방법은 R에서 일치를 제거합니까?

분류에서Dev

연결된 목록에서 선택한 두 요소 사이의 모든 요소를 제거하는 방법

분류에서Dev

Pandas 데이터 프레임의 여러 열에서 문자를 제거하는 방법은 무엇입니까?

분류에서Dev

LibreOffice Calc : 여러 열에서 문자를 제거하는 방법

분류에서Dev

문자열에서 많은 양의 문자를 제거하는 더 간단한 방법은 무엇입니까?

분류에서Dev

파이썬에서 문자열 / 데이터 프레임 [i]의 비 특정 문자를 제거하는 방법

분류에서Dev

PHP의 문자열에서이 █와 같은 특수 문자를 제거하는 방법

분류에서Dev

PHP의 문자열에서이 █와 같은 특수 문자를 제거하는 방법

분류에서Dev

배열 데이터에서 특정 문자 앞의 모든 문자를 제거하는 방법

분류에서Dev

R에서 요소를 문자열로 변경하는 방법

분류에서Dev

자바의 문자열에서 모든 '\'문자를 제거하는 방법

분류에서Dev

VB.NET의 문자 배열에서 요소를 제거하는 방법은 무엇입니까?

분류에서Dev

R을 사용하여 다른 파일의 목록 요소 내보내기에서 노이즈 문자를 제거하는 방법

분류에서Dev

모든 요소의 클래스를 제거하는 방법에는 하나의 배열이 필요합니다.

분류에서Dev

파이썬 코드에서 아래 문자열의 끝에서 쉼표를 제거하는 방법

분류에서Dev

Pandas의 열에있는 행에서 특수 문자를 제거하는 가장 파이썬적인 방법

분류에서Dev

한 배열의 요소를 다른 배열에서 효율적으로 제거하는 방법

분류에서Dev

r에서 하나의 데이터를 제거하는 방법

분류에서Dev

문자열에서 문자의 LAST INSTANCE를 제거하는 방법

Related 관련 기사

  1. 1

    Python .remove의 목록에서 문자열 요소를 제거하는 방법이 작동하지 않습니다.

  2. 2

    Excel에서 문자열의 여러 문자를 제거하는 방법

  3. 3

    문자 배열에서 요소를 제거하거나 특정 요소없이 새 배열의 복사본을 만드는 방법은 무엇입니까?

  4. 4

    BigQuery의 문자열 배열에서 문자를 제거하는 방법이 있나요?

  5. 5

    R의 문자열에서 인덱스로 문자를 제거하는 방법이 있습니까?

  6. 6

    '!'를 제거하는 방법 파이썬 목록의 각 문자열 끝에서?

  7. 7

    Excel의 데이터 열에서 문자를 제거하는 방법

  8. 8

    파이썬 문자열에서 특정 요소까지 요소를 제거하는 방법이 있습니까?

  9. 9

    문자열 배열에서 요소를 "제거"하는 방법

  10. 10

    자바의 문자열에서 [를 제거하는 방법

  11. 11

    한 열의 여러 문자열을 다른 열의 여러 문자열과 일치시키는 방법은 R에서 일치를 제거합니까?

  12. 12

    연결된 목록에서 선택한 두 요소 사이의 모든 요소를 제거하는 방법

  13. 13

    Pandas 데이터 프레임의 여러 열에서 문자를 제거하는 방법은 무엇입니까?

  14. 14

    LibreOffice Calc : 여러 열에서 문자를 제거하는 방법

  15. 15

    문자열에서 많은 양의 문자를 제거하는 더 간단한 방법은 무엇입니까?

  16. 16

    파이썬에서 문자열 / 데이터 프레임 [i]의 비 특정 문자를 제거하는 방법

  17. 17

    PHP의 문자열에서이 █와 같은 특수 문자를 제거하는 방법

  18. 18

    PHP의 문자열에서이 █와 같은 특수 문자를 제거하는 방법

  19. 19

    배열 데이터에서 특정 문자 앞의 모든 문자를 제거하는 방법

  20. 20

    R에서 요소를 문자열로 변경하는 방법

  21. 21

    자바의 문자열에서 모든 '\'문자를 제거하는 방법

  22. 22

    VB.NET의 문자 배열에서 요소를 제거하는 방법은 무엇입니까?

  23. 23

    R을 사용하여 다른 파일의 목록 요소 내보내기에서 노이즈 문자를 제거하는 방법

  24. 24

    모든 요소의 클래스를 제거하는 방법에는 하나의 배열이 필요합니다.

  25. 25

    파이썬 코드에서 아래 문자열의 끝에서 쉼표를 제거하는 방법

  26. 26

    Pandas의 열에있는 행에서 특수 문자를 제거하는 가장 파이썬적인 방법

  27. 27

    한 배열의 요소를 다른 배열에서 효율적으로 제거하는 방법

  28. 28

    r에서 하나의 데이터를 제거하는 방법

  29. 29

    문자열에서 문자의 LAST INSTANCE를 제거하는 방법

뜨겁다태그

보관