파이썬 : 파일에서 읽는 비 ASCII 문자를 제거하는 방법

비올라 프 테린

나는 파이썬으로 다음과 같은 긴 데이터 목록을 처리하고 있습니다.

데이터 스크린 샷

digraphs는 아마도 인코딩 문제 때문일 것입니다. (이 사이트에서 이러한 문자가 보존되는지 여부는 확실하지 않습니다.)

29/07/2016 04:00:12 0.125143    

이제 open같은 것을 사용하여 이러한 파일을 스크립트로 readlines읽으면 오류가 발생합니다.

SyntaxError: EOL while scanning string literal

교체 및 정규식 함수를 알고 (또는 사용법을 찾아 볼 수 있지만) 스크립트에서 수행 할 수 없습니다. 가장 큰 문제는 내가 그런 이상한 문자를 포함하거나 읽는 곳에서 읽은 바로 그 줄을 가리키는 오류가 발생한다는 것입니다. 그래서 나는 그들에게 아무것도 할 수 없습니다 .

비올라 프 테린

나는 re.findall작품을 찾습니다 . (이 일의 중요성이 사라졌기 때문에 다른 모든 방법을 테스트 할 시간이 없어서 미안하고이 질문 자체도 잊어 버렸습니다.)

def extract_numbers(str_i):
   pat="(\d+)/(\d+)/(\d+)\D*(\d+):(\d+):(\d+)\D*(\d+)\.(\d+)"
   match_h = re.findall(pat, str_i)
   return match_h[0]

# ....
# `f` is the handle of the file in question
lines =f.readlines()
for l in lines:
   ls_f =extract_numbers(l)
   # process them....

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정
0

몇 마디 만하겠습니다

0리뷰
로그인참여 후 검토

관련 기사

분류에서Dev

파이썬에서 비 Ascii 문자의 str 표현을 반환하는 방법

분류에서Dev

파이썬에서 여러 파일에서 문자를 제거하는 방법

분류에서Dev

파이썬에서 문자열의 ASCII 문자를 감지하는 방법

분류에서Dev

파이썬에서 문자열 / 데이터 프레임 [i]의 비 특정 문자를 제거하는 방법

분류에서Dev

파이썬 파일에서 문자를 검색하는 방법

분류에서Dev

파이썬 목록에서 비 단어를 제거하는 방법

분류에서Dev

정규식 Python을 사용하여 파일에서 비 ASCII 문자를 찾는 방법

분류에서Dev

파이썬에서 mkv 파일에서 비디오 이미지를 읽는 방법은 무엇입니까?

분류에서Dev

파이썬 문서를 읽는 방법

분류에서Dev

파이썬에서 원하지 않는 문자를 제거하는 방법

분류에서Dev

파이썬에서 문자열을 비교하는 방법

분류에서Dev

JSON 데이터 파이썬에서 특수 문자를 제거하는 방법

분류에서Dev

파이썬으로 사이드 문자열에서 " '[[]]"를 제거하는 방법

분류에서Dev

'!'를 제거하는 방법 파이썬 목록의 각 문자열 끝에서?

분류에서Dev

CSV 파일에서 ','문자를 제거하는 방법

분류에서Dev

파이썬에서 Regex를 사용하여 문자를 제외한 모든 문자를 제거하는 방법

분류에서Dev

파이썬에서 텍스트 파일을 읽을 때 이스케이프 문자를 평가하는 방법

분류에서Dev

Python에서 ASCII가 아닌 문자를 제거하는 방법

분류에서Dev

파이썬에서 문자열과 결합 된 ASCII를 디코딩하는 방법

분류에서Dev

텍스트 파일에서 파이썬의 문자열에서 빈 [ '']을 제거하는 방법

분류에서Dev

파이썬에서 xml 파일에서 데이터를 읽는 방법

분류에서Dev

파일에서이 문자열을 제거하는 방법

분류에서Dev

파이썬에서 이진 문자열을 읽는 방법

분류에서Dev

파이썬에서 문자열을 보유하는 네 가지 변수를 동일시하거나 비교하는 방법

분류에서Dev

파이썬에서 여러 파일 읽기를 최적화하는 방법

분류에서Dev

Linux에서 ascii 파일에서 모든 상위 비트를 제거하고 나머지 비트는 유지하는 방법은 무엇입니까? -ISTRIP과 비슷하지만 파일 포함

분류에서Dev

파이썬 : not 연산자를 'not'문자열과 비교하는 방법?

분류에서Dev

문자열 파이썬에서 모든 이모티콘 (유니 코드) 문자를 제거하는 방법

분류에서Dev

파일에서 정수를 읽는 다른 방법 비교

Related 관련 기사

  1. 1

    파이썬에서 비 Ascii 문자의 str 표현을 반환하는 방법

  2. 2

    파이썬에서 여러 파일에서 문자를 제거하는 방법

  3. 3

    파이썬에서 문자열의 ASCII 문자를 감지하는 방법

  4. 4

    파이썬에서 문자열 / 데이터 프레임 [i]의 비 특정 문자를 제거하는 방법

  5. 5

    파이썬 파일에서 문자를 검색하는 방법

  6. 6

    파이썬 목록에서 비 단어를 제거하는 방법

  7. 7

    정규식 Python을 사용하여 파일에서 비 ASCII 문자를 찾는 방법

  8. 8

    파이썬에서 mkv 파일에서 비디오 이미지를 읽는 방법은 무엇입니까?

  9. 9

    파이썬 문서를 읽는 방법

  10. 10

    파이썬에서 원하지 않는 문자를 제거하는 방법

  11. 11

    파이썬에서 문자열을 비교하는 방법

  12. 12

    JSON 데이터 파이썬에서 특수 문자를 제거하는 방법

  13. 13

    파이썬으로 사이드 문자열에서 " '[[]]"를 제거하는 방법

  14. 14

    '!'를 제거하는 방법 파이썬 목록의 각 문자열 끝에서?

  15. 15

    CSV 파일에서 ','문자를 제거하는 방법

  16. 16

    파이썬에서 Regex를 사용하여 문자를 제외한 모든 문자를 제거하는 방법

  17. 17

    파이썬에서 텍스트 파일을 읽을 때 이스케이프 문자를 평가하는 방법

  18. 18

    Python에서 ASCII가 아닌 문자를 제거하는 방법

  19. 19

    파이썬에서 문자열과 결합 된 ASCII를 디코딩하는 방법

  20. 20

    텍스트 파일에서 파이썬의 문자열에서 빈 [ '']을 제거하는 방법

  21. 21

    파이썬에서 xml 파일에서 데이터를 읽는 방법

  22. 22

    파일에서이 문자열을 제거하는 방법

  23. 23

    파이썬에서 이진 문자열을 읽는 방법

  24. 24

    파이썬에서 문자열을 보유하는 네 가지 변수를 동일시하거나 비교하는 방법

  25. 25

    파이썬에서 여러 파일 읽기를 최적화하는 방법

  26. 26

    Linux에서 ascii 파일에서 모든 상위 비트를 제거하고 나머지 비트는 유지하는 방법은 무엇입니까? -ISTRIP과 비슷하지만 파일 포함

  27. 27

    파이썬 : not 연산자를 'not'문자열과 비교하는 방법?

  28. 28

    문자열 파이썬에서 모든 이모티콘 (유니 코드) 문자를 제거하는 방법

  29. 29

    파일에서 정수를 읽는 다른 방법 비교

뜨겁다태그

보관