파일을 다운로드하기 위해 파이썬에서 다중 처리 / 다중 스레딩

debugcn 에 게시 Dev

제이크 웡

yahoo finance에서 가져 오려는 기호 목록이 포함 된 csv 파일이 있습니다. (약 3000 개)

df = pandas.read_csv('ticker_file.csv')
start = datetime.datetime(2010, 1, 1)
end = datetime.datetime.today()

for each_code in df['Symbol']:  # got it from pandas website "Remote Data Access"
    get_prices = web.DataReader(each_code, 'yahoo', start, end)
    get_prices.to_csv(each_code + '.csv')

하나를 당겨서 symbol저장하는 데 약 2.5 ~ 3 초가 걸립니다 csv.

이 프로세스를 가속화하기 위해 다중 처리 / 하이퍼 스레딩을 사용하는 것이 가능하거나 더 빠를까요?

pyInTheSky

다중 처리 작업자 풀을 매우 쉽게 사용할 수 있습니다. https://docs.python.org/2/library/multiprocessing.html 과 제공된 첫 번째 예제 (5 명의 작업자 풀 사용)를 살펴보십시오 . 다음과 같이 보일 것입니다.

def f(each_code):
    start = datetime.datetime(2010, 1, 1)
    end = datetime.datetime.today()
    get_prices = web.DataReader(each_code, 'yahoo', start, end)
    get_prices.to_csv(each_code + '.csv')

p = Pool(20)
p.map(f, df['Symbol'])

속도가 빨라질 지 여부는 말할 수 없습니다. 웹 사이트가 불평하지 않는 한 그렇게 될 것입니다.

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-06-7

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

파일을 다운로드하기 위해 파이썬에서 다중 처리 / 다중 스레딩

파일을 다운로드하기 위해 파이썬에서 다중 처리 / 다중 스레딩

Python에서 NCBI 파일을 다운로드하기위한 멀티 스레딩

다중 스레딩을 사용하여 Java에서 파일 다운로드

다른 다중 열 텍스트 파일을 얻기 위해 다중 열 텍스트 파일을 처리하는 방법은 무엇입니까?

이 다중 스레딩 악마 파이썬 코드 이해

Julia에서 CSV 파일 읽기를위한 다중 스레딩

파이썬에서 다중 스레딩 시스템 호출

파이썬 다중 처리 에이전트 및 udp 리스너

단일 파일에서 다중 파일로의 스프링 배치 다중 스레드 처리

다중 스레딩을 사용하여 파일에서 데이터로드

파이썬 다중 처리 로깅 : RotatingFileHandler "다른 프로세스에서 파일을 사용 중"오류가있는 QueueHandler

다중 스레딩 및 파일 읽기

파이썬에서 멀티 스레딩을 사용하여 파일 다운로드

다중 처리 또는 다중 스레딩을 사용하여 Python에서 스크래핑 속도 향상

모든 데이터를 읽지 않는 다중 처리 대기열에서 데이터에 액세스하는 파이썬 다중 처리

스레딩 / 다중 처리를 구현하는 방법에 대해 혼동

Logstash 파일에서 다중 라인 레코드 처리

루프 속도를 높이기위한 Python 다중 스레딩 및 다중 처리

다중 처리 및 Shutil Python을 통해 디렉토리에서 파일 복사

for 루프에서 파이썬 다중 처리

파이썬에서 다중 처리 (for 루프에서 다중 처리 for 루프로 이동)

파이썬 argparse 다중 인수 처리

파이썬 다중 처리 풀 대 프로세스?

파이썬 코딩 스타일-다중 리턴 문

파이썬 : XML 파일 다운로드 및 캐싱-인코딩 선언을 처리하는 방법?

다중 스레드 AWS S3 파일 업로드에서 "java.net.SocketException : 연결 재설정"을 어떻게 처리해야합니까?

cronjob에서 파이썬 다중 스레딩 문제가 실행되지 않음

Python-다중 처리 및 텍스트 파일 처리

파일을 동시에 다운로드하기 위해 MapReduce 작업을 작성 중입니까?

분산 컴퓨팅을 위해 다중 처리 pool.map을 사용하는 파이썬