来自外部REST API的AWS Glue作业消耗数据

德米特里-斯塔德尼克

我正在尝试创建一个工作流,其中AWS Glue ETL作业将从外部REST API而不是S3或任何其他AWS内部源中提取JSON数据。那有可能吗?有人吗 请帮忙!

艾达·马丁内斯(Aida Martinez)

是的,我的确从诸如Twitter,FullStory,Elasticsearch之类的REST API中提取数据。通常,我确实使用Python Shell作业进行提取,因为它们的速度更快(相对较小的冷启动)。完成后,它会触发一个Spark类型的作业,该作业仅读取我需要的json项目。我使用请求pyhton库。

为了将数据保存到S3中,您可以执行以下操作

import boto3
import json

# Initializes S3 client
s3 = boto3.resource('s3')

tweets = []
//Code that extracts tweets from API
tweets_json = json.dumps(tweets)
obj = s3.Object("my-tweets", "tweets.json")
obj.put(Body=data)

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

流星:来自外部API调用的数据未呈现

来自分类Dev

带有来自外部 Api 的缓存数据的 Falcor 模型

来自分类Dev

通过 API-KEY 使用来自外部 API 的数据的 Alexa 技能

来自分类Dev

ember-app-kit-使用来自外部文件的数据对api进行存根

来自分类Dev

使用Promise用来自外部API的数据填充数组

来自分类Dev

在没有API的情况下显示来自外部URL的JSON数组中的数据

来自分类Dev

仅允许来自外部网络的api

来自分类Dev

仅允许来自外部网络的api

来自分类Dev

来自外部表的MySQL数据

来自分类Dev

计算来自外部源的数据

来自分类Dev

如何设置流星以接收来自外部API的事件?

来自分类Dev

将来自外部api的内容添加到Contentful

来自分类Dev

IONIC / Angular不显示来自外部API的JSON结果

来自分类Dev

来自外部 api 的 @Autowiredl bean 始终为空

来自分类Dev

查看Google Spreadsheet中的数据(数据来自外部)

来自分类Dev

莫里斯图表不显示来自外部URL的数据

来自分类Dev

莫里斯图表不显示来自外部URL的数据

来自分类Dev

修复来自外部网络的内核丢弃数据包

来自分类Dev

来自外部数据的 Angular 2 Bootstrap 应用程序

来自分类Dev

将来自外部网站的帖子数据提交到 Laravel

来自分类Dev

来自外部计算机的Docker远程Api没有响应

来自分类Dev

来自外部应用程序的Shopify API?(backbone.js)

来自分类Dev

Laravel 4 API不允许来自外部站点的POST请求

来自分类Dev

使用AJAX提交html表单并显示来自外部api的json响应

来自分类Dev

如何合并来自外部API的请求并在Flask中将其作为响应发送

来自分类Dev

跨应用程序处理来自外部 API 的网络错误

来自分类Dev

如何测试使用来自外部 API 的复杂对象的函数?

来自分类Dev

使用合并语句的种子数据,包括来自外部表的数据

来自分类Dev

如何在Rails中同步来自外部数据库的数据?

Related 相关文章

  1. 1

    流星:来自外部API调用的数据未呈现

  2. 2

    带有来自外部 Api 的缓存数据的 Falcor 模型

  3. 3

    通过 API-KEY 使用来自外部 API 的数据的 Alexa 技能

  4. 4

    ember-app-kit-使用来自外部文件的数据对api进行存根

  5. 5

    使用Promise用来自外部API的数据填充数组

  6. 6

    在没有API的情况下显示来自外部URL的JSON数组中的数据

  7. 7

    仅允许来自外部网络的api

  8. 8

    仅允许来自外部网络的api

  9. 9

    来自外部表的MySQL数据

  10. 10

    计算来自外部源的数据

  11. 11

    如何设置流星以接收来自外部API的事件?

  12. 12

    将来自外部api的内容添加到Contentful

  13. 13

    IONIC / Angular不显示来自外部API的JSON结果

  14. 14

    来自外部 api 的 @Autowiredl bean 始终为空

  15. 15

    查看Google Spreadsheet中的数据(数据来自外部)

  16. 16

    莫里斯图表不显示来自外部URL的数据

  17. 17

    莫里斯图表不显示来自外部URL的数据

  18. 18

    修复来自外部网络的内核丢弃数据包

  19. 19

    来自外部数据的 Angular 2 Bootstrap 应用程序

  20. 20

    将来自外部网站的帖子数据提交到 Laravel

  21. 21

    来自外部计算机的Docker远程Api没有响应

  22. 22

    来自外部应用程序的Shopify API?(backbone.js)

  23. 23

    Laravel 4 API不允许来自外部站点的POST请求

  24. 24

    使用AJAX提交html表单并显示来自外部api的json响应

  25. 25

    如何合并来自外部API的请求并在Flask中将其作为响应发送

  26. 26

    跨应用程序处理来自外部 API 的网络错误

  27. 27

    如何测试使用来自外部 API 的复杂对象的函数?

  28. 28

    使用合并语句的种子数据,包括来自外部表的数据

  29. 29

    如何在Rails中同步来自外部数据库的数据?

热门标签

归档