使用Piglatin加载文本文件时跳过标题

帕万·库玛(Pawan Kumar)

我有一个文本文件,它的第一行包含标题。现在,我想对数据进行一些操作,但是在使用PigStorage加载文件时,它也需要HEADER。我只想跳过HEADER。是否可以这样做(直接或通过UDF)?

这是我用来加载数据的命令:

input_file = load '/home/hadoop/smdb_tracedata.csv'
USING PigStorage(',')
as (trans:chararray, carrier:chararray,aainday:chararray);
戴维斯·布罗达(Davis Broda)

如果您使用的猪版本为0.11,则可以尝试以下操作:

input_file = load '/home/hadoop/smdb_tracedata.csv' USING PigStorage(',') as (trans:chararray, carrier :chararray,aainday:chararray);

ranked = rank input_file;

NoHeader = Filter ranked by (rank_input_file > 1);

Ordered = Order NoHeader by rank_input_file

New_input_file = foreach Ordered Generate trans, carrier, aainday;

这将摆脱第一行,使New_input_file与原始行完全相同,而没有标题行(假设标题行是文件中的第一行)。请注意,等级运算符仅在Pig 0.11中可用,因此,如果您使用的是较早版本,则需要寻找其他方法。

编辑:添加了有序行,以确保New_input_file保持与原始输入文件相同的顺序

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

使用Piglatin加载文本文件时跳过标题

来自分类Dev

使用Querytable加载文本文件

来自分类Dev

使用filechooser加载文本文件

来自分类Dev

加载文本文件

来自分类Dev

无法从Linux上的资源加载文本文件

来自分类Dev

如何使用带有HTML组合框(<select>)的JavaScript加载文本文件?

来自分类Dev

如何使用Matlab / Octave在特定变量中加载文本文件?

来自分类Dev

pySpark 本地模式 - 使用 file:/// 与相对路径加载文本文件

来自分类Dev

VB在读取文本文件时跳过行

来自分类Dev

从单个文本文件创建多个文本文件时如何包括标题模式

来自分类Dev

从单个文本文件创建多个文本文件时如何包括标题模式

来自分类Dev

从网络下载文本文件

来自分类Dev

使用Pandas从文本文件中提取标题数据

来自分类Dev

从文本文件加载文件路径,并将其输入为视频源

来自分类Dev

如何加载文本文件并将其存储到数据结构中

来自分类Dev

通过AJAX加载文本文件会产生受限的URI错误

来自分类Dev

通过拖放在Textarea上加载文本文件

来自分类Dev

如何在DolphinDB中加载文本文件的指定列?

来自分类Dev

Java从jar中的资源重新加载文本文件

来自分类Dev

从R中的单个文本文件加载文档(由句子表示)

来自分类Dev

如何在Xamarin Studio中加载文本文件?

来自分类Dev

如何以红色保存保存/加载文本文件

来自分类Dev

根据标题合并文本文件。

来自分类Dev

RDD中文本文件的标题

来自分类Dev

在文本文件中添加标题

来自分类Dev

在使用perl重命名文本文件时,在文本文件末尾出现问号

来自分类Dev

获取使用RequireJS加载的文本文件的内容?

来自分类Dev

将文本文件加载到MySQL-跳过第一行

来自分类Dev

使用标题值将列添加到文本文件(文件中的多个标题)

Related 相关文章

  1. 1

    使用Piglatin加载文本文件时跳过标题

  2. 2

    使用Querytable加载文本文件

  3. 3

    使用filechooser加载文本文件

  4. 4

    加载文本文件

  5. 5

    无法从Linux上的资源加载文本文件

  6. 6

    如何使用带有HTML组合框(<select>)的JavaScript加载文本文件?

  7. 7

    如何使用Matlab / Octave在特定变量中加载文本文件?

  8. 8

    pySpark 本地模式 - 使用 file:/// 与相对路径加载文本文件

  9. 9

    VB在读取文本文件时跳过行

  10. 10

    从单个文本文件创建多个文本文件时如何包括标题模式

  11. 11

    从单个文本文件创建多个文本文件时如何包括标题模式

  12. 12

    从网络下载文本文件

  13. 13

    使用Pandas从文本文件中提取标题数据

  14. 14

    从文本文件加载文件路径,并将其输入为视频源

  15. 15

    如何加载文本文件并将其存储到数据结构中

  16. 16

    通过AJAX加载文本文件会产生受限的URI错误

  17. 17

    通过拖放在Textarea上加载文本文件

  18. 18

    如何在DolphinDB中加载文本文件的指定列?

  19. 19

    Java从jar中的资源重新加载文本文件

  20. 20

    从R中的单个文本文件加载文档(由句子表示)

  21. 21

    如何在Xamarin Studio中加载文本文件?

  22. 22

    如何以红色保存保存/加载文本文件

  23. 23

    根据标题合并文本文件。

  24. 24

    RDD中文本文件的标题

  25. 25

    在文本文件中添加标题

  26. 26

    在使用perl重命名文本文件时,在文本文件末尾出现问号

  27. 27

    获取使用RequireJS加载的文本文件的内容?

  28. 28

    将文本文件加载到MySQL-跳过第一行

  29. 29

    使用标题值将列添加到文本文件(文件中的多个标题)

热门标签

归档