Pig에서 두 개의 열로 데이터 그룹화 집계

1EnemyLeft

두 개의 열로 그룹화 한 다음 두 개의 다른 필드를 합산하는 데 필요한 데이터가 있습니다. 이 네 열의 이름이 OS, device, view, click이라고 가정합니다. 기본적으로 각 OS 및 기기의 수, 조회수 및 클릭 수를 알고 싶습니다.

(2,3346,1,)
(3,3953,1,1)
(25,4840,1,1)
(2,94840,1,1)
(14,0526,1,1)
(37,4864,1,)
(2,7353,1,)

이것이 내가 지금까지 가지고있는 것입니다.

A is data: OS,device,view,click

B = GROUP A BY (OS,device);

Result = FOREACH  B {
    GENERATE group AS OS,device, SUM(view) AS visits, SUM(click) AS clicks;};
dump Result; 

이것은 작동하지 않습니다. 오류 메시지는 다음과 같습니다. Projected field [OS] is not exist in schema : group : tuple (OS : int, device : long), B : bag {: tuple (OS : int, device : long, view : int, click : int)}입니다.

Durga Viswanath Gadiraju

테스트 된 코드는 다음과 같습니다. FLATTEN이 누락되었습니다.

A = LOAD '/user/root/pig_data' using PigStorage(',') AS (OS, device, view, click);
B = GROUP A BY (OS, device);
RESULT = FOREACH B GENERATE FLATTEN(group) AS (OS, device), SUM(A.view) as views, SUM(A.click) as clicks;
dump RESULT;

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정
0

몇 마디 만하겠습니다

0리뷰
로그인참여 후 검토

관련 기사

분류에서Dev

두 개의 열로 그룹화 된 데이터에 대한 Google 앱 차트

분류에서Dev

2 개 열의 조건에 따라 집계 데이터 프레임별로 pandas 그룹화

분류에서Dev

다른 요인의 각 수준에서 요인을 집계하고 세분화 된 데이터에서 다른 두 요인으로 그룹화하는 방법

분류에서Dev

두 개의 그룹화 열로 데이터 프레임 분산

분류에서Dev

팬더 데이터 프레임에서 두 개의 열로 그룹화하여 비율 만들기

분류에서Dev

Pandas에서 한 수준의 그룹화 된 데이터 집계

분류에서Dev

두 개의 열 그룹화 합계

분류에서Dev

두 개의 서로 다른 그룹화 된 데이터 프레임에서 위치 지점 간의 최대 거리 계산

분류에서Dev

서로 다른 두 테이블의 그룹화 된 행 합계

분류에서Dev

그룹화 된 팬더 데이터 프레임에서 두 개의 이동 된 열 만들기

분류에서Dev

두 날짜 사이의 SQL Server 합계 데이터 날짜별로 그룹화

분류에서Dev

SQL Server의 두 열을 기반으로 데이터 그룹화

분류에서Dev

두 요소로 그룹화 된 데이터 프레임의 통계

분류에서Dev

Pandas 데이터 프레임에서 두 개의 개별 열 그룹 분할

분류에서Dev

두 개의 열 레이블로 그룹화 된 데이터 프레임 열의 RMS를 계산하는 방법은 무엇입니까?

분류에서Dev

두 테이블의 데이터를 계산하고 두 테이블에있는 이름으로 모두 그룹화

분류에서Dev

두 개의 열로 그룹화 한 다음 중앙값 계산

분류에서Dev

두 개의 열로 그룹화하고 계산

분류에서Dev

MySql : 두 개의 열로 그룹화 된 합계 선택

분류에서Dev

두 개 이상의 값을 사용하여 Pandas 그룹화 집계

분류에서Dev

R 데이터 프레임에서 두 개의 다른 함수로 두 개의 다른 열을 집계하는 방법

분류에서Dev

MongoDb 집계 및 값에 따라 두 필드별로 그룹화

분류에서Dev

서로 다른 수준의 데이터별로 그룹 간 차이 집계

분류에서Dev

Pandas : 두 개 이상의 열로 그룹화

분류에서Dev

Python DataFrame-그룹화 된 열 (최소 두 개의 열)이있는 데이터 프레임에 대한 막대 차트 플로팅

분류에서Dev

Python Pandas의 데이터 frama에서 열 그룹으로 그룹화

분류에서Dev

배열에있는 개체의 데이터 그룹화

분류에서Dev

Mule ESB에서 두 개의 페이로드 집계

분류에서Dev

두 개의 열로 MySQL 그룹화

Related 관련 기사

  1. 1

    두 개의 열로 그룹화 된 데이터에 대한 Google 앱 차트

  2. 2

    2 개 열의 조건에 따라 집계 데이터 프레임별로 pandas 그룹화

  3. 3

    다른 요인의 각 수준에서 요인을 집계하고 세분화 된 데이터에서 다른 두 요인으로 그룹화하는 방법

  4. 4

    두 개의 그룹화 열로 데이터 프레임 분산

  5. 5

    팬더 데이터 프레임에서 두 개의 열로 그룹화하여 비율 만들기

  6. 6

    Pandas에서 한 수준의 그룹화 된 데이터 집계

  7. 7

    두 개의 열 그룹화 합계

  8. 8

    두 개의 서로 다른 그룹화 된 데이터 프레임에서 위치 지점 간의 최대 거리 계산

  9. 9

    서로 다른 두 테이블의 그룹화 된 행 합계

  10. 10

    그룹화 된 팬더 데이터 프레임에서 두 개의 이동 된 열 만들기

  11. 11

    두 날짜 사이의 SQL Server 합계 데이터 날짜별로 그룹화

  12. 12

    SQL Server의 두 열을 기반으로 데이터 그룹화

  13. 13

    두 요소로 그룹화 된 데이터 프레임의 통계

  14. 14

    Pandas 데이터 프레임에서 두 개의 개별 열 그룹 분할

  15. 15

    두 개의 열 레이블로 그룹화 된 데이터 프레임 열의 RMS를 계산하는 방법은 무엇입니까?

  16. 16

    두 테이블의 데이터를 계산하고 두 테이블에있는 이름으로 모두 그룹화

  17. 17

    두 개의 열로 그룹화 한 다음 중앙값 계산

  18. 18

    두 개의 열로 그룹화하고 계산

  19. 19

    MySql : 두 개의 열로 그룹화 된 합계 선택

  20. 20

    두 개 이상의 값을 사용하여 Pandas 그룹화 집계

  21. 21

    R 데이터 프레임에서 두 개의 다른 함수로 두 개의 다른 열을 집계하는 방법

  22. 22

    MongoDb 집계 및 값에 따라 두 필드별로 그룹화

  23. 23

    서로 다른 수준의 데이터별로 그룹 간 차이 집계

  24. 24

    Pandas : 두 개 이상의 열로 그룹화

  25. 25

    Python DataFrame-그룹화 된 열 (최소 두 개의 열)이있는 데이터 프레임에 대한 막대 차트 플로팅

  26. 26

    Python Pandas의 데이터 frama에서 열 그룹으로 그룹화

  27. 27

    배열에있는 개체의 데이터 그룹화

  28. 28

    Mule ESB에서 두 개의 페이로드 집계

  29. 29

    두 개의 열로 MySQL 그룹화

뜨겁다태그

보관