그룹화 된 데이터에 대한 AVG에서 오류 1046 : 명시 적 캐스트 사용

debugcn 에 게시 Dev

사용자 182944

나는이 MAPTXT 파일의 데이터를 :

[age#27,height#5.8]
[age#25,height#5.3]
[age#27,height#5.10]
[age#25,height#5.1]

연령대 별 평균 키를 표시하고 싶습니다.

다음은 LAOD진술입니다.

records = LOAD '~/Documents/Pig_Map.txt' AS (details:map[]);
records: {details: map[]}

그런 다음 나이를 기준으로 데이터를 그룹화했습니다.

group_data = GROUP records BY details#'age';
group_data: {group: bytearray,records: {(details: map[])}}

에 액세스하기 위해 details다음 FLATTEN과 같이했습니다 (이 단계가 필요한지 확실하지 않음).

flatten_records = FOREACH group_data GENERATE group,FLATTEN(records);
flatten_records: {group: bytearray,records::details: map[]}

DUMP flatten_records 이것은 나에게 아래 출력을 제공합니다.

(25,[height#5.1,age#25])
(25,[height#5.3,age#25])
(27,[height#5.10,age#27])
(27,[height#5.8,age#27])

이제 평균 높이를 얻고 싶습니다. 나는 이것을 시도했다 :

display_records = FOREACH flatten_records GENERATE group,AVG(records.details#'height');

오류는 다음과 같습니다.

<line 10, column 57> Multiple matching functions for org.apache.pig.builtin.AVG with input schema: ({{(bytearray)}}, {{(double)}}). Please use an explicit cast.

조언 부탁드립니다.

시바 삭티 자야 라만

이것을 시도해 볼 수 있습니까?

records = LOAD '~/Documents/Pig_Map.txt' AS (details:map[]);
records1 = FOREACH records GENERATE details#'age' AS age,details#'height' AS height;
group_data = GROUP records1 BY age;
display_records = FOREACH group_data GENERATE group,AVG(records1.height);
dump display_records;

산출:

(25,5.199999999999999)
(27,5.449999999999999)

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-06-2

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

그룹화 된 데이터에 대한 AVG에서 오류 1046 : 명시 적 캐스트 사용

그룹화 된 데이터에 대한 AVG에서 오류 1046 : 명시 적 캐스트 사용

Python에서 데이터 프레임별로 그룹화 된 여러 기능을 적용하십시오.

그룹화 된 막대 차트에 대한 데이터 구성

완전히 캐시 된 워드 프레스 사이트에 대한 SQL 설정을 최적화하는 방법

한 번에 n 개 행 그룹화 된 데이터 프레임에 사용자 지정 함수 적용

조건이있는 그룹화 된 데이터에 .mean () 적용

Pandas, 문자열 인덱스로 그룹화 된 데이터에 사용자 지정 함수 적용

Pandas를 사용하여 데이터 프레임에서 (그룹화 된) 막대 차트를 그리는 방법

그룹화 된 데이터에 대해 반복적으로 ANOVA (ezANOVA 사용) 수행

SoundEvent에 대한 Flash 오류 1046 수정

std :: bind에서 std :: bind 사용 : 컴파일 오류 (암시 적 캐스트)

그룹화 된 막대 차트에 대한 데이터 필터링

FB.ui 공유 대화 상자를 통해 명시 적으로 공유 된 오픈 그래프 스토리에 대한 설명을 동적으로 생성

모든 트랜잭션 명령에 대한 새 쿼리를 사용하여 적중 데이터베이스 시퀀스 화

그룹화 된 데이터 프레임의 그룹에 적용된 두 날짜 사이의 평일 수

응용 프로그램에서 명시 적으로로드 된 DLL에 대한 기호 가져 오기

Pandas에서 그룹화 된 데이터의 단일 열에 함수 적용

데이터에 대한 Google 스프레드 시트 쿼리 이중 그룹화

5.3.8에서 5.4.1 태피스트리로 업그레이드하는 동안 빈 명명 된 스타일 시트에 대한 렌더링 오류가 발생 함

MVC 4 오류에서만 로그인 된 사용자 데이터 표시

Tosca throwing을 사용하는 자동화 된 데이터 기반 테스트 사례-명령 'XL'에 적합한 값을 찾을 수없는 이유

그룹화 된 데이터에 대한 Excel 컬러 라인 차트?

두 개의 열로 그룹화 된 데이터에 대한 Google 앱 차트

큰 데이터 세트에 대한 상자 그림을 사용한 시각화

seaborn 또는 matplotlib를 사용하여 그룹화 된 상자 그림에 대한 데이터 형식 지정

d3에서 그룹화 된 막대 차트 데이터 오른쪽에 두 번째 y 축을 표시하는 방법

Highcharts 데이터에 그룹화 된 포인트 수 표시

데이터 컨텍스트가 실용적으로 설정된 탭 컨트롤 내부에 중첩 된 데이터 그리드에 대한 바인딩 문제

ggplot2를 사용하여 그룹화 된 막대 차트에 대한 오차 막대를 그리는 방법은 무엇입니까?

TXT 파일 가져 오기 및 그룹화 된 각 테이블에 대한 새 워크 시트 만들기