Azure Data Factory 및 Azure Synapse에서 ORC 형식 커넥터 문제 해결

적용 대상: Azure Data Factory Azure Synapse Analytics

기업용 올인원 분석 솔루션인 Microsoft Fabric의 Data Factory를 사용해 보세요. Microsoft Fabric은 데이터 이동부터 데이터 과학, 실시간 분석, 비즈니스 인텔리전스 및 보고에 이르기까지 모든 것을 다룹니다. 무료로 새 평가판을 시작하는 방법을 알아봅니다!

이 문서에서는 Azure Data Factory 및 Azure Synapse의 ORC 형식 커넥터와 관련된 일반적인 문제를 해결하기 위한 제안 사항을 제공합니다.

오류 코드: OrcJavaInvocationException

  • 메시지: An error occurred when invoking Java, message: %javaException;.

  • 원인 및 권장 사항: 오류의 원인이 여러 가지일 수 있습니다. 아래 목록에서 가능한 원인 분석과 권장 사항을 확인하세요.

    원인 분석 권장
    오류 메시지에 “java.lang.OutOfMemory”, “Java 힙 공간” 및 “doubleCapacity”라는 문자열이 포함된 경우 일반적으로 이전 버전의 통합 런타임에 메모리 관리 문제가 있는 것입니다. 자체 호스팅 통합 런타임을 사용 중인 경우 최신 버전으로 업그레이드하는 것이 좋습니다.
    오류 메시지에 “java.lang.OutOfMemory”라는 문자열이 포함된 경우 통합 런타임에 파일을 처리할 수 있는 충분한 리소스가 없는 것입니다. Integration Runtime의 동시 실행을 제한합니다. 자체 호스팅 IR의 경우 메모리가 8GB보다 크거나 같은 강력한 머신으로 스케일 업합니다.
    오류 메시지에 “NullPointerReference”라는 문자열이 포함된 경우 일시적인 오류가 원인일 수 있습니다. 작업을 다시 시도하세요. 문제가 계속되면 지원에 문의하세요.
    오류 메시지에 “BufferOverflowException”이라는 문자열이 포함된 경우 일시적인 오류가 원인일 수 있습니다. 작업을 다시 시도하세요. 문제가 계속되면 지원에 문의하세요.
    오류 메시지에 “java.lang.ClassCastException:org.apache.hadoop.hive.serde2.io.HiveCharWritable can’t be cast to org.apache.hadoop.io.Text”라는 문자열이 포함된 경우 Java 런타임의 형식 전환 문제가 원인일 수 있습니다. 일반적으로 이는 Java 런타임에서 원본 데이터를 처리할 수 없음을 의미합니다. 이 문제는 데이터 문제입니다. ORC 형식 데이터에서 char 또는 varchar 대신 문자열을 사용해 보세요.

오류 코드: OrcDateTimeExceedLimit

  • 메시지: The Ticks value '%ticks;' for the datetime column must be between valid datetime ticks range -621355968000000000 and 2534022144000000000.

  • 원인: datetime 값이 ‘0001-01-01 00:00:00’인 경우 율리우스력과 그레고리력의 차이가 원인일 수 있습니다.

  • 권장 사항: ticks 값을 확인하고 datetime 값 ‘0001-01-01 00:00:00’을 사용하지 않습니다.

자세한 문제 해결 도움말은 다음 리소스를 참조하세요.