Free DP-203 Korean Questions for Microsoft Data Engineering on Microsoft Azure (DP-203 Korean Version) DP-203 Korean Exam as PDF & Practice Test Engine

  • Exam Code/Number: DP-203 Korean
  • Exam Name/Title: Data Engineering on Microsoft Azure (DP-203 Korean Version)
  • Certification Provider: Microsoft
  • Corresponding Certification: Microsoft Certified: Azure Data Engineer Associate
  • Exam Questions: 365
  • Updated On: Jun 29, 2026
Azure Data Lake Storage Gen2에는 수천 개의 CSV 파일에 데이터가 저장되어 있습니다. 각 파일에는 올바른 형식의 캐리지 리턴(/r) 및 줄 바꿈(/n)이 오는 헤더 행이 있습니다.
PolyBase를 사용하여 Azure Synapse Analytics의 엔터프라이즈 데이터 웨어하우스에 매일 파일을 일괄 로드하는 패턴을 구현하고 있습니다.
파일을 데이터 웨어하우스로 가져올 때 헤더 행을 건너뛰어야 합니다. 로딩 패턴을 빌드하기 전에 Azure Synapse Analytics에서 필요한 데이터베이스 개체를 준비해야 합니다.
어떤 세 가지 작업을 순서대로 수행해야 합니까? 응답하려면 작업 목록에서 해당 작업을 응답 영역으로 이동하고 올바른 순서로 정렬하십시오.
참고: 각 올바른 선택은 1점의 가치가 있습니다.
Correct Answer:

Explanation:

Step 1: Create an external data source that uses the abfs location
Create External Data Source to reference Azure Data Lake Store Gen 1 or 2 Step 2: Create an external file format and set the First_Row option.
Create External File Format.
Step 3: Use CREATE EXTERNAL TABLE AS SELECT (CETAS) and configure the reject options to specify reject values or percentages To use PolyBase, you must create external tables to reference your external data.
Use reject options.
Note: REJECT options don't apply at the time this CREATE EXTERNAL TABLE AS SELECT statement is run. Instead, they're specified here so that the database can use them at a later time when it imports data from the external table. Later, when the CREATE TABLE AS SELECT statement selects data from the external table, the database will use the reject options to determine the number or percentage of rows that can fail to import before it stops the import.
Reference:
https://docs.microsoft.com/en-us/sql/relational-databases/polybase/polybase-t-sql-objects
https://docs.microsoft.com/en-us/sql/t-sql/statements/create-external-table-as-select-transact-sql
다음 전시에 표시된 Git 리포지토리 설정이 있는 Azure 데이터 팩터리가 있습니다.

드롭다운 메뉴를 사용하여 그래픽에 제시된 정보를 기반으로 각 문장을 완성하는 답을 선택하십시오.
참고: 각 정답은 1점의 가치가 있습니다.
Correct Answer:

Explanation:
Pcol1이라는 Azure Synapse Analytics 전용 SQL 풀이 있습니다. Pool1에는 태블릿이라는 테이블이 포함되어 있습니다. 5TB의 데이터를 table1에 로드합니다.
table1에 대해 열 저장소 압축이 최대화되었는지 확인해야 합니다.
어떤 명령문을 실행해야 합니까?
Correct Answer: D Vote an answer
회사에서 전자상거래, 소매 및 도매의 세 부서에 대한 데이터를 처리하려면 Azure Data Factory 파이프라인을 만들어야 합니다. 솔루션은 데이터가 회사 전체에 대해 처리될 수 있도록 보장해야 합니다.
Data Factory 데이터 흐름 스크립트를 어떻게 완료해야 하나요? 응답하려면 적절한 값을 올바른 대상으로 드래그하십시오. 각 값은 한 번, 두 번 이상 사용되거나 전혀 사용되지 않을 수 있습니다. 콘텐츠를 보려면 창 사이의 분할 막대를 끌거나 스크롤해야 할 수 있습니다.
참고: 각 올바른 선택은 1점의 가치가 있습니다.
Correct Answer:

Explanation:

The conditional split transformation routes data rows to different streams based on matching conditions. The conditional split transformation is similar to a CASE decision structure in a programming language. The transformation evaluates expressions, and based on the results, directs the data row to the specified stream.
Box 1: dept=='ecommerce', dept=='retail', dept=='wholesale'
First we put the condition. The order must match the stream labeling we define in Box 3.
Syntax:
<incomingStream>
split(
<conditionalExpression1>
<conditionalExpression2>
disjoint: {true | false}
) ~> <splitTx>@(stream1, stream2, ..., <defaultStream>)
Box 2: discount : false
disjoint is false because the data goes to the first matching condition. All remaining rows matching the third condition go to output stream all.
Box 3: ecommerce, retail, wholesale, all
Label the streams
Reference:
https://docs.microsoft.com/en-us/azure/data-factory/data-flow-conditional-split
회사의 인적 자원(MR) 부서를 위한 데이터 마트를 설계하고 있습니다. 데이터 마트에는 정보와 직원 트랜잭션이 포함됩니다. 소스 시스템에서 다음 필드가 있는 플랫 추출이 있습니다.
* 직원 ID
* 이름
* 성
* 받는 사람
* GrossArnount
* 트랜잭션 ID
* 정부 ID
* NetAmountPaid
* 거래 날짜
데이터 마트용 Azure Synapse 분석 전용 SQL 풀에서 시작 스키마 데이터 모델을 설계해야 합니다.
어떤 두 개의 테이블을 만들어야 합니까? 각 정답은 솔루션의 일부를 나타냅니다.
Correct Answer: A,C Vote an answer
Explanation: Only visible for ExamDiscuss members. You can sign-up / login (it's free).
ADF1이라는 Azure 데이터 팩터리가 포함된 Azure 구독이 있습니다.
Azure Data Factory Studio에서 ADF1에 복잡한 데이터 파이프라인을 빌드합니다.
저장 버튼을 사용할 수 없으며 파이프라인 게시를 방해하는 유효성 검사 오류가 있음을 발견했습니다.
파이프라인의 논리를 저장할 수 있는지 확인해야 합니다.
해결 방법: ADF1에 대해 Git 통합을 활성화합니다.
Correct Answer: B Vote an answer
Azure Data Lake Storage Gen 2를 사용하는 애플리케이션을 개발하고 있습니다.
제한된 기간 동안 특정 애플리케이션에 권한을 부여하는 솔루션을 권장해야 합니다.
추천서에 무엇을 포함해야 합니까?
Correct Answer: A Vote an answer
Explanation: Only visible for ExamDiscuss members. You can sign-up / login (it's free).
참고: 이 질문은 동일한 시나리오를 제시하는 일련의 질문 중 일부입니다. 시리즈의 각 질문에는 명시된 목표를 충족할 수 있는 고유한 솔루션이 포함되어 있습니다. 일부 질문 세트에는 하나 이상의 올바른 솔루션이 있을 수 있지만 다른 질문 세트에는 올바른 솔루션이 없을 수 있습니다.
이 시나리오에서 질문에 답한 후에는 해당 질문으로 돌아갈 수 없습니다. 결과적으로 이러한 질문은 검토 화면에 나타나지 않습니다.
100GB의 파일이 포함된 Azure Storage 계정이 있습니다. 파일에는 텍스트와 숫자 값이 포함되어 있습니다. 행의 75%에는 평균 길이가 1.1MB인 설명 데이터가 포함되어 있습니다.
스토리지 계정에서 Azure Synapse Analytics의 엔터프라이즈 데이터 웨어하우스로 데이터를 복사할 계획입니다.
데이터가 빠르게 복사되도록 파일을 준비해야 합니다.
해결 방법: 파일을 구분된 압축된 텍스트 파일로 변환합니다.
이것이 목표를 달성합니까?
Correct Answer: A Vote an answer
Explanation: Only visible for ExamDiscuss members. You can sign-up / login (it's free).
참고: 이 질문은 동일한 시나리오를 제시하는 일련의 질문 중 일부입니다. 시리즈의 각 질문에는 명시된 목표를 충족할 수 있는 고유한 솔루션이 포함되어 있습니다. 일부 질문 세트에는 하나 이상의 올바른 솔루션이 있을 수 있지만 다른 질문 세트에는 올바른 솔루션이 없을 수 있습니다.
이 섹션의 질문에 답한 후에는 해당 질문으로 돌아갈 수 없습니다. 결과적으로 이러한 질문은 검토 화면에 나타나지 않습니다.
계층 구조가 있는 Azure Databricks 작업 영역을 만들 계획입니다. 작업 영역에는 다음 세 가지 워크로드가 포함됩니다.
Python 및 SQL을 사용할 데이터 엔지니어를 위한 워크로드입니다.
Python, Scala 및 SOL을 사용하는 노트북을 실행할 작업에 대한 워크로드입니다.
데이터 과학자가 Scala 및 R에서 임시 분석을 수행하는 데 사용할 워크로드입니다.
회사의 엔터프라이즈 아키텍처 팀은 Databricks 환경에 대해 다음 표준을 식별합니다.
데이터 엔지니어는 클러스터를 공유해야 합니다.
작업 클러스터는 데이터 과학자와 데이터 엔지니어가 클러스터에 배포할 패키지 노트북을 제공하는 요청 프로세스를 사용하여 관리됩니다.
모든 데이터 과학자에게는 120분 동안 활동이 없으면 자동으로 종료되는 자체 클러스터가 할당되어야 합니다. 현재 세 명의 데이터 과학자가 있습니다.
워크로드에 대한 Databricks 클러스터를 만들어야 합니다.
솔루션: 각 데이터 과학자를 위한 표준 클러스터, 데이터 엔지니어를 위한 높은 동시성 클러스터 및 작업을 위한 표준 클러스터를 만듭니다.
이것이 목표를 달성합니까?
Correct Answer: B Vote an answer
Explanation: Only visible for ExamDiscuss members. You can sign-up / login (it's free).
0
0
0
10