기술 자료 검색 시 Excel 파일에서 도메인 가져오기Import Domains from an Excel File in Knowledge Discovery

이 항목에서는 DQS( Data Quality ServicesData Quality Services ) 기술 자료 검색 작업을 통해 Excel 파일에서 하나 이상의 도메인을 가져오는 방법에 대해 설명합니다.This topic describes how to import one or more domains from an Excel file in the Data Quality ServicesData Quality Services (DQS) knowledge discovery activity. 가져오기 프로세스는 기술 자료 생성 프로세스를 간소화하여 시간과 노력을 절감합니다.The import process simplifies the knowledge generation process, saving time and effort. Excel 파일이나 텍스트 파일에 데이터가 있는 사용자는 이 프로세스를 통해 해당 데이터를 포함한 기술 자료를 만들 수 있습니다.It enables people who have data in an Excel file or a text file to create a knowledge base with that data. (기존 기술 자료의 도메인에 값을 가져오는 방법에 대한 자세한 내용은 Excel 파일에서 도메인으로 값 가져오기를 참조하세요.) Excel 파일로의 내보내기는 지원되지 않습니다.(See Import Values from an Excel File into a Domain for more information about importing values into a domain of an existing knowledge base.) Exporting to an Excel file is not supported.

시작하기 전에 Before You Begin

필수 구성 요소 Prerequisites

Excel 파일에서 도메인을 가져오려면 Data Quality 클라이언트Data Quality Client 가 설치된 컴퓨터에 Excel이 설치되어 있어야 합니다. 도메인 값이 포함된 Excel 파일을 생성한 상태여야 합니다( How the import works참조). 그리고 도메인을 가져올 기술 자료를 만들고 열어 두어야 합니다.To import domains from an Excel file, Excel must be installed on the computer that the Data Quality 클라이언트Data Quality Client is installed on; you must have created an Excel file with domain values (see How the import works); and you must have created and opened a knowledge base to import the domain into.

보안 Security

사용 권한 Permissions

Excel 파일에서 도메인을 가져오려면 DQS_MAIN 데이터베이스에 대한 dqs_kb_editor 또는 dqs_administrator 역할이 있어야 합니다.You must have the dqs_kb_editor or the dqs_administrator role on the DQS_MAIN database to import domains from an Excel file.

Excel 파일에서 기술 자료로 도메인 가져오기 Import domains from an Excel file into a knowledge base

  1. Data Quality 클라이언트를 시작합니다.Start Data Quality Client. 방법은 다음을 참조하세요.For information about doing so, see Data Quality Client 응용 프로그램을 실행합니다. Run the Data Quality Client Application.

  2. Data Quality 클라이언트Data Quality Client 홈 화면에서 다음 중 하나를 수행합니다.In the Data Quality 클라이언트Data Quality Client home screen, do one of the following:

    • 새 기술 자료를 클릭하고, 기술 자료의 이름을 입력하고, 기술 자료 만들기 에 대해 없음을 선택하고, 기술 자료 검색 작업을 선택한 후 만들기를 클릭하여 도메인을 가져올 새 기술 자료를 만듭니다.Create a new knowledge base to import into by clicking New knowledge base, entering a name for the knowledge base, selecting None for Create knowledge base from, selecting the Knowledge Discovery activity, and then clicking Create.

    • 기술 자료 열기를 클릭하고, 기술 자료를 선택하고, 기술 자료 검색을 선택한 후 다음을 클릭하여 도메인을 가져올 기존 기술 자료를 엽니다.Open an existing knowledge base to import into by clicking Open knowledge base, selecting the knowledge base, selecting Knowledge Discovery, and then clicking Next.

  3. 페이지에서 데이터 원본 에 대해 Excel 파일을 선택합니다.In the Map page, select Excel File for Data Source.

  4. Excel 파일 줄에서 찾아보기 를 클릭합니다.Click Browse on the Excel File line.

  5. Excel 파일 선택 대화 상자에서 가져올 Excel 파일이 포함된 폴더로 이동하고 Excel 파일을 선택한 후 열기를 클릭합니다.In the Select an Excel File dialog box, move to the folder that contains the Excel file that you want to import from, select the Excel file, and then click Open.

  6. 워크시트 드롭다운 목록에서 가져올 Excel 파일의 워크시트를 선택합니다.From the Worksheet drop-down list, select the worksheet in the Excel file that you want to import from.

  7. 첫 번째 행을 데이터 헤더로 간주하려는 경우, 그리고 첫 번째 행의 값을 열 이름으로 사용하려는 경우 첫 번째 행을 헤더로 사용하세요 를 선택합니다.Select Use First Row as header if you want the first row to be considered a data header, and if you want the values in the first row to be used as column names. DQS에서 Excel의 열 머리글 값(영문자)을 사용할 경우 첫 번째 행을 데이터 값으로 간주하려면 첫 번째 행을 헤더로 사용하세요 를 선택 취소합니다.Deselect Use First Row as header if you want the first row to be considered a data value, in which case DQS will use the Excel header names (alphabetical letters) for the column.

  8. 열을 선택한 다음 기존 도메인을 열에 매핑하거나 도메인 만들기 아이콘을 클릭하고 도메인 만들기 대화 상자에서 도메인을 만든 후 도메인을 열에 매핑하여 새 도메인을 만듭니다.Select a column, and then either map an existing domain to the column, or create a new domain by clicking the Create a Domain icon, creating a domain in the Create a domain dialog box, and then mapping the domain to the column. 도메인의 데이터 형식이 열의 데이터 형식과 일치해야 합니다.The data type of the domain must match the data type of the column. 스프레드시트의 모든 열에 대해 위의 작업을 반복합니다.Repeat for all columns of the spreadsheet.

  9. 다음을 클릭합니다.Click Next.

  10. 검색 페이지에서 시작 을 클릭하여 Excel 스프레드시트의 데이터를 분석합니다.In the Discover page, click Start to analyze the data in the Excel spreadsheet.

    참고

    데이터가 업로드되기 전에 페이지에서 나가면 파일 업로드 프로세스가 종료됩니다.If you leave the page before the data has been uploaded, the file upload process will be terminated.

  11. 분석이 올바르게 완료되었는지 확인하고 다음을 클릭합니다.Verify that the analysis completed successfully, and then click Next.

  12. 도메인 값 관리 페이지에서 도메인 목록에 올바른 도메인이 나열되어 있고 도메인 테이블에 값을 입력했는지 확인합니다.In the Manage Domain Values page, verify that the correct domains are listed in the Domains list and that values are entered in the domain table.

  13. 마침을 클릭한 다음 게시 를 클릭하여 기술 자료를 게시하거나 아니요 를 클릭하여 게시하지 않습니다.Click Finish, and then click Publish to publish the knowledge base, or No not to publish.

  14. 기술 자료가 게시되었는지 확인한 후 확인을 클릭합니다.Verify that the knowledge base was published, and then click OK.

후속 작업: Excel 파일에서 도메인을 가져온 후 Follow Up: After Importing Domains from an Excel File

Excel 파일에서 도메인을 가져온 후 도메인에 정보를 추가하거나 도메인의 내용에 따라 정리 또는 일치 프로젝트에서 도메인을 사용할 수 있습니다.After you import domains from an Excel file, you can add knowledge to the domains or use the domains in a cleansing or matching project, depending on the contents of the domains. 자세한 내용은 기술 자료 검색 수행, 도메인 관리, 복합 도메인 관리, 일치 정책 만들기, 데이터 정리 또는 데이터 일치를 참조하세요.For more information, see Perform Knowledge Discovery, Managing a Domain, Managing a Composite Domain, Create a Matching Policy, Data Cleansing, or Data Matching.

How the import works How the import works

가져오기 작업에서 DQS는 Excel 파일을 다음과 같이 해석합니다.In the import operation, DQS interprets an Excel file as follows:

  • 열은 도메인을 나타냅니다.A column represents a domain

  • 행은 데이터 레코드를 나타냅니다.A row represents a data record

  • 첫 번째 행은 첫 번째 행을 헤더로 사용하세요 확인란의 설정에 따라 도메인 이름을 나타내거나 첫 번째 데이터 값 또는 레코드입니다.The first row either represents domain names or is the first data value or record, depending upon the setting of the Use First Row as header checkbox.

    가져오기 작업에는 다음 규칙이 적용됩니다.The following rules apply to the import operation:

  • 이 작업은 도메인 값을 기술 자료로 가져옵니다.This operation imports domain values into a knowledge base. 도메인 규칙 또는 일치 정책은 가져오지 않습니다.It does not import domain rules or a matching policy.

  • Excel 파일의 확장명은 .xlsx, .xls 또는 .csv입니다.The Excel file can have the extension .xlsx, .xls, or .csv. 도메인 값 또는 전체 도메인을 가져오려면 Data Quality 클라이언트Data Quality Client 컴퓨터에 Microsoft Excel이 설치되어 있어야 합니다.Microsoft Excel must be installed on the Data Quality 클라이언트Data Quality Client computer to import domain values or a complete domain. Excel 2003 이상 버전이 지원됩니다.Excel versions 2003 and later are supported. 64비트 버전의 Excel이 사용된 경우 Excel 2003 파일만 지원됩니다. Excel 2007 또는 2010 파일은 지원되지 않습니다.If the 64-bit version of Excel is used, only Excel 2003 files will be supported; Excel 2007 or 2010 files will not be supported.

  • Excel 파일 형식 .xlsx는 Excel 64비트 설치에서 지원되지 않습니다.Excel files of type .xlsx are not supported for an Excel 64-bit installation. 64비트 Excel을 사용 중인 경우 스프레드시트 파일을 .xls 파일로 저장하세요.If you are using 64-bit Excel, save the spreadsheet file as an .xls file.

  • .xlsx 및 .xls 파일에서는 처음 8개 행에서 가장 많이 사용된 데이터 형식에 의해 열의 데이터 형식이 결정됩니다.In .xlsx and .xls files, the data type of the column is determined by the most prevalent data type in the first eight rows. 데이터 형식을 따르지 않는 셀에는 null 값이 지정됩니다.If a cell does not conform to that data type, it will be given a null value.

  • .csv 파일에서는 처음 8개 행에서 가장 많이 사용된 데이터 형식에 의해 데이터 형식이 결정됩니다.In .csv files, the data type is determined by the most prevalent data type in the first eight rows.

  • 도메인 규칙을 따르지 않는 Excel 스프레드시트의 값을 가져오면 잘못된 값으로 표시됩니다.A value in an Excel spreadsheet that does not conform to a domain rule will be imported as an invalid value.

  • Excel 파일이 올바른 형식이 아니거나 손상된 경우 가져오기 작업에서 오류가 발생합니다.If the Excel file is not in the right format or is corrupted, the import operation will result in an error.