Copiare dati da Tabella Web usando Azure Data FactoryCopy data from Web table by using Azure Data Factory

Questo articolo illustra come usare l'attività di copia in Azure Data Factory per copiare dati da un database Tabella Web.This article outlines how to use the Copy Activity in Azure Data Factory to copy data from a Web table database. Si basa sull'articolo di panoramica dell'attività di copia che presenta una panoramica generale sull'attività di copia.It builds on the copy activity overview article that presents a general overview of copy activity.

La differenza tra questo connettore Tabella Web, il connettore REST e il connettore HTTP è la seguente:The difference among this Web table connector, the REST connector and the HTTP connector are:

  • Il connettore Tabella Web estrae il contenuto della tabella da una pagina Web HTML.Web table connector extracts table content from an HTML webpage.
  • Il connettore REST supporta in modo specifico la copia dei dati dalle API RESTful.REST connector specifically support copying data from RESTful APIs.
  • Il connettore HTTP è un connettore generico per recuperare i dati da qualsiasi endpoint HTTP, ad esempio per scaricare file.HTTP connector is generic to retrieve data from any HTTP endpoint, e.g. to download file.

Funzionalità supportateSupported capabilities

È possibile copiare dati da un database Tabella Web in qualsiasi archivio dati di sink supportato.You can copy data from Web table database to any supported sink data store. Per un elenco degli archivi dati supportati come origini/sink dall'attività di copia, vedere la tabella relativa agli archivi dati supportati.For a list of data stores that are supported as sources/sinks by the copy activity, see the Supported data stores table.

In particolare, il connettore Tabella Web supporta l'estrazione del contenuto di una tabella da una pagina HTML.Specifically, this Web table connector supports extracting table content from an HTML page.

PrerequisitiPrerequisites

Per usare questo connettore di tabelle Web, è necessario impostare un runtime di integrazione self-hosted.To use this Web table connector, you need to set up a Self-hosted Integration Runtime. Per i dettagli, vedere l'articolo Runtime di integrazione self-hosted.See Self-hosted Integration Runtime article for details.

IntroduzioneGetting started

È possibile usare l'attività di copia con una pipeline tramite uno degli strumenti o degli SDK seguenti.You can use one of the following tools or SDKs to use the copy activity with a pipeline. Per istruzioni dettagliate, selezionare un collegamento:Select a link for step-by-step instructions:

Le sezioni seguenti riportano informazioni dettagliate sulle proprietà che vengono usate per definire entità di Data Factory specifiche per il connettore Tabella Web.The following sections provide details about properties that are used to define Data Factory entities specific to Web table connector.

Proprietà del servizio collegatoLinked service properties

Per il servizio collegato di Tabella Web sono supportate le proprietà seguenti:The following properties are supported for Web table linked service:

ProprietàProperty DescrizioneDescription ObbligatoriaRequired
typetype La proprietà type deve essere impostata su: WebThe type property must be set to: Web Yes
urlurl URL dell'origine WebURL to the Web source Yes
authenticationTypeauthenticationType Il valore consentito è: Anonymous.Allowed value is: Anonymous. Yes
connectViaconnectVia Il runtime di integrazione da usare per la connessione all'archivio dati.The Integration Runtime to be used to connect to the data store. È necessario un runtime di integrazione self-hosted come indicato in Prerequisiti.A Self-hosted Integration Runtime is required as mentioned in Prerequisites. Yes

Esempio:Example:

{
    "name": "WebLinkedService",
    "properties": {
        "type": "Web",
        "typeProperties": {
            "url" : "https://en.wikipedia.org/wiki/",
            "authenticationType": "Anonymous"
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

Proprietà del set di datiDataset properties

Per un elenco completo delle sezioni e delle proprietà disponibili per la definizione di set di dati, vedere l'articolo sui set di dati.For a full list of sections and properties available for defining datasets, see the datasets article. Questa sezione presenta un elenco delle proprietà supportate dal set di dati Tabella Web.This section provides a list of properties supported by Web table dataset.

Per copiare dati da Tabella Web, impostare la proprietà type del set di dati su WebTable.To copy data from Web table, set the type property of the dataset to WebTable. Sono supportate le proprietà seguenti:The following properties are supported:

ProprietàProperty DescrizioneDescription ObbligatoriaRequired
typetype La proprietà type del set di dati deve essere impostata su: WebTableThe type property of the dataset must be set to: WebTable Yes
pathpath URL relativo della risorsa che contiene la tabella.A relative URL to the resource that contains the table. No.No. Quando non è specificato alcun percorso, viene usato solo l'URL specificato nella definizione del servizio collegato.When path is not specified, only the URL specified in the linked service definition is used.
indexindex Indice della tabella nella risorsa.The index of the table in the resource. Per i passaggi per ottenere l'indice di una tabella in una pagina HTML, vedere la sezione Ottenere l'indice di una tabella in una pagina HTML .See Get index of a table in an HTML page section for steps to getting index of a table in an HTML page. YesYes

Esempio:Example:

{
    "name": "WebTableInput",
    "properties": {
        "type": "WebTable",
        "typeProperties": {
            "index": 1,
            "path": "AFI's_100_Years...100_Movies"
        },
        "schema": [],
        "linkedServiceName": {
            "referenceName": "<Web linked service name>",
            "type": "LinkedServiceReference"
        }
    }
}

Proprietà dell'attività di copiaCopy activity properties

Per un elenco completo delle sezioni e delle proprietà disponibili per la definizione delle attività, vedere l'articolo sulle pipeline.For a full list of sections and properties available for defining activities, see the Pipelines article. Questa sezione presenta un elenco delle proprietà supportate dall'origine Tabella Web.This section provides a list of properties supported by Web table source.

Tabella Web come origineWeb table as source

Per copiare dati da Tabella Web, impostare il tipo di origine nell'attività di copia su WebSource. Non sono supportate altre proprietà.To copy data from Web table, set the source type in the copy activity to WebSource, no additional properties are supported.

Esempio:Example:

"activities":[
    {
        "name": "CopyFromWebTable",
        "type": "Copy",
        "inputs": [
            {
                "referenceName": "<Web table input dataset name>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<output dataset name>",
                "type": "DatasetReference"
            }
        ],
        "typeProperties": {
            "source": {
                "type": "WebSource"
            },
            "sink": {
                "type": "<sink type>"
            }
        }
    }
]

Ottenere l'indice di una tabella in una pagina HTMLGet index of a table in an HTML page

Per ottenere l'indice di una tabella che è necessario configurare nelle proprietà del set di dati, è possibile usare, ad esempio, Excel 2016 come strumento, come indicato di seguito:To get the index of a table which you need to configure in dataset properties, you can use e.g. Excel 2016 as the tool as follows:

  1. Avviare Excel 2016 e passare alla scheda Dati.Launch Excel 2016 and switch to the Data tab.

  2. Fare clic su Nuova query sulla barra degli strumenti, scegliere Da altre origini e fare clic su Da Web.Click New Query on the toolbar, point to From Other Sources and click From Web.

    Menu di Power Query

  3. Nella finestra di dialogo Da Web immettere l'URL che si intende usare nel codice JSON del servizio collegato (ad esempio, https://en.wikipedia.org/wiki/) insieme al percorso specificato per il set di dati (ad esempio, AFI%27s_100_Years...100_Movies) e fare clic su OK.In the From Web dialog box, enter URL that you would use in linked service JSON (for example: https://en.wikipedia.org/wiki/) along with path you would specify for the dataset (for example: AFI%27s_100_Years...100_Movies), and click OK.

    Finestra di dialogo Da Web

    URL usato in questo esempio: https://en.wikipedia.org/wiki/AFI%27s_100_Years...100_MoviesURL used in this example: https://en.wikipedia.org/wiki/AFI%27s_100_Years...100_Movies

  4. Se viene visualizzata la finestra di dialogo Accedi a contenuto Web, selezionare l'URL corretto, l'autenticazione e fare clic su Connetti.If you see Access Web content dialog box, select the right URL, authentication, and click Connect.

    Finestra di dialogo Accedi a contenuto Web

  5. Fare clic su un elemento della tabella nella visualizzazione ad albero per visualizzare il contenuto dalla tabella e quindi fare clic su Modifica nella parte inferiore.Click a table item in the tree view to see content from the table and then click Edit button at the bottom.

    Finestra di dialogo Strumento di spostamento

  6. Nella finestra Editor di query fare clic sul pulsante Editor avanzato sulla barra degli strumenti.In the Query Editor window, click Advanced Editor button on the toolbar.

    Pulsante Editor avanzato

  7. Nella finestra di dialogo Editor avanzato il numero accanto a "Source" è l'indice.In the Advanced Editor dialog box, the number next to "Source" is the index.

    Editor avanzato - Indice

Se si usa Excel 2013, per ottenere l'indice usare Microsoft Power Query per Excel .If you are using Excel 2013, use Microsoft Power Query for Excel to get the index. Per informazioni dettagliate, vedere l'articolo Connettersi a una pagina Web (Power Query) .See Connect to a web page article for details. I passaggi sono simili se si usa Microsoft Power BI Desktop.The steps are similar if you are using Microsoft Power BI for Desktop.

Passaggi successiviNext steps

Per un elenco degli archivi dati supportati come origini o sink dall'attività di copia in Azure Data Factory, vedere gli archivi dati supportati.For a list of data stores supported as sources and sinks by the copy activity in Azure Data Factory, see supported data stores.