Gegevens migreren naar Azure Cosmos DB voor Apache Cassandra-account met behulp van Striim

VAN TOEPASSING OP: Cassandra

De Striim-installatiekopieën in Azure Marketplace bieden continue realtime gegevensverplaatsing van datawarehouses en databases naar Azure. Tijdens het verplaatsen van de gegevens kunt u inline denormalisatie, gegevenstransformatie uitvoeren, realtime analyses en scenario's voor gegevensrapportage inschakelen. Het is eenvoudig om aan de slag te gaan met Striim om continu bedrijfsgegevens te verplaatsen naar Azure Cosmos DB voor Apache Cassandra. Azure biedt een Marketplace-aanbieding waarmee u Striim eenvoudig kunt implementeren en gegevens kunt migreren naar Azure Cosmos DB.

In dit artikel wordt beschreven hoe u Striim gebruikt om gegevens te migreren van een Oracle-database naar een Azure Cosmos DB voor Apache Cassandra-account.

Vereisten

  • Als u geen Azure-abonnement hebt, maakt u een gratis account voordat u begint.

  • Een Oracle-database die on-premises wordt uitgevoerd met enkele gegevens erin.

De Striim Marketplace-oplossing implementeren

  1. Meld u aan bij de Azure-portal.

  2. Selecteer Een resource maken en zoek naar Striim in de Azure Marketplace. Selecteer de eerste optie en Selecteer Maken.

    Striim Marketplace-item zoeken

  3. Voer vervolgens de configuratie-eigenschappen van het Striim-exemplaar in. De Striim-omgeving wordt geïmplementeerd in een virtuele machine. Voer in het deelvenster Basisinformatie de gebruikersnaam van de virtuele machine en het VM-wachtwoord in (dit wachtwoord wordt gebruikt voor SSH in de VM). Selecteer uw abonnement, resourcegroep en locatiegegevens waar u Striim wilt implementeren. Als u klaar bent, selecteert u OK.

    Basisinstellingen voor Striim configureren

  4. Kies in het deelvenster Striim-clusterinstellingen het type Striim-implementatie en de grootte van de virtuele machine.

    Instelling Waarde Beschrijving
    Striim-implementatietype Zelfstandig Striim kan worden uitgevoerd in een zelfstandig implementatietype of in een clusterimplementatietype . De zelfstandige modus implementeert de Striim-server op één virtuele machine en u kunt de grootte van de VM's selecteren, afhankelijk van uw gegevensvolume. In de clustermodus wordt de Striim-server geïmplementeerd op twee of meer VM's met de geselecteerde grootte. Clusteromgevingen met meer dan 2 knooppunten bieden automatische hoge beschikbaarheid en failover.

    In deze zelfstudie kunt u de optie Zelfstandig selecteren. Gebruik de standaard vm-grootte 'Standard_F4s'.
    Naam van het Striim-cluster <Striim_cluster_Name> Naam van het Striim-cluster.
    Wachtwoord van het striim-cluster <Striim_cluster_password> Wachtwoord voor het cluster.

    Nadat u het formulier hebt ingevuld, selecteert u OK om door te gaan.

  5. Configureer in het deelvenster Striim-toegangsinstellingen het openbare IP-adres (kies de standaardwaarden), Domeinnaam voor StriimBeheer wachtwoord dat u wilt gebruiken om u aan te melden bij de gebruikersinterface van Striim. Configureer een VNET en subnet (kies de standaardwaarden). Nadat u de details hebt ingevuld, selecteert u OK om door te gaan.

    Instellingen voor toegang tot striim

  6. Azure valideert de implementatie en zorgt ervoor dat alles er goed uitziet. de validatie duurt enkele minuten. Nadat de validatie is voltooid, selecteert u OK.

  7. Controleer ten slotte de gebruiksvoorwaarden en selecteer Maken om uw Striim-exemplaar te maken.

De brondatabase configureren

In deze sectie configureert u de Oracle-database als de bron voor gegevensverplaatsing. De Striim-server wordt geleverd met het Oracle JDBC-stuurprogramma dat wordt gebruikt om verbinding te maken met Oracle. Als u wijzigingen uit uw Oracle-brondatabase wilt lezen, kunt u de LogMiner - of de XStream-API's gebruiken. Het Oracle JDBC-stuurprogramma is aanwezig in het Java-klassepad van Striim voor het lezen, schrijven of behouden van gegevens uit de Oracle-database.

Doeldatabase configureren

In deze sectie configureert u het Azure Cosmos DB voor Apache Cassandra-account als het doel voor gegevensverplaatsing.

  1. Maak een Azure Cosmos DB voor Apache Cassandra-account met behulp van de Azure Portal.

  2. Navigeer naar het deelvenster Data Explorer in uw Azure Cosmos DB-account. Selecteer Nieuwe tabel om een nieuwe container te maken. Stel dat u producten en bestelgegevens van de Oracle-database migreert naar Azure Cosmos DB. Maak een nieuwe Keyspace met de naam StriimDemo met een Orders-container. Richt de container in met 1000 RU's (in dit voorbeeld worden 1000 RU's gebruikt, maar u moet de geschatte doorvoer voor uw workload gebruiken) en /ORDER_ID als primaire sleutel. Deze waarden verschillen afhankelijk van uw brongegevens.

    API maken voor Cassandra-account

Gegevensstroom van Oracle naar Azure Cosmos DB configureren

  1. Navigeer naar het Striim-exemplaar dat u hebt geïmplementeerd in de Azure Portal. Selecteer de knop Verbinding maken in de bovenste menubalk en kopieer op het tabblad SSH de URL in het veld Aanmelden met lokaal VM-account .

    De SSH-URL ophalen

  2. Open een nieuw terminalvenster en voer de SSH-opdracht uit die u hebt gekopieerd uit de Azure Portal. In dit artikel wordt gebruikgemaakt van terminal in een macOS. U kunt de vergelijkbare instructies volgen met behulp van een SSH-client op een Windows-computer. Wanneer u hierom wordt gevraagd, typt u Ja om door te gaan en voert u het wachtwoord in dat u in de vorige stap voor de virtuele machine hebt ingesteld.

    Verbinding maken met Striim VM

  3. Start vanuit hetzelfde terminalvenster de Striim-server opnieuw op door de volgende opdrachten uit te voeren:

    systemctl stop striim-node
    systemctl stop striim-dbms
    systemctl start striim-dbms
    systemctl start striim-node
    
  4. Het duurt een minuut voordat striim is opgestart. Als u de status wilt zien, voert u de volgende opdracht uit:

    tail -f /opt/striim/logs/striim-node.log
    
  5. Ga nu terug naar Azure en kopieer het openbare IP-adres van uw Striim-VM.

    IP-adres van Striim-VM kopiëren

  6. Als u naar de webgebruikersinterface van Striim wilt navigeren, opent u een nieuw tabblad in een browser en kopieert u het openbare IP-adres gevolgd door: 9080. Meld u aan met de gebruikersnaam van de beheerder, samen met het beheerderswachtwoord dat u hebt opgegeven in de Azure Portal.

    Aanmelden bij Striim

  7. Nu komt u op de startpagina van Striim. Er zijn drie verschillende deelvensters: Dashboards, Apps en SourcePreview. Met het deelvenster Dashboards kunt u gegevens in realtime verplaatsen en visualiseren. Het deelvenster Apps bevat uw streaminggegevenspijplijnen of gegevensstromen. Aan de rechterkant van de pagina ziet u SourcePreview, waar u een voorbeeld van uw gegevens kunt bekijken voordat u deze verplaatst.

  8. Selecteer het deelvenster Apps . We richten ons voorlopig op dit deelvenster. Er zijn verschillende voorbeeld-apps die u kunt gebruiken om meer te weten te komen over Striim, maar in dit artikel maakt u onze eigen apps. Selecteer de knop App toevoegen in de rechterbovenhoek.

    De Striim-app toevoegen

  9. Er zijn een aantal verschillende manieren om Striim-toepassingen te maken. Selecteer Beginnen vanaf het begin voor dit scenario.

    De app helemaal opnieuw starten

  10. Geef een beschrijvende naam op voor uw toepassing, bijvoorbeeld oraToCosmosDB en selecteer Opslaan.

    Een nieuwe toepassing maken

  11. U komt aan bij de Flow-Designer, waar u connectors uit de doos kunt slepen en neerzetten om uw streamingtoepassingen te maken. Typ Oracle in de zoekbalk en sleep de Oracle CDC-bron naar het app-canvas.

    Oracle CDC-bron

  12. Voer de eigenschappen van de bronconfiguratie van uw Oracle-exemplaar in. De bronnaam is slechts een naamconventie voor de Striim-toepassing. U kunt een naam zoals src_onPremOracle gebruiken. Voer ook andere gegevens in, zoals adaptertype, verbindings-URL, gebruikersnaam, wachtwoord, tabelnaam. Selecteer Opslaan om door te gaan.

    Bronparameters configureren

  13. Klik nu op het golfpictogram van de stream om verbinding te maken met het Azure Cosmos DB-doelexemplaren.

    Verbinding maken met doel

  14. Voordat u het doel configureert, moet u ervoor zorgen dat u een Baltimore-basiscertificaat hebt toegevoegd aan de Java-omgeving van Striim.

  15. Voer de configuratie-eigenschappen van uw Azure Cosmos DB-doelexemplaren in en selecteer Opslaan om door te gaan. Dit zijn de belangrijkste parameters om rekening mee te houden:

    • Adapter : gebruik DatabaseWriter. Wanneer u naar Azure Cosmos DB voor Apache Cassandra schrijft, is DatabaseWriter vereist. De Cassandra driver 3.6.0 is gebundeld met Striim. Als de DatabaseWriter het aantal RU's overschrijdt dat is ingericht in uw Azure Cosmos DB-container, loopt de toepassing vast.

    • Verbindings-URL : geef uw Azure Cosmos DB JDBC-verbindings-URL op. De URL heeft de indeling jdbc:cassandra://<contactpoint>:10350/<databaseName>?SSL=true

    • Gebruikersnaam : geef de naam van uw Azure Cosmos DB-account op.

    • Wachtwoord : geef de primaire sleutel van uw Azure Cosmos DB-account op.

    • Tabellen : doeltabellen moeten primaire sleutels hebben en primaire sleutels kunnen niet worden bijgewerkt.

    Schermopname van de configureerbare doeleigenschappen.

    Doeleigenschappen configureren

  16. Nu gaan we verder met het uitvoeren van de Striim-toepassing. Selecteer in de bovenste menubalk De optie Gemaakt en vervolgens App implementeren. In het implementatievenster kunt u opgeven of u bepaalde onderdelen van uw toepassing wilt uitvoeren op specifieke onderdelen van uw implementatietopologie. Omdat we in een eenvoudige implementatietopologie via Azure worden uitgevoerd, gebruiken we de standaardoptie.

    De app implementeren

  17. Nu gaan we een voorbeeld van de stroom bekijken om gegevens te zien die door de Striim stromen. Klik op het golfpictogram en klik op het oogpictogram ernaast. Na de implementatie kunt u een voorbeeld van de stroom bekijken om de gegevensstroom te bekijken. Selecteer het golfpictogram en de oogbol ernaast. Selecteer de knop Geïmplementeerd in de bovenste menubalk en selecteer App starten.

    De app starten

  18. Door een CDC-lezer (Change Data Capture) te gebruiken, worden alleen nieuwe wijzigingen in de database door Striim opgehaald. Als er gegevens door uw brontabellen stromen, ziet u deze. Omdat dit echter een voorbeeldtabel is, is dit de bron die niet is verbonden met een toepassing. Als u een voorbeeldgegevensgenerator gebruikt, kunt u een keten van gebeurtenissen invoegen in uw Oracle-database.

  19. U ziet dat er gegevens stromen via het Striim-platform. Striim haalt ook alle metagegevens op die zijn gekoppeld aan uw tabel. Dit is handig om de gegevens te bewaken en ervoor te zorgen dat de gegevens op het juiste doel terechtkomen.

    De CDC-pijplijn instellen

  20. Ten slotte gaan we ons aanmelden bij Azure en naar uw Azure Cosmos DB-account navigeren. Vernieuw de Data Explorer en u kunt zien dat de gegevens zijn aangekomen.

Met behulp van de Striim-oplossing in Azure kunt u continu gegevens migreren naar Azure Cosmos DB vanuit verschillende bronnen, zoals Oracle, Cassandra, MongoDB en diverse andere naar Azure Cosmos DB. Ga voor meer informatie naar de website van Striim, download een gratis proefversie van Striim van 30 dagen. Voor eventuele problemen bij het instellen van het migratiepad met Striim dient u een ondersteuningsaanvraag in.

Volgende stappen