Gegevens migreren naar Azure Cosmos DB Cassandra-API-account met behulp van Striim
VAN TOEPASSING OP:
Cassandra-API
De Striim-afbeelding in de Azure Marketplace biedt continue realtime gegevensverplaatsing van datawarehouses en databases naar Azure. Tijdens het verplaatsen van de gegevens kunt u inregeldenormalisatie, gegevenstransformatie, realtime analyses en scenario's voor gegevensrapportage uitvoeren. Het is eenvoudig om aan de slag te gaan met Striim om bedrijfsgegevens continu naar een Azure Cosmos DB Cassandra-API. Azure biedt een marketplace-aanbieding die het eenvoudig maakt om Striim te implementeren en gegevens te migreren naar Azure Cosmos DB.
In dit artikel wordt beschreven hoe u Striim gebruikt om gegevens te migreren van een Oracle-database naar Azure Cosmos DB Cassandra-API account.
Vereisten
Als u geen Azure-abonnement hebt, maakt u een gratis account voordat u begint.
Een Oracle-database die on-premises wordt uitgevoerd met enkele gegevens.
De Striim Marketplace-oplossing implementeren
Meld u aan bij de Azure Portal.
Selecteer Een resource maken en zoek naar Striim in Azure Marketplace. Selecteer de eerste optie en maak.
Voer vervolgens de configuratie-eigenschappen van het Striim-exemplaar in. De Striim-omgeving wordt geïmplementeerd in een virtuele machine. Voer in het deelvenster Basisinformatie de gebruikersnaam en het VM-wachtwoord van de VM in (dit wachtwoord wordt gebruikt voor SSH in de VM). Selecteer uw abonnement, resourcegroep en locatiedetails waar u Striim wilt implementeren. Als u klaar bent, selecteert u OK.
Kies in het deelvenster Striim-clusterinstellingen het type Striim-implementatie en de grootte van de virtuele machine.
Instelling Waarde Beschrijving Implementatietype Striim Zelfstandig Striim kan worden uitgevoerd in een zelfstandige implementatie of clusterimplementatietypen. In de zelfstandige modus wordt de Striim-server geïmplementeerd op één virtuele machine en kunt u de grootte van de virtuele machines selecteren, afhankelijk van uw gegevensvolume. In de clustermodus wordt de Striim-server geïmplementeerd op twee of meer VM's met de geselecteerde grootte. Clusteromgevingen met meer dan 2 knooppunten bieden automatische hoge beschikbaarheid en failover. In deze zelfstudie kunt u de optie Zelfstandig selecteren. Gebruik de standaard VM Standard_F4s grootte. Naam van het Striim-cluster <Striim_cluster_Name> Naam van het Striim-cluster. Striim-clusterwachtwoord <Striim_cluster_password> Wachtwoord voor het cluster. Nadat u het formulier hebt ingevuld, selecteert u OK om door te gaan.
Configureer in het deelvenster Striim-toegangsinstellingen het openbare IP-adres (kies de standaardwaarden), de domeinnaam voor Striim en het beheerderswachtwoord dat u wilt gebruiken om u aan te melden bij de Striim-gebruikersinterface. Configureer een VNET en subnet (kies de standaardwaarden). Nadat u de gegevens invult, selecteert u OK om door te gaan.
Azure valideert de implementatie en controleert of alles er goed uitziet; Validatie duurt enkele minuten. Nadat de validatie is voltooid, selecteert u OK.
Controleer ten slotte de gebruiksvoorwaarden en selecteer Maken om uw Striim-exemplaar te maken.
De brondatabase configureren
In deze sectie configureert u de Oracle-database als de bron voor gegevens movement. U hebt het Oracle JDBC-stuurprogramma nodig om verbinding te maken met Oracle. Als u wijzigingen uit uw Oracle-brondatabase wilt lezen, kunt u de LogMiner- of XStream-API's gebruiken. Het Oracle JDBC-stuurprogramma moet aanwezig zijn in het Java-klassepad van Striim om gegevens uit de Oracle-database te lezen, schrijven of persistent te maken.
Download het stuurprogramma hebt gedownload naar uw lokale computer. U installeert deze later in het Striim-cluster.
Doeldatabase configureren
In deze sectie configureert u het Azure Cosmos DB Cassandra-API account als het doel voor gegevens movement.
Maak een Azure Cosmos DB Cassandra-API account met behulp van de Azure Portal.
Navigeer naar het Data Explorer in uw Azure Cosmos-account. Selecteer Nieuwe tabel om een nieuwe container te maken. Stel dat u producten migreert en gegevens bestelt uit een Oracle-database naar Azure Cosmos DB. Maak een nieuwe Keyspace met de naam StriimDemo met een Orders-container. De container inrichten met 1000 RUs(in dit voorbeeld worden 1000 RUs gebruikt, maar u moet de geschatte doorvoer voor uw workload gebruiken) en /ORDER_ID als de primaire sleutel. Deze waarden verschillen afhankelijk van uw brongegevens.
Oracle configureren om Azure Cosmos DB gegevensstroom te configureren
Laten we nu teruggaan naar Striim. Voordat u met Striim communiceert, installeert u het Oracle JDBC-stuurprogramma dat u eerder hebt gedownload.
Navigeer naar het Striim-exemplaar dat u hebt geïmplementeerd in de Azure Portal. Selecteer de Verbinding maken in de bovenste menubalk en kopieer op het tabblad SSH de URL in het veld Aanmelden met lokaal VM-account.
Open een nieuw terminalvenster en voer de SSH-opdracht uit die u hebt gekopieerd uit Azure Portal. In dit artikel wordt terminal in een MacOS gebruikt. U kunt de vergelijkbare instructies volgen met PuTTY of een andere SSH-client op een Windows machine. Wanneer u hier om wordt gevraagd, typt u Ja om door te gaan en voert u het wachtwoord in dat u in de vorige stap hebt ingesteld voor de virtuele machine.
Open nu een nieuw terminaltabblad om het bestand copiedbc8.jar te kopiëren dat u eerder hebt gedownload. Gebruik de volgende SCP-opdracht om het JAR-bestand van uw lokale computer te kopiëren naar de map tmp van het Striim-exemplaar dat wordt uitgevoerd in Azure:
cd <Directory_path_where_the_Jar_file_exists> scp ojdbc8.jar striimdemo@striimdemo.westus.cloudapp.azure.com:/tmp
Ga vervolgens terug naar het venster waarin u SSH hebt gedaan voor het Striim-exemplaar en meld u aan als sudo. Verplaats het bestand hadbc8.jar uit de map /tmp naar de map lib van uw Striim-exemplaar met de volgende opdrachten:
sudo su cd /tmp mv ojdbc8.jar /opt/striim/lib chmod +x ojdbc8.jar
Start vanuit hetzelfde terminalvenster de Striim-server opnieuw op door de volgende opdrachten uit te voeren:
Systemctl stop striim-node Systemctl stop striim-dbms Systemctl start striim-dbms Systemctl start striim-nodeHet duurt even om Striim op te starten. Als u de status wilt zien, voer dan de volgende opdracht uit:
tail -f /opt/striim/logs/striim-node.logGa nu terug naar Azure en kopieer het openbare IP-adres van uw Striim-VM.
Als u naar de webinterface van Striim wilt navigeren, opent u een nieuw tabblad in een browser en kopieert u het openbare IP-adres gevolgd door: 9080. Meld u aan met behulp van de gebruikersnaam van de beheerder, samen met het beheerderswachtwoord dat u hebt opgegeven in de Azure Portal.
U komt nu bij de startpagina van Striim. Er zijn drie verschillende deelvensters: Dashboards, Apps en SourcePreview. In het deelvenster Dashboards kunt u gegevens in realtime verplaatsen en visualiseren. Het deelvenster Apps bevat uw pijplijnen voor streaminggegevens of gegevensstromen. Aan de rechterkant van de pagina staat SourcePreview, waar u een voorbeeld van uw gegevens kunt bekijken voordat u deze verplaatst.
Selecteer het deelvenster Apps. We richten ons nu op dit deelvenster. Er zijn verschillende voorbeeld-apps die u kunt gebruiken om meer te weten te komen over Striim, maar in dit artikel maakt u er zelf een. Selecteer de knop App toevoegen in de rechterbovenhoek.
Er zijn een aantal verschillende manieren om Striim-toepassingen te maken. Selecteer Beginnen vanuit het begin voor dit scenario.
Geef een gebruiksvriendelijke naam voor uw toepassing, bijvoorbeeld oraToCosmosDB, en selecteer Opslaan.
U komt aan bij de Flow Designer, waar u connectors uit de doos kunt slepen en neerzetten om uw streamingtoepassingen te maken. Typ Oracle in de zoekbalk en sleep de Oracle CDC-bron naar het app-canvas.
Voer de bronconfiguratie-eigenschappen van uw Oracle-exemplaar in. De bronnaam is slechts een naamconventie voor de Striim-toepassing. U kunt een naam zoals src_onPremOracle. Voer ook andere gegevens in, zoals adaptertype, verbindings-URL, gebruikersnaam, wachtwoord, tabelnaam. Selecteer Opslaan om door te gaan.
Klik nu op het golfpictogram van de stroom om de doel-Azure Cosmos DB verbinden.
Voordat u het doel configureert, moet u ervoor zorgen dat u een Baltimore-basiscertificaat hebt toegevoegd aan de Java-omgeving van Striim.
Voer de configuratie-eigenschappen van uw doel-Azure Cosmos DB en selecteer Opslaan om door te gaan. Hier zijn de belangrijkste parameters om op te merken:
Adapter - DatabaseWriter gebruiken. Bij het schrijven naar Azure Cosmos DB Cassandra-API is DatabaseWriter vereist. Het Cassandra-stuurprogramma 3.6.0 is gebundeld met Striim. Als de DatabaseWriter het aantal AANVRAAG's overschrijdt dat is ingericht voor uw Azure Cosmos-container, loopt de toepassing vast.
Verbindings-URL: geef uw Azure Cosmos DB JDBC-verbindings-URL op. De URL heeft de indeling
jdbc:cassandra://<contactpoint>:10350/<databaseName>?SSL=trueGebruikersnaam: geef de naam van uw Azure Cosmos-account op.
Wachtwoord: geef de primaire sleutel van uw Azure Cosmos-account op.
Tabellen: doeltabellen moeten primaire sleutels hebben en primaire sleutels kunnen niet worden bijgewerkt.
Nu gaan we de Striim-toepassing uitvoeren. Selecteer in de bovenste menubalk Gemaakt en vervolgens App implementeren. In het implementatievenster kunt u opgeven of u bepaalde onderdelen van uw toepassing wilt uitvoeren op specifieke onderdelen van uw implementatietopologie. Omdat we in een eenvoudige implementatietopologie via Azure worden uitgevoerd, gebruiken we de standaardoptie.
Nu gaan we een voorbeeld van de stroom bekijken om te zien hoe gegevens door de Striim stromen. Klik op het golfpictogram en klik op het oogpictogram er naast. Na de implementatie kunt u een voorbeeld van de stroom bekijken om de gegevensstroom te bekijken. Selecteer het golfpictogram en de oogballon er naast. Selecteer de knop Geïmplementeerd in de bovenste menubalk en selecteer App starten.
Met behulp van een CDC(Change Data Capture)-lezer haalt Striim alleen nieuwe wijzigingen op in de database. Als er gegevens door uw brontabellen stromen, ziet u deze. Omdat dit echter een voorbeeldtabel is, is de bron niet verbonden met een toepassing. Als u een voorbeeldgegevensgenerator gebruikt, kunt u een keten van gebeurtenissen in uw Oracle-database invoegen.
U ziet dat gegevens door het Striim-platform stromen. Striim haalt ook alle metagegevens op die aan uw tabel zijn gekoppeld. Dit is handig om de gegevens te controleren en ervoor te zorgen dat de gegevens op het juiste doel worden weergegeven.
Ten slotte melden we ons aan bij Azure en gaan we naar uw Azure Cosmos-account. Vernieuw Data Explorer en u ziet dat de gegevens zijn aangekomen.
Met behulp van de Striim-oplossing in Azure kunt u continu gegevens migreren naar Azure Cosmos DB vanuit verschillende bronnen, zoals Oracle, Cassandra, MongoDB en verschillende andere bronnen om ze Azure Cosmos DB. Ga voor meer informatie naar de Striim-website,download een gratis proefversie van Striim van 30dagen en voor eventuele problemen bij het instellen van het migratiepad met Striim, kunt u een ondersteuningsaanvraag indienen.
Volgende stappen
Als u gegevens migreert naar Azure Cosmos DB SQL API, bekijkt u hoe u gegevens naar een Cassandra-API migreert met behulp van Striim
Uw gegevens bewaken en fouten opsporen met Azure Cosmos DB metrische gegevens