Testbarhetsåtgärder

Artikel
06/01/2023

För att simulera en otillförlitlig infrastruktur ger Azure Service Fabric dig, utvecklaren, sätt att simulera olika verkliga fel och tillståndsövergångar. Dessa exponeras som testbarhetsåtgärder. Åtgärderna är de lågnivå-API:er som orsakar en specifik felinmatning, tillståndsövergång eller validering. Genom att kombinera dessa åtgärder kan du skriva omfattande testscenarier för dina tjänster.

Service Fabric tillhandahåller några vanliga testscenarier som består av dessa åtgärder. Vi rekommenderar starkt att du använder dessa inbyggda scenarier, som väljs noggrant för att testa vanliga tillståndsövergångar och felfall. Åtgärder kan dock användas för att skapa anpassade testscenarier när du vill lägga till täckning för scenarier som inte omfattas av de inbyggda scenarierna ännu eller som är anpassade för ditt program.

C#-implementeringar av åtgärderna finns i System.Fabric.dll sammansättning. System Fabric PowerShell-modulen finns i Microsoft.ServiceFabric.Powershell.dll-sammansättningen. Som en del av körningsinstallationen installeras ServiceFabric PowerShell-modulen för att underlätta användningen.

Graceful kontra ospårbara felåtgärder

Testbarhetsåtgärder klassificeras i två större bucketar:

Felaktiga fel: Dessa fel simulerar fel som omstarter av datorer och processkrascher. I sådana fall av fel stoppas körningskontexten för processen plötsligt. Det innebär att ingen rensning av tillståndet kan köras innan programmet startas igen.
Graciösa fel: Dessa fel simulerar graciösa åtgärder som replikflyttningar och droppar som utlöses av belastningsutjämning. I sådana fall får tjänsten ett meddelande om stängningen och kan rensa tillståndet innan den avslutas.

För bättre kvalitetsvalidering kör du tjänst- och företagsarbetsbelastningen samtidigt som du får olika graciösa och felaktiga fel. Fel i övningsscenarier där tjänstprocessen plötsligt avslutas mitt i ett arbetsflöde. Detta testar återställningssökvägen när tjänstrepliken har återställts av Service Fabric. Detta hjälper till att testa datakonsekvensen och om tjänsttillståndet upprätthålls korrekt efter fel. Den andra uppsättningen fel (de graciösa felen) testar att tjänsten reagerar korrekt på repliker som flyttas runt av Service Fabric. Det här testar hanteringen av annullering i Metoden RunAsync. Tjänsten måste söka efter den annulleringstoken som anges, spara dess tillstånd korrekt och avsluta Metoden RunAsync.

Lista över teståtgärder

Åtgärd	Beskrivning	Hanterat API	PowerShell-cmdlet	Graciösa/ospårbara fel
CleanTestState	Tar bort alla testtillstånd från klustret vid en felaktig avstängning av testdrivrutinen.	CleanTestStateAsync	Remove-ServiceFabricTestState	Inte tillämpligt
InvokeDataLoss	Inducerar dataförlust i en tjänstpartition.	InvokeDataLossAsync	Invoke-ServiceFabricPartitionDataLoss	Graciösa
InvokeQuorumLoss	Placerar en viss tillståndskänslig tjänstpartition i kvorumförlust.	InvokeQuorumLossAsync	Invoke-ServiceFabricQuorumLoss	Graciösa
MovePrimary	Flyttar den angivna primära repliken av en tillståndskänslig tjänst till den angivna klusternoden.	MovePrimaryAsync	Move-ServiceFabricPrimaryReplica	Graciösa
MoveSecondary	Flyttar den aktuella sekundära repliken av en tillståndskänslig tjänst till en annan klusternod.	MoveSecondaryAsync	Move-ServiceFabricSecondaryReplica	Graciösa
MoveInstance	Flyttar den aktuella instansen av en tillståndslös tjänst till en annan klusternod.	MoveInstanceAsync	Move-ServiceFabricInstance	Graciösa
RemoveReplica	Simulerar ett replikfel genom att ta bort en replik från ett kluster. Då stängs repliken och den övergår till rollen Ingen, vilket tar bort hela dess tillstånd från klustret.	RemoveReplicaAsync	Remove-ServiceFabricReplica	Graciösa
RestartDeployedCodePackage	Simulerar ett fel i kodpaketprocessen genom att starta om ett kodpaket som distribuerats på en nod i ett kluster. Detta avbryter kodpaketprocessen, som startar om alla användartjänstrepliker som finns i den processen.	RestartDeployedCodePackageAsync	Restart-ServiceFabricDeployedCodePackage	Ospårbar
RestartNode	Simulerar ett Service Fabric-klusternodfel genom att starta om en nod.	RestartNodeAsync	Restart-ServiceFabricNode	Ospårbar
RestartPartition	Simulerar ett blackout-scenario för datacenter eller klusteravbrott genom att starta om vissa eller alla repliker av en partition.	RestartPartitionAsync	Restart-ServiceFabricPartition	Graciösa
RestartReplica	Simulerar ett replikfel genom att starta om en bevarad replik i ett kluster, stänga repliken och sedan öppna den igen.	RestartReplicaAsync	Restart-ServiceFabricReplica	Graciösa
Startnod	Startar en nod i ett kluster som redan har stoppats.	StartNodeAsync	Start-ServiceFabricNode	Inte tillämpligt
StopNode	Simulerar ett nodfel genom att stoppa en nod i ett kluster. Noden stannar nere tills StartNode anropas.	StopNodeAsync	Stop-ServiceFabricNode	Ospårbar
ValidateApplication	Verifierar tillgängligheten och hälsotillståndet för alla Service Fabric-tjänster i ett program, vanligtvis efter att ett fel har inducerats i systemet.	ValidateApplicationAsync	Test-ServiceFabricApplication	Inte tillämpligt
ValidateService	Verifierar tillgängligheten och hälsotillståndet för en Service Fabric-tjänst, vanligtvis efter att ha framkallat fel i systemet.	ValidateServiceAsync	Test-ServiceFabricService	Inte tillämpligt

Köra en teståtgärd med PowerShell

Den här självstudien visar hur du kör en teståtgärd med hjälp av PowerShell. Du får lära dig hur du kör en teståtgärd mot ett lokalt (enstaka) kluster eller ett Azure-kluster. Microsoft.Fabric.Powershell.dll– Service Fabric PowerShell-modulen – installeras automatiskt när du installerar Microsoft Service Fabric MSI. Modulen läses in automatiskt när du öppnar en PowerShell-prompt.

Självstudiesegment:

Köra en åtgärd mot ett enrutskluster
Köra en åtgärd mot ett Azure-kluster

Köra en åtgärd mot ett enrutskluster

Om du vill köra en teståtgärd mot ett lokalt kluster ansluter du först till klustret och öppnar PowerShell-prompten i administratörsläge. Låt oss titta på åtgärden Restart-ServiceFabricNode .

Restart-ServiceFabricNode -NodeName Node1 -CompletionMode DoNotVerify

Här körs åtgärden Restart-ServiceFabricNode på en nod med namnet "Node1". Slutförandeläget anger att det inte ska verifiera om åtgärden restart-node faktiskt lyckades. Om du anger slutförandeläget som "Verifiera" verifieras om omstartsåtgärden lyckades. I stället för att ange noden direkt efter dess namn kan du ange den via en partitionsnyckel och typen av replik, enligt följande:

Restart-ServiceFabricNode -ReplicaKindPrimary  -PartitionKindNamed -PartitionKey Partition3 -CompletionMode Verify

$connection = "localhost:19000"
$nodeName = "Node1"

Connect-ServiceFabricCluster $connection
Restart-ServiceFabricNode -NodeName $nodeName -CompletionMode DoNotVerify

Restart-ServiceFabricNode ska användas för att starta om en Service Fabric-nod i ett kluster. Detta stoppar Fabric.exe processen, som startar om alla systemtjänst- och användartjänstrepliker som finns på noden. Genom att använda det här API:et för att testa tjänsten kan du upptäcka buggar längs återställningsvägarna för redundans. Den hjälper till att simulera nodfel i klustret.

Följande skärmbild visar kommandot Restart-ServiceFabricNode testability i praktiken.

Skärmbild av körning av kommandot Restart-ServiceFabricNode i PowerShell.

Utdata från den första Get-ServiceFabricNode (en cmdlet från Service Fabric PowerShell-modulen) visar att det lokala klustret har fem noder: Node.1 till Node.5. När teståtgärden (cmdlet) Restart-ServiceFabricNode körs på noden med namnet Node.4 ser vi att nodens drifttid har återställts.

Köra en åtgärd mot ett Azure-kluster

Att köra en teståtgärd (med hjälp av PowerShell) mot ett Azure-kluster liknar att köra åtgärden mot ett lokalt kluster. Den enda skillnaden är att innan du kan köra åtgärden måste du först ansluta till Azure-klustret i stället för att ansluta till det lokala klustret.

Köra en teståtgärd med C #

Om du vill köra en teståtgärd med hjälp av C# måste du först ansluta till klustret med hjälp av FabricClient. Hämta sedan de parametrar som behövs för att köra åtgärden. Olika parametrar kan användas för att köra samma åtgärd. Om du tittar på åtgärden RestartServiceFabricNode är ett sätt att köra den att använda nodinformationen (nodnamn och nodinstans-ID) i klustret.

RestartNodeAsync(nodeName, nodeInstanceId, completeMode, operationTimeout, CancellationToken.None)

Parameterförklaring:

CompleteMode anger att läget inte ska verifiera om omstartsåtgärden lyckades. Om du anger slutförandeläget som "Verifiera" verifieras om omstartsåtgärden lyckades.
OperationTimeout anger hur lång tid åtgärden ska slutföras innan ett TimeoutException-undantag utlöses.
CancellationToken gör att ett väntande samtal kan avbrytas.

I stället för att ange noden direkt efter dess namn kan du ange den via en partitionsnyckel och typen av replik.

Mer information finns i PartitionSelector och ReplicaSelector.

// Add a reference to System.Fabric.Testability.dll and System.Fabric.dll
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using System.Fabric.Testability;
using System.Fabric;
using System.Threading;
using System.Numerics;

class Test
{
    public static int Main(string[] args)
    {
        string clusterConnection = "localhost:19000";
        Uri serviceName = new Uri("fabric:/samples/PersistentToDoListApp/PersistentToDoListService");
        string nodeName = "N0040";
        BigInteger nodeInstanceId = 130743013389060139;

        Console.WriteLine("Starting RestartNode test");
        try
        {
            //Restart the node by using ReplicaSelector
            RestartNodeAsync(clusterConnection, serviceName).Wait();

            //Another way to restart node is by using nodeName and nodeInstanceId
            RestartNodeAsync(clusterConnection, nodeName, nodeInstanceId).Wait();
        }
        catch (AggregateException exAgg)
        {
            Console.WriteLine("RestartNode did not complete: ");
            foreach (Exception ex in exAgg.InnerExceptions)
            {
                if (ex is FabricException)
                {
                    Console.WriteLine("HResult: {0} Message: {1}", ex.HResult, ex.Message);
                }
            }
            return -1;
        }

        Console.WriteLine("RestartNode completed.");
        return 0;
    }

    static async Task RestartNodeAsync(string clusterConnection, Uri serviceName)
    {
        PartitionSelector randomPartitionSelector = PartitionSelector.RandomOf(serviceName);
        ReplicaSelector primaryofReplicaSelector = ReplicaSelector.PrimaryOf(randomPartitionSelector);

        // Create FabricClient with connection and security information here
        FabricClient fabricclient = new FabricClient(clusterConnection);
        await fabricclient.FaultManager.RestartNodeAsync(primaryofReplicaSelector, CompletionMode.Verify);
    }

    static async Task RestartNodeAsync(string clusterConnection, string nodeName, BigInteger nodeInstanceId)
    {
        // Create FabricClient with connection and security information here
        FabricClient fabricclient = new FabricClient(clusterConnection);
        await fabricclient.FaultManager.RestartNodeAsync(nodeName, nodeInstanceId, CompletionMode.Verify);
    }
}

PartitionSelector och ReplicaSelector

PartitionSelector

PartitionSelector är en hjälpkomponent som exponeras i testbarhet och används för att välja en specifik partition där du kan utföra någon av testbarhetsåtgärderna. Den kan användas för att välja en specifik partition om partitions-ID:t är känt i förväg. Eller så kan du ange partitionsnyckeln så löser åtgärden partitions-ID:t internt. Du kan också välja en slumpmässig partition.

Om du vill använda den här hjälpen skapar du PartitionSelector-objektet och väljer partitionen med någon av Metoderna Välj* . Skicka sedan partitionselector-objektet till det API som kräver det. Om inget alternativ har valts är standardinställningen en slumpmässig partition.

Uri serviceName = new Uri("fabric:/samples/InMemoryToDoListApp/InMemoryToDoListService");
Guid partitionIdGuid = new Guid("8fb7ebcc-56ee-4862-9cc0-7c6421e68829");
string partitionName = "Partition1";
Int64 partitionKeyUniformInt64 = 1;

// Select a random partition
PartitionSelector randomPartitionSelector = PartitionSelector.RandomOf(serviceName);

// Select a partition based on ID
PartitionSelector partitionSelectorById = PartitionSelector.PartitionIdOf(serviceName, partitionIdGuid);

// Select a partition based on name
PartitionSelector namedPartitionSelector = PartitionSelector.PartitionKeyOf(serviceName, partitionName);

// Select a partition based on partition key
PartitionSelector uniformIntPartitionSelector = PartitionSelector.PartitionKeyOf(serviceName, partitionKeyUniformInt64);

ReplicaSelector

ReplicaSelector är en hjälpreplik som exponeras i testbarhet och används för att välja en replik där någon av testbarhetsåtgärderna ska utföras. Den kan användas för att välja en specifik replik om replik-ID:t är känt i förväg. Dessutom kan du välja en primär replik eller en slumpmässig sekundär. ReplicaSelector härleds från PartitionSelector, så du måste välja både repliken och partitionen som du vill utföra teståtgärden på.

Om du vill använda den här hjälpen skapar du ett ReplicaSelector-objekt och anger hur du vill välja repliken och partitionen. Du kan sedan skicka det till det API som kräver det. Om inget alternativ har valts är standardinställningen en slumpmässig replik och en slumpmässig partition.

Guid partitionIdGuid = new Guid("8fb7ebcc-56ee-4862-9cc0-7c6421e68829");
PartitionSelector partitionSelector = PartitionSelector.PartitionIdOf(serviceName, partitionIdGuid);
long replicaId = 130559876481875498;

// Select a random replica
ReplicaSelector randomReplicaSelector = ReplicaSelector.RandomOf(partitionSelector);

// Select the primary replica
ReplicaSelector primaryReplicaSelector = ReplicaSelector.PrimaryOf(partitionSelector);

// Select the replica by ID
ReplicaSelector replicaByIdSelector = ReplicaSelector.ReplicaIdOf(partitionSelector, replicaId);

// Select a random secondary replica
ReplicaSelector secondaryReplicaSelector = ReplicaSelector.RandomSecondaryOf(partitionSelector);

Nästa steg

Testbarhetsscenarier
Testa din tjänst
- Simulera fel under tjänstarbetsbelastningar
- Kommunikationsfel från tjänst till tjänst