Informazioni sul riavvio del sistema della macchina virtuale di AzureUnderstand a system reboot for Azure VM

Le macchine virtuali (VM) di Azure a volte possono riavviarsi senza un motivo apparente, senza che sia stata avviata l'operazione di riavvio.Azure virtual machines (VMs) might sometimes reboot for no apparent reason, without evidence of your having initiated the reboot operation. Questo articolo elenca le azioni e gli eventi che possono provocare il riavvio delle macchine virtuali e fornisce informazioni su come evitare problemi di riavvio imprevisto o ridurre le conseguenze di tali problemi.This article lists the actions and events that can cause VMs to reboot and provides insight into how to avoid unexpected reboot issues or reduce the impact of such issues.

Configurare le macchine virtuali per la disponibilità elevataConfigure the VMs for high availability

Il modo migliore per proteggere un'applicazione in esecuzione in Azure dalle conseguenze di riavvii e tempi di inattività delle macchine virtuali è quello di configurare le macchine virtuali per la disponibilità elevata.The best way to protect an application that's running on Azure against VM reboots and downtime is to configure the VMs for high availability.

Per garantire questo livello di ridondanza dell'applicazione, è consigliabile raggruppare due o più macchine virtuali in un set di disponibilità.To provide this level of redundancy to your application, we recommend that you group two or more VMs in an availability set. Questa configurazione assicura infatti che, nel corso di un evento di manutenzione pianificata o non pianificata, almeno una delle macchine virtuali sia sempre disponibile e soddisfi per almeno il 99,95% i requisiti del contratto di servizio di Azure.This configuration ensures that during either a planned or unplanned maintenance event, at least one VM is available and meets the 99.95 percent Azure SLA.

Per altre informazioni sui set di disponibilità, vedere gli articoli seguenti:For more information about availability sets, see the following articles:

Informazioni su Integrità risorseResource Health information

Integrità risorse di Azure è un nuovo servizio che espone l'integrità delle singole risorse di Azure e offre consigli pratici per risolvere i problemi.Azure Resource Health is a service that exposes the health of individual Azure resources and provides actionable guidance for troubleshooting problems. In un ambiente cloud in cui non è possibile accedere direttamente ai server o agli elementi dell'infrastruttura, l'obiettivo di Integrità risorse è quello di ridurre il tempo impiegato per la risoluzione dei problemi,In a cloud environment where it isn’t possible to directly access servers or infrastructure elements, the goal of Resource Health is to reduce the time that you spend on troubleshooting. in particolare lo scopo è ridurre il tempo impiegato per determinare se il problema è interno all'applicazione o dovuto a un evento specifico della piattaforma Azure.In particular, the aim is to reduce the time that you spend determining whether the root of the problem lies in the application or in an event inside the Azure platform. Per altre informazioni, vedere Panoramica su Integrità risorse di Azure.For more information, see Understand and use Resource Health.

Azioni e gli eventi che possono generare il riavvio della macchina virtualeActions and events that can cause the VM to reboot

Manutenzione pianificataPlanned maintenance

Microsoft Azure esegue periodicamente aggiornamenti a livello globale per migliorare l'affidabilità, le prestazioni e la sicurezza dell'infrastruttura host sottostante alle macchine virtuali.Microsoft Azure periodically performs updates across the globe to improve the reliability, performance, and security of the host infrastructure that underlies VMs. Molti di questi aggiornamenti, inclusi gli aggiornamenti con mantenimento della memoria, vengono eseguiti senza alcun impatto sulle macchine virtuali o sui servizi cloud.Many of these updates, including memory-preserving updates, are performed without any impact on your VMs or cloud services.

Altri aggiornamenti, invece, richiedono il riavvio.However, some updates do require a reboot. In questi casi, le macchine virtuali vengono arrestate durante l'applicazione delle patch all'infrastruttura e quindi riavviate.In such cases, the VMs are shut down while we patch the infrastructure, and then the VMs are restarted.

Per informazioni sulla manutenzione pianificata di Azure e su come può influire sulla disponibilità delle macchine virtuali Linux, vedere gli articoli elencati qui.To understand what Azure planned maintenance is and how it can affect the availability of your Linux VMs, see the articles listed here. Gli articoli forniscono informazioni di base sul processo di manutenzione pianificata di Azure e su come pianificare la manutenzione per ridurre ulteriormente l'impatto.The articles provide background about the Azure planned maintenance process and how to schedule planned maintenance to further reduce the impact.

Aggiornamenti con mantenimento della memoriaMemory-preserving updates

Per questa classe di aggiornamenti in Microsoft Azure, gli utenti non notano alcun impatto sulle macchine virtuali in esecuzione.For this class of updates in Microsoft Azure, users experience no impact on their running VMs. Molti di questi aggiornamenti sono componenti o servizi che possono essere aggiornati senza interferire con l'istanza in esecuzione.Many of these updates are to components or services that can be updated without interfering with the running instance. Alcuni sono aggiornamenti dell'infrastruttura della piattaforma nel sistema operativo host, che possono essere applicati senza riavviare le macchine virtuali.Some are platform infrastructure updates on the host operating system that can be applied without a reboot of the VMs.

Questi aggiornamenti con mantenimento della memoria vengono eseguiti con una tecnologia che consente la migrazione sul posto in tempo reale.These memory-preserving updates are accomplished with technology that enables in-place live migration. Quando viene aggiornata, la VM viene messa in pausa.When it is being updated, the VM is placed in a paused state. Questo stato mantiene la memoria in RAM mentre il sistema operativo host sottostante riceve gli aggiornamenti e le patch necessari.This state preserves the memory in RAM while the underlying host operating system receives the necessary updates and patches. La macchina virtuale viene ripresa dopo un periodo di pausa massimo di 30 secondi.The VM is resumed within 30 seconds of being paused. Dopo che la VM è stata ripresa, l'orologio viene sincronizzato automaticamente.After the VM is resumed, its clock is automatically synchronized.

Grazie al breve periodo di pausa, la distribuzione degli aggiornamenti tramite questo meccanismo riduce considerevolmente l'impatto sulle VM.Because of the short pause period, deploying updates through this mechanism greatly reduces the impact on the VMs. Non si possono tuttavia distribuire tutti gli aggiornamenti in questo modo.However, not all updates can be deployed in this way.

Gli aggiornamenti a istanza multipla (per le macchine virtuali in un set di disponibilità) vengono applicati su un dominio di aggiornamento alla volta.Multi-instance updates (for VMs in an availability set) are applied one update domain at a time.

Nota

Con questo metodo di aggiornamento, i computer Linux con versioni precedenti del kernel sono interessati da un kernel panic.Linux machines that have old kernel versions are affected by a kernel panic during this update method. Per evitare questo problema, aggiornare il kernel alla versione 3.10.0-327.10.1 o successiva.To avoid this issue, update to kernel version 3.10.0-327.10.1 or later. Per altre informazioni, vedere Kernel panic di una macchina virtuale Linux di Azure basata su un kernel 3.10 dopo l'aggiornamento di nodo host.For more information, see An Azure Linux VM on a 3.10-based kernel panics after a host node upgrade.

Azioni di arresto o riavvio avviate dall'utenteUser-initiated reboot or shutdown actions

Se si esegue un riavvio dal portale di Azure, da Azure PowerShell, dall'interfaccia della riga di comando o dall'API RESET, è possibile trovare l'evento nel log attività di Azure.If you perform a reboot from the Azure portal, Azure PowerShell, command-line interface, or Reset API, you can find the event in the Azure Activity Log.

Se si esegue l'azione dal sistema operativo della VM, è possibile trovare l'evento nei registri di sistema.If you perform the action from the VM's operating system, you can find the event in the system logs.

Il riavvio della macchina virtuale si verifica solitamente anche quando si eseguono più azioni di modifica della configurazione.Other scenarios that usually cause the VM to reboot include multiple configuration-change actions. In genere, viene visualizzato un messaggio di avviso in cui si specifica che l'esecuzione di una determinata azione comporterà il riavvio della macchina virtuale.You'll ordinarily see a warning message indicating that executing a particular action will result in a reboot of the VM. Questi tipi di azione includono, ad esempio, operazioni di ridimensionamento della macchina virtuale, la modifica della password dell'account amministrativo o l'impostazione di un indirizzo IP statico.Examples include any VM resize operations, changing the password of the administrative account, and setting a static IP address.

Centro sicurezza di Azure e Windows UpdateAzure Security Center and Windows Update

Il Centro sicurezza di Azure monitora ogni giorno le macchine virtuali Windows e Linux alla ricerca di eventuali aggiornamenti mancanti del sistema operativo.Azure Security Center monitors daily Windows and Linux VMs for missing operating-system updates. Il Centro sicurezza recupera un elenco di aggiornamenti di sicurezza e critici disponibili da Windows Update o Windows Server Update Services (WSUS), in base al servizio configurato nella macchina virtuale Windows.Security Center retrieves a list of available security and critical updates from Windows Update or Windows Server Update Services (WSUS), depending on which service is configured on a Windows VM. Il Centro sicurezza cerca gli aggiornamenti più recenti anche per i sistemi Linux.Security Center also checks for the latest updates for Linux systems. Se nella macchina virtuale non è stato eseguito un aggiornamento del sistema, il Centro sicurezza ne consiglia l'applicazione.If your VM is missing a system update, Security Center recommends that you apply system updates. L'applicazione di questi aggiornamenti di sistema è controllata tramite il Centro sicurezza nel portale di Azure.The application of these system updates is controlled through the Security Center in the Azure portal. Dopo l'applicazione di alcuni aggiornamenti, potrebbe essere necessario il riavvio della macchina virtuale.After you apply some updates, VM reboots might be required. Per altre informazioni, vedere Applicare gli aggiornamenti del sistema nel Centro sicurezza di Azure.For more information, see Apply system updates in Azure Security Center.

Come per i server locali, Azure non effettua il push degli aggiornamenti da Windows Update alle macchine virtuali di Windows Azure perché questi computer sono pensati per essere gestiti dagli utenti.Like on-premises servers, Azure does not push updates from Windows Update to Windows Azure VMs, because these machines are intended to be managed by their users. Tuttavia si consiglia di lasciare abilitata l'impostazione automatica di Windows Update.You are, however, encouraged to leave the automatic Windows Update setting enabled. Con l'installazione automatica degli aggiornamenti da Windows Update, il riavvio può anche verificarsi dopo l'applicazione degli aggiornamenti.Automatic installation of updates from Windows Update can also cause reboots to occur after the updates are applied. Per altre informazioni, vedere Windows Update: domande frequenti.For more information, see Windows Update FAQ.

Altre situazioni che influiscono sulla disponibilità della macchina virtualeOther situations affecting the availability of your VM

Esistono altri casi in cui Azure può sospendere attivamente l'uso di una macchina virtuale.There are other cases in which Azure might actively suspend the use of a VM. Si riceveranno tuttavia notifiche di posta elettronica prima che venga intrapresa questa azione e si avrà quindi la possibilità di risolvere i problemi sottostanti.You'll receive email notifications before this action is taken, so you'll have a chance to resolve the underlying issues. Tra i problemi che compromettono la disponibilità delle VM sono incluse le violazioni della sicurezza e la scadenza dei metodi di pagamento.Examples of issues that affect VM availability include security violations and the expiration of payment methods.

Errori del server hostHost server faults

La macchina virtuale è ospitata in un server fisico in esecuzione in un data center di Azure.The VM is hosted on a physical server that is running inside an Azure datacenter. Il server fisico esegue un agente denominato agente host e alcuni altri componenti di Azure.The physical server runs an agent called the Host Agent in addition to a few other Azure components. Se questi componenti software di Azure nel server fisico non rispondono, il sistema di monitoraggio attiva un riavvio del server host per tentarne il ripristino.When these Azure software components on the physical server become unresponsive, the monitoring system triggers a reboot of the host server to attempt recovery. La macchina virtuale in genere torna disponibile entro cinque minuti e rimane nello stesso host in cui si trovava in precedenza.The VM is usually available again within five minutes and continues to live on the same host as previously.

Gli errori del server vengono solitamente generati da errori hardware, ad esempio dal guasto di un disco rigido o di un'unità SSD.Server faults are usually caused by hardware failure, such as the failure of a hard disk or solid-state drive. Azure monitorizza in modo continuo queste occorrenze, identifica i bug sottostanti e rilascia gli aggiornamenti dopo aver implementato e testato l'attenuazione.Azure continuously monitors these occurrences, identifies the underlying bugs, and rolls out updates after the mitigation has been implemented and tested.

Poiché alcuni errori del server host possono essere specifici del server, una situazione di riavvio ripetuto di una macchina virtuale può essere migliorata ridistribuendo manualmente la macchina virtuale in un altro server host.Because some host server faults can be specific to that server, a repeated VM reboot situation might be improved by manually redeploying the VM to another host server. Questa operazione può essere attivata usando l'opzione Ridistribuisci nella pagina dei dettagli della macchina virtuale oppure arrestando e riavviando la macchina virtuale nel portale di Azure.This operation can be triggered by using the redeploy option on the details page of the VM, or by stopping and restarting the VM in the Azure portal.

Ripristino automaticoAuto-recovery

Se il server host non può essere riavviato per qualsiasi motivo, la piattaforma Azure avvia un'azione di ripristino automatico per portare il server host in errore fuori dalla rotazione e consentirne un'analisi più approfondita.If the host server cannot reboot for any reason, the Azure platform initiates an auto-recovery action to take the faulty host server out of rotation for further investigation.

Tutte le macchine virtuali presenti nell'host vengono automaticamente riassegnate a un server host diverso, integro.All VMs on that host are automatically relocated to a different, healthy host server. Questo processo richiede in genere 15 minuti.This process is usually complete within 15 minutes. Per altre informazioni sul processo di ripristino automatico, vedere Auto-recovery of VMs (Ripristino automatico delle macchine virtuali).To learn more about the auto-recovery process, see Auto-recovery of VMs.

Manutenzione non pianificataUnplanned maintenance

In rare occasioni, è possibile che il team operativo di Azure debba eseguire alcune attività di manutenzione per garantire l'integrità complessiva della piattaforma Azure.On rare occasions, the Azure operations team might need to perform maintenance activities to ensure the overall health of the Azure platform. Questo comportamento può influire sulla disponibilità della macchina virtuale e in genere determina la stessa azione di recupero automatico descritta in precedenza.This behavior might affect VM availability, and it usually results in the same auto-recovery action as described earlier.

Le operazioni di manutenzione non pianificata includono:Unplanned maintenances include the following:

  • Deframmentazione urgente di un nodoUrgent node defragmentation
  • Aggiornamenti urgenti di switch di reteUrgent network switch updates

Arresti anomali della macchina virtualeVM crashes

Una VM può venire riavviata a causa di problemi interni.VMs might restart because of issues within the VM itself. Il ruolo o il carico di lavoro in esecuzione nella macchina virtuale può attivare un controllo bug nel sistema operativo guest.The workload or role that's running on the VM might trigger a bug check within the guest operating system. Per determinare il motivo dell'arresto anomalo, visualizzare i registri applicazioni e di sistema per le macchine virtuali Windows e i log seriali per le macchine virtuali Linux.For help determining the reason for the crash, view the system and application logs for Windows VMs, and the serial logs for Linux VMs.

Le macchine virtuali in Azure si basano su dischi virtuali per il sistema operativo e l'archiviazione dati ospitata nell'infrastruttura di archiviazione di Azure.VMs in Azure rely on virtual disks for operating system and data storage that is hosted on the Azure Storage infrastructure. Ogni volta che la disponibilità o la connettività tra la macchina virtuale e i dischi virtuali associati viene interrotta per più di 120 secondi, la piattaforma Azure esegue un arresto forzato delle macchine virtuali per evitare il danneggiamento dei dati.Whenever the availability or connectivity between the VM and the associated virtual disks is affected for more than 120 seconds, the Azure platform performs a forced shutdown of the VMs to avoid data corruption. Le macchine virtuali vengono automaticamente riaccese dopo aver ripristinato la connettività dell'archiviazione.The VMs are automatically powered back on after storage connectivity has been restored.

La durata dell'arresto può essere di cinque minuti o molto più lunga.The duration of the shutdown can be as short as five minutes but can be significantly longer. Di seguito è illustrato uno dei casi specifici di arresto forzato correlato all'archiviazione:The following is one of the specific cases that is associated with storage-related forced shutdowns:

Superamento dei limiti di I/OExceeding IO limits

È possibile che si verifichi un arresto temporaneo delle macchine virtuali quando le richieste di I/O vengono continuamente limitate perché il volume di operazioni di input/output al secondo (IOPS) è superiore ai limiti per il disco.VMs might be temporarily shut down when I/O requests are consistently throttled because the volume of I/O operations per second (IOPS) exceeds the I/O limits for the disk. L'archiviazione su disco standard è limitata a 500 operazioni di I/O al secondo. Per attenuare questo problema, usare lo striping del disco o configurare lo spazio di archiviazione all'interno della macchina virtuale guest, a seconda del carico di lavoro.(Standard disk storage is limited to 500 IOPS.) To mitigate this issue, use disk striping or configure the storage space inside the guest VM, depending on the workload. Per altre informazioni, vedere Configurazione delle macchine virtuali di Azure per prestazioni di archiviazione ottimali.For details, see Configuring Azure VMs for Optimal Storage Performance.

Con l'archiviazione Premium di Azure sono previsti limiti di IOPS più elevati, fino a 80.000 IOPS.Higher IOPS limits are available via Azure Premium Storage with up to 80,000 IOPS. Per altre informazioni, vedere Archiviazione Premium con prestazioni elevate.For more information, see High-Performance Premium Storage.

Altri eventi imprevistiOther incidents

In rare circostanze, un problema di ampia portata può interessare più server in un data center di Azure.In rare circumstances, a widespread issue can affect multiple servers in an Azure datacenter. In questo caso, il team di Azure invia notifiche di posta elettronica alle sottoscrizioni interessate.If this issue occurs, the Azure team sends email notifications to the affected subscriptions. È possibile visualizzare il dashboard per l'integrità dei servizi di Azure e il portale di Azure per verificare lo stato delle interruzioni in corso e degli eventi imprevisti passati.You can check the Azure Service Health dashboard and the Azure portal for the status of ongoing outages and past incidents.