La scorsa settimana ho aggiornato una piccola infrastruttura composta da due nodi vsphere ed un vcenter da vsphere 5.5 a vsphere 6 passando al vcenter in formato appliance.
Il cliente non aveva a disposizione un DNS e quindi abbiamo provato ad aggirare il problema utilizzando i file hosts del vcenter e dei due host esxi (era quasi un test visto che nelle ultime versioni di vsphere un DNS è d’OBBLIGO!).
Aggiorno il tutto, aggancio gli host al nuovo vCenter, faccio qualche prova e sembra tutto a posto. La cosa strana è che dopo circa 24/48 ore di funzionamento ha iniziato a comparire questo errore nel tab summary degli host:
Configuration issues
Agent can’t send heartbeats: Host is down
In realtà tutto sembra funzionare correttamente, gli host sono raggiungibili e gestibili ma ovviamente non è proprio il massimo avere i due host con un errore rosso (non ho verificato se l’HA funzionava correttamente).
Ho fatto qualche prova di ping dagli host e dal vcenter per vedere se tutti gli oggetti risolvevano correttamente i nomi degli altri tramite file hosts ed era tutto corretto. Ho provato a dare un “reconfigure for HA” sui nodi ma l’errore rimaneva, ho provato anche a restartare i servizi sui nodi (services.sh restart dopo aver disabilitato temporaneamente l’ha) ma dopo pochi minuti l’errore è ricomparso.
Alla fine per risolvere, dato che non c’era nessuna misconfigurazione e sapendo che il problema poteva essere proprio il fatto che avevamo usato i file hosts in mancanza di un dns, ho chiesto al cliente di mettere in piedi un DNS che risolvesse quanto meno il nome dei due hosts e del vCenter, rimossi i due host dal vCenter (Disconnect e poi Remove) e poi riagganciati l’errore non si è più presentato.
same issue here with fresh set up 3 hosts vsphere6 landscape
Did you solved by using a dns?
remove the host from the cluster and re add it
If the service agent of an esxi is down, what will be its status in vsphere client?
In this particular case despite the error the service was up and running (this is why it was a strange behaviour); if the service agent goes down you are not able to manage the esxi, you have to restart it in some way (for example from console).
I had the same issue, and was able to resolve it by 1. turn off HA 2. disconnect the host. 3. reconnect the host. 4 turn HA back on for the cluster.
Same problem here – in our case it turned out to be caused by old data in the hosts file on each of the hosts. When we were on a Windows vCenter we had multiple IP’s (1 for inbound RDP sessions / management traffic and 1 on the same vlan as the hosts’ service consoles). When you migrate to a VCSA you can only use a single IP which is the one in DNS.