Hej HOL,
Hjælp :)
I en stribe år har jeg haft en lille ESXi box kørende på en Intel Skull Canyon NUC (NUC6i7KYK, 32GB non-ECC RAM) med 3 aktive VM's. Intet specielt krævende og alt har kørt fint. Men her efter 3 års 24/7 drift gav den op med en død blæser og andre problemer.
Derfor har jeg fået opgraderet hardwaren og geninstalleret ESXi på en ny USB stick. SSD's fra den gamle maskine er flyttet med over og datastores importeret.
Nu er intet stabilt. Efter 1-2 dages drift med alle VM's aktive får jeg en PSOD med "Spin Count Exceeded - Possible Deadlock". Se screenshots i link.
https://imgur.com[...]
Hardware:
* Barebone: RS100-E10-Pi2
?- BIOS: Version 3103 (latest)
?- FW: Version 1.13.6 (latest)
* CPU: Xeon E-2236
* RAM: 64GB of ECC RAM - Kingston KTH-PL424E/16G
* ESXi: 6.7u3 build 16075168 (også testet 7.0 og et par andre 6.7u3 builds)
* Datastore:
?- SSD1: INTEL SSDPEKKW51
?- SSD2: WD - WDS500G3X0C-00SJ
* USB: SanDisk UltraFit 32GB - SDCZ430-032G-G463
* VM's:
?- VMware vCenter
??x 2 vCPU's
??x 10GB RAM
?- GrayLog
??x 2vCPU's
??x 4GB RAM
? - Cisco Firepower Management Center (FMC)
?x 4 vCPU's
??x 16GB RAM
Dog hvis jeg lører med kun vCenter og Graylog aktiv så er alt umiddelbart stabilt. Også stabilt hvis ingen VM's kører. Jeg er i gang med at teste om den er stabil hvis FMC kører alene, den er nu oppe på 3 dage og 6 timer. Stabil?
Jeg har allerede prøvet en MemTest86 v8.4 indtil flere gange uden fejl. Er det andet jeg kan teste eller dele der kan hjælpe med at finde ud af hvad der går galt?
Tak :-)
Fejl set i iKVM log: "ID: 1 CPU_CATERR sensor of type processor logged a IERR"
--
O.o