Seneste forumindlæg
Køb / Salg
 * Uofficiel Black/White liste V3
Login / opret bruger

Forum \ Software \ Operativsystemer
Denne tråd er over 6 måneder gammel

Er du sikker på, at du har noget relevant at tilføje?

ESXi PSOD - Spin Count Exceeded - Ny Hardware

Af Nørd Aspirant Sjoko | 17-08-2020 21:00 | 1559 visninger | 4 svar, hop til seneste
Hej HOL, Hjælp :) I en stribe år har jeg haft en lille ESXi box kørende på en Intel Skull Canyon NUC (NUC6i7KYK, 32GB non-ECC RAM) med 3 aktive VM's. Intet specielt krævende og alt har kørt fint. Men her efter 3 års 24/7 drift gav den op med en død blæser og andre problemer. Derfor har jeg fået opgraderet hardwaren og geninstalleret ESXi på en ny USB stick. SSD's fra den gamle maskine er flyttet med over og datastores importeret. Nu er intet stabilt. Efter 1-2 dages drift med alle VM's aktive får jeg en PSOD med "Spin Count Exceeded - Possible Deadlock". Se screenshots i link. https://imgur.com[...] Hardware: * Barebone: RS100-E10-Pi2 ?- BIOS: Version 3103 (latest) ?- FW: Version 1.13.6 (latest) * CPU: Xeon E-2236 * RAM: 64GB of ECC RAM - Kingston KTH-PL424E/16G * ESXi: 6.7u3 build 16075168 (også testet 7.0 og et par andre 6.7u3 builds) * Datastore: ?- SSD1: INTEL SSDPEKKW51 ?- SSD2: WD - WDS500G3X0C-00SJ * USB: SanDisk UltraFit 32GB - SDCZ430-032G-G463 * VM's: ?- VMware vCenter ??x 2 vCPU's ??x 10GB RAM ?- GrayLog ??x 2vCPU's ??x 4GB RAM ? - Cisco Firepower Management Center (FMC) ?x 4 vCPU's ??x 16GB RAM Dog hvis jeg lører med kun vCenter og Graylog aktiv så er alt umiddelbart stabilt. Også stabilt hvis ingen VM's kører. Jeg er i gang med at teste om den er stabil hvis FMC kører alene, den er nu oppe på 3 dage og 6 timer. Stabil? Jeg har allerede prøvet en MemTest86 v8.4 indtil flere gange uden fejl. Er det andet jeg kan teste eller dele der kan hjælpe med at finde ud af hvad der går galt? Tak :-) Fejl set i iKVM log: "ID: 1 CPU_CATERR sensor of type processor logged a IERR"
--
O.o
#1
Mr. WoLF
Guru
18-08-2020 02:35

Rapporter til Admin
Update firmware på SSD. Prøv med 1x ram
--
#2
MadsFerguson
Nørd Aspirant
18-08-2020 07:48

Rapporter til Admin
Ved IERR fejl er proceduren normalt at teste med kun 1 CPU i systemet, herefter med en anden CPU og til sidst kombinerete med andet RAM.
--
Systems Engineer, High Performance Computing.
#3
Sjoko
Nørd Aspirant
19-08-2020 16:54

Rapporter til Admin
Hejsa, Må prøve en update på FW først. Serveren er lidt dum at komme til og har ikke lige en ekstra CPU/RAM liggende :-) Update: Den crashede også med FMC alene. Det var efter små 4 dage denne gang. Den crashede da jeg lavede lidt småting i VM'en.
--
O.o
#4
Sjoko
Nørd Aspirant
12-09-2020 13:43

Rapporter til Admin
*fingers crossed* Jeg tror jeg har fået den til at køre stabilt nu... Eller den har da haft en oppetid på 3 dage nu med alle VM's kørende, hvilket er det længste jeg har oplevet indtil videre. Det er også selvom jeg har brugt den aktivt og ikke bare ladet den hygge sig i stortset idle. Jeg kan dog ikke 100% sige hvad der (måske) fiksede det da jeg har: 1: Skiftet 2x 512GB SSD's (1 Intel, 1 WD) ud med 2x 1TB Samsung 970 EVO Plus SSD'er med nyeste firmware. 2: Datastoren er kun på 1 SSD nu og ikke spredt ud over 2. Den anden SSD bruges til backups. 3: Taget alt RAM og og sat det i igen i andre slots. 4: Taget CPU ud og sat den i igen med ny ordentlig kølepasta (der var kun den originale thermal pad på før). 5: Skiftet LAN kabler til længere (de andre gjorde det besværtligt at arbejde med mvh
--
O.o

Opret svar til indlægget: ESXi PSOD - Spin Count Exceeded - Ny Hardware

Grundet øget spam aktivitet fra gæstebrugere, er det desværre ikke længere muligt, at oprette svar som gæst.

Hvis du ønsker at deltage i debatten, skal du oprette en brugerprofil.

Opret bruger | Login
NYHEDSBREV
Afstemning