hiveOs stabilité
-
@Chuck-LeLimier Un grand sage @Siberian-Mining avait dit que le câble molex n’était nécessaire qu’au delà de 8 gpu, je l’ai branché par précaution n’étant qu’à 6 gpu sur mon rig. Et donc effectivement si je ne l’avais pas branché ça marcherait quand même
La carte mère a été changé, j’ai acheté celle de @florian2
On m’avait suggéré que le problème est sans doute la chaleur, ça m’a fait sourire dans un premier temps; on est encore en hiver, si le pb vient vraiment de la chaleur, qu’est ce que ça va être dans quelques mois en plein canicule ! lol
Mais avec du recul ça a du sens :-
crash garantie dans la matinée entre 7h et 9h, mon rig étant installé dans la cuisine, et ma cuisine est exposée EST, le soleil tape bien fort le matin, même si j’ai un rideau
-
Sur les centaines de crash qu’il y a eu ces dizaines de jours, aucun n’a été constaté dans la nuit, où il fait bien plus frais
-
-
@16HEURES30
Hello, je viens de voir que le sujet avait avancéJe pense qu’il faudrait reprendre de zéro pour trouver la faille dans ton problème.
Voir si ton alim est bien entre 50 et 80% de conso max.
Que tu as bien relié maximum 2 GPU-riser par cable.
Que chaque GPU est correctement alimenté et non sous alimenté.Concernant la chaleur, tu n’as pas des indicateurs sur ton OS pour dire si ca surchauffe a un moment donnée ?
Pour le /var/log/miner/t-rex/t-rex.log il faut que tu fasses un" ls -lrth /var/log/miner/t-rex/t-rex.log "pour voir si tu as bien le droit de lire le fichier.
Meme si ca m’etonne que le root ne puisse pas, mais j’ai déjà vu des fichiers illisible par root donc envoie un screenshot de la commande que je t’ai envoyé.
-
@florian2 a dit dans hiveOs stabilité :
ls -lrth /var/log/miner/t-rex/t-rex.log
Hello @florian2 Ça avance à reculons :smiling_face_with_open_mouth_cold_sweat:
- Je suis autour de 950w avec mes 6 gpu dont 4x 3070 et 2x 3080 pour une alim à 1600w, donc ça va
- Oui 2 gpu par câble sata
Je suis passé sur ethminer entre temps, histoire de voir si le pb n’est pas lié au mineur. Donc j’ai tapé la commande ls -lrth /var/log/miner/ethminer/ethminer.log, ca me donne ça :
-
@16HEURES30 C’est bien que tu galères, parce que ça me rappelle toujours les mineurs qui arrivent comme des fleurs en disant : “j’aimerai miner parce que génial la techno etc.” alors qu’en fait ils veulent que de la thune et se rende compte que c’est trop chiant de miner sur une machine si on y connait rien.
Mais je ne dis pas que tu es comme ça hein, simplement ca fait une piqure de rappel pour ceux qui pensent que c’est si simple à faire marcher du premier coup.
Moi même en informatique depuis des années, j’ai eu des bonnes galères au démarrage pendant genre 2 semaines environ et ensuite encore d’autres galeres de maintenance.OK donc là tu peux ouvrir le fichier en faisant un ‘less /var/log/miner/blabla.log’
et voir ce qu’il y a a l’intérieur déjà. normalement tu as les droits de lecture donc ca devrait être OKEt maintenant faut attendre que ca bug.
tes CG sont bien en train de miner ? -
@florian2 De tout de façon, à vaincre sans péril, on triomphe sans gloire hein
Oui les cg minent pour le moment, mais tkt, ca crashera bientôt, au plus tard dans l’après midi
Mais alors, le log n’enregistre pas les précédents crash ?
Page du log :
https://www.casimages.com/i/210312120727602918.jpg.html -
bah là vue que t’es sur ethminer, il a sa propre log.
Tu enverras quand tu auras l’erreur. -
@florian2 Je faisais référence au précédent crash que j’ai eu sur ethminer, j’étais passé chez ce mineur depuis hier, et entre temps y a eu 4 crash
-
@florian2 un premier gpu vient de me lâcher y a environ 20min, pour le moment je vois aucun changement par rapport au log de ce matin, bon après je suis pas informaticien :
https://www.casimages.com/i/210312050626732895.jpg.html
Edit : le temps que j’écrive ce message, il ne me reste plus que 3gpu sur 6 d’actifs
-
Curieusement il reste un gpu d’actf, habituellement après le crash d’un gpu, les autres tombent tous un à un et les 6 gpu finissent par sauter dans peu de temps (voir photo) et le fichier log ne semble pas avoir bougé d’un pouce (voir le lien)
https://www.casimages.com/i/210313123828943404.jpg.html -
@16HEURES30 a dit dans hiveOs stabilité :
u d’actf, habituellement après le crash d’un gpu, les autres tombent tous un à un et les 6 gpu finissent par sauter dans peu de temps (voir photo) et le fichier log ne
Highlanders, il ne doit en rester qu’un ^^
-
@El-Bibi-10 Il ne veut même plus miner l’highlander ^^’
Et le log, je me demande à quoi il sert -
@16HEURES30 Il sert a faire beaucoup parler pour pas grand chose on dirait^^
-
@Chuck-LeLimier Oui voilà, on connait tous ce mec qui fait sembler de taffer pour se faire bien voir alors qu’il fout rien … bon c’est pas pire que ceux qui foutent clairement rien au clair du jour ^^
-
@16HEURES30 quand tu as changé la CM de ton rig, tu as réinstallé hive OS ou pas? ou changé la clef usb/ssd ?
-
@Alxa Non j’ai juste branché la ssd de la h110, c’est pas nécessaire de tout réinstallé je pense, si ?
@florian2 Sinon j’ai reboot comme plus rien ne minait sur le rig, et voici le log après reboot :
Je suis pas informaticien, mais je peux dire avec certitude que le log n’a rien servi dans mon cas :smiling_face_with_open_mouth_cold_sweat: -
@16HEURES30
Les logs en général c’est simple à lire : quand y’a un problème, c’est écrit “erreur” ou quelque chose du genre.
Là, ta log est plutôt légère et elle semble juste mentionner le démarrage mais rien de spécial après. Donc si y’a un probleme, cela veut dire que le probleme ne vient pas d’un défaut entre appareils, c’est donc un bug venant d’un appareil individuelle parmi l’ensemble et qui repete ça régulierement -
- Alim enermax 1700w remplacé par un corsair 1600w
- Carte mère H110 remplacé par ta h81 ( donc ventirad, cpu et ram changés par la même occasion comme tu m’as fournis le tout avec ta Cm )
- Tous les risers ont été remplacés
- 3 gpu sur 6 ont été remplacés
- pool et mineur changés
Je sais pas ce que je peux faire de plus ^^’
-
@16HEURES30
Et tu as toujours les mêmes problemes ?
Si tout ce que tu possèdes maintenant est entièrement différent de ta situation initiale, il reste un cas qu’on oublie souvent : ton courant électrique chez toi …C’est le seul qui reste et peut également causer un problème au cas où tu as pas un contrat EDF (ou autres) adapté à tes besoins
OU
ton contrat détecte des pics trop important durant trop longtemps donc il y a une sécurité fournit automatiquement par ton fournisseur qui se déclenche tous les X heures de pics inhabituels
OU
un problème de surtension car consommé 1000w c’est pas beaucoup mais parfois sur une longue durée, certaines prises mal calibrés ne tiennent pas. ( en raison de l’épaisseur du câble utilisé qui relie ton tableau electrique à la prise que tu utilises.
OU
la multiprise (si tu es sur une multiprise)Bref, y’a encore beaucoup de cas probleme mais il est tout a fait possible que le probleme est électrique.
-
Bien vu florian2!
Si tu habite une caravane dans un camping au bout de la ligne aussi… Et si tu fournis l’électricité en pédalant sur un vélo^^
Il y a aussi l’histoire du fantôme dans les câbles…Dans la cuisine? Près du micro-onde?
-
@florian2 Oui grosso modo les mêmes problèmes que le 1er jour, on peut dire que la situation s’est même empirée puisque je pouvais tenir bien plus longtemps les premiers jours qu’en ce moment
Courant électrique : l’ensemble du rig tourne autour de 1000w, c’est pas énorme. L’alim est branchée sur une multiprise neuve de chez leroy merlin qui peut supporter 3500w environ. Après je peux changer de multiprise pour voir si le pb vient de là, c’est facilement faisable. Par contre si c’est lié à mon contrat d’EDF …
@Chuck-LeLimier La transition POS se fera sans doute avant que je ne trouve la cause à mon pb ^^