Problème GPU qui s'arrète

  • -

    Bonjours à tous,

    Voila mon soucis qui occupe beaucoup trop mon esprit (et pourris occasionnellement mes nuits).

    Je lance Phoenixminer et, dans un temps aléatoire, j’ai un GPU qui s’arrête sans erreur. Au bout d’un certain temps Phoenixminer s’arrête en constatant que le GPU est stop.

    Le constat
    Ce n’est pas un GPU en particulier.
    Le problème surviens entre 1 minutes et 1h20.
    Soit le GPU passe d’un coup à un hash de 0, soit juste avant de passer à 0 il passe à une valeur complètement aberrante. Normalement à environ 50Mh/s je l’ai vu passer à plusieurs Gh/s oO
    Quand Phoenixminer s’arrête il ne m’est pas possible de le fermer sans redémarrer l’ordinateur.
    Quand le GPU a crash il continue de rester chaud avec les ventilateurs qui tournent.

    Mes pauvres tentatives de secours
    J’ai fait tourner les risers
    Changer les ports de l’alimentation
    J’ai fait tourner les câbles d’alimentation entre les cartes
    J’ai donné plus d’espace entre les cartes. Elles sont à 20 cm les unes des autres.
    J’ai supprimé les pilotes avec DDU + réinstallation. 2 fois.
    J’ai essayé de rechercher des infos sur un problème similaire comme je le pouvais (FR comme EN)

    Ma config
    Carte mère : B250 Mining Expert
    Processeur : Intel Celeron G3900
    Mémoire : Corsair DDR4 2133Mhz
    SSD : Crucial CBX500 - 120Go
    Alimentation : Seasonic 850W
    GPU 1, 2, 3 : AsRock RX 5700 XT
    Environnement : Windows 10 64 bits
    Pilote GPU : Win10 64bits Crimson ReLive Beta Blockchain
    Mineur : PhoenixMiner5.5c
    Crypto miné : ETH

    J’espère avoir été clair dans les explications.
    Si une âme charitable peux m’aider je serais au paradis des cryptos. Tout du moins à son entrée porte mining!

    Capapalo

    Chuck LeLimier 1 Reply
  • -

    Bonjour,
    Tu peux aussi tester Les Os spécialisé, plus adapté que Win 10 pour miner
    Si tu as un fichier log , regarder quand ca plante si tu as pas 2/3 indices sinon, testé avec un CG en moins et laissé tourner pour voir également.

    C 1 Reply
  • -

    @Capapalo J’ai le même problème sur un de mes rigs… C’est carrément 4 cartes sur 8 qui passent a zero… Je suis aussi sur win 10 mais phoenix 15.6. Avec des 5700 xt aussi. je stoppe le mineur et le relance et tout repart… Parfois une carte bug et tout se relance automatiquement mais avec les paramètres d’origine sur la carte qui a buggé (196wh au lieu de 100) .
    Je n’avais jamais eu ce genre de problème avec les versions plus anciennes de phoenix. Peut-être devrait-on repasser sur une version plus ancienne pour tester ça… De toute façon, le minage sur windows n’est pas stable. N’as-tu pas forcé un peu trop sur l’overclock?
    Les autres rigs tournent aussi en 15.6 sans problème… Peut-être que ça vient d’un riser défectueux. A nous de trouver lequel. Parce que ça peut tourner longtemps avant de merdouiller, même avec un riser foireux…

  • -

    @Raniva
    Merci de ton retour
    Depuis hier je commencais à regarder les Os de minage. Et sans voir ta signature je regardais HiveOS justement
    J’ai essayé en retirant des cartes et changer les cartes qui tournent. Nada ca replante

    @Chuck-Nolife
    Merci aussi de ton retour
    Pas eu le temps de jouer à overclocker ou modifier une valeur. L’alimentation n’est pas baissé.
    L’objectif était déjà de le faire tourner sans crash…

    Chuck LeLimier 1 Reply
  • -

    @Capapalo De rien 😉 Mais tu va abîmer tes cartes si tu ne fais pas ça!! Et ton alim aussi… Tout en fait… Je te conseille d’étudier ce sujet au plus vite!
    Tu trouvera les paramètres conseillés pour tes cartes graphiques ici :
    https://whattomine.com/
    Ca te permettra de diviser ta consommation électrique par deux. Et de gagner au moins 30° sur tes cartes.
    Tu peux utiliser adrenalin pour régler tout ça, je te conseille d’enregistrer les paramètres dans un fichier pour appliquer tout ça plus rapidement a chaque fois que nécessaire.

    C 1 Reply
  • -

    @Chuck-Nolife
    ok bon ba action Os minage et direct après gestion du paramètre alim.

    Effectivement la conso affiché sur Phoenixminer est 190W
    What to Mine indique 90W tu tournes à 100W de ton côté?

    Chuck LeLimier 1 Reply
  • -

    @Capapalo Oui, certaines a 96w même. Mais toutes les cartes graphiques même identiques ne se valent pas.

    ac80937e-5188-4f49-a471-c9f2433725df-image.png

  • -

    @Chuck-Nolife
    Pour être sûr, je désinstalle le pilote AMD en place pour mettre le pilote AMD adrenalin?

    Chuck LeLimier 1 Reply
  • -

    @Capapalo C’est celui que j’utilise donc a priori ça ne va rien changer… je pencherais plutôt sur un riser cassé… Pour en être certain, il faut tout débrancher et n’en garder qu’un avec sa cg. Si ca tourne 24h comme ça, le retirer et passer au suivant…Et ainsi de suite jusqu’a trouver ce qui ne va pas. C’est possible aussi que ça vienne d’un port pcie de la carte mère. Ou d’un simple bug logiciel puisque arrêter et relancer le mineur règle le problème pour un temps chez moi… Souvent, il me semble que c’est lors d’un rechargement du fichier dag que le problème se produit.

  • -

    Je vais tester tout ca
    On verra bien si ca tiens enfin la route…

    Merci pour les conseils. Je fais un retour si ca fonctionne

    Chuck LeLimier 1 Reply
  • -

    @Capapalo Je t’en prie 😉 Bon courage a toi!

  • -

    Pour la dernière news du jour :

    Je suis passé sous le pilote adrenalin version recommandé
    J’ai baissé la consommation les cartes tournent autour de 117W maintenant.
    J’ai baissé unité par unité et c’est à cette valeur que j’ai le max de hashrate

    Déjà le gain de bruit de fou! et donc de température!

    Maintenant on croise les doigts…

  • -

    Bonjour,

    Petit retour du jour.
    Ca a planté au bout de 45 minutes… mauvaise surprise au réveil.
    Quand une carte plante, le mineur s’arrète, les 2 autres cartes s’arrètent aussi mais la carte qui plante continue d’avoir son processeur qui tourne à fond et consomme des Watts.

    Bref
    Aujourd’hui je suis passé sous HiveOS => quand même plus agréable à manager!
    Pour le moment ca tourne.
    Mais autre soucis de température mémoire…
    Je vais ouvrir un autre topic car c’est un problème qui n’est plus le même que le premier.

    Merci pour vos retours

    Chuck LeLimier 1 Reply
  • -

    @Capapalo Si ça n’a rien changé, c’est probablement le riser et ses connections vers la carte mère a changer…

    C 1 Reply
  • -

    @Chuck-Nolife
    J’ai changé les risers, viré le SSD, créé une clé USB avec HiveOS.
    Ca fait 6h que ca tourne sans crash avec les 3 GPUs
    Chaque carte à un hash d’un poil plus de 50Mh/s
    La conso est entre 110 et 120W, chaque carte à une valeur différente.

    J’ai fait plein de réglages différents mais j’ai toujours des températures de mémoire élevé = 90°C. Les ventilos qui tournent autour de 65%
    J’ai pas de solution pour le moment.
    Tu as une 5700 XT? ta température mémoire est à combien?

    Chuck LeLimier 1 Reply
  • -

    @Capapalo Oui c’est ça. Ca donne ça chez moi en minage :

    5157c1e5-7eeb-48d9-9a60-5df68c99c2ae-image.png

    Si température de jonction est bien la température de la mémoire biensur… je viens de vérifier et non, c’est en fait la t° atteinte au centre du gpu…je vais aller voir ou on peut trouver cette fameuse t° mémoire, peut-être avec afterburner…

    Mi que ze suis bête^^ Avec gpu-z!

    https://www.techpowerup.com/download/techpowerup-gpu-z/

  • -

    Voilà en minage :

    43ea90d7-50c9-46c2-819a-575c55d307bb-image.png

Log in to reply
 

A voir également