Bitcoin Forum
April 26, 2024, 02:01:51 PM *
News: Latest Bitcoin Core release: 27.0 [Torrent]
 
   Home   Help Search Login Register More  
Pages: [1]
  Print  
Author Topic: PCIe Bus Error: Severity=Correcter, type=Physical layer  (Read 409 times)
adrian1357 (OP)
Newbie
*
Offline Offline

Activity: 12
Merit: 0


View Profile
August 29, 2017, 04:09:45 AM
Last edit: August 30, 2017, 01:51:19 AM by adrian1357
 #1

Buenas, sucede que tengo unas 6 rx580 (4x4gb y 2x8gb, ambas hynix) me funcionaban bien a 30,1 y 30,5 mh.
Probando los drivers nuevos de amd alcanzo a 31.1 y 31.9mh. Pero al cabo de unos dias se empieza a congelar el minero, revisando el after me aparece que entre los 1 y 15 minutos de minado ocurre un error con 4 gpus (2x4gb y 2x8gb) que se detienen y en el after muestran numeros absurdos:

https://drive.google.com/file/d/0B6bc1YA7Ia7zTXF4M2lmRUs5Uy04OEp3VlRib29uYXhBQ2Rr/view?usp=sharing

Luego decidi probar Simplemining, y ahi volvio a pasar, pero esta ves me decia la consola el error del titulo:
"PCIe Bus Error: Severity=Correcter, type=Physical layer..."
No se que significa, puede ser que el bios mod fallara pero no estoy seguro, no tienen oc y el mod solamente tiene cambiado el mem strap a 1500 (la de 8gb si tiene bios mod de otro pero comprobe con el bios editor que solamente cambia en el mem strap). Ademas, esto no pasaba antes de empezar a usar el nuevo driver amd.

Pero tengo que agregar que mi MOBO es una asus b250f strix, no me reconoce las 6 gpus a la vez conectadas, dificilmente logre que funcionara con 5, y en el smos si pongo una gpu en la pciex16 principal, falla el claymore si conecto a las 2 ultimas pciex1(se cuelga al poner el oc a gpu0), una pesima mobo para mi.
El punto de esto es que despues de instalar el driver de amd, funciono bien las 6 placas y duro una semana, despues inicio estos errores. Poco a poco fallaban las configuraciones de OC y al final pasa esto.

Por favor si alguien puede darme una ayuda, no quiero pensar que estropee las gpu que ni siquiera tienen 2 meses de uso


Actualizo: parece ser que tiene algo que ver con los risers, de los 2 que no tenian error, probe esos risers con las 6 gpus, no hay problema, asi que me quedo mas tranquilo que creo que puedo descartar las gpus como problema.
Ahora entre los risers y la mobo, probe 2 gpus con 2 risers "supuestamente" malos con el smos y me salta el error mas especifico en la consola, dejo imagen:

https://drive.google.com/file/d/0B6bc1YA7Ia7zYXVVNDk3dkNrNG8/view?usp=sharing

Eso pasa juntas, pero ahora estoy probando solo 1 a la ves y no pasa nada, los risers "dañados" individualmente funcionan bien, pero cuando se usan en paralelo le pasa el error que menciono, alguna idea de que pasa?
There are several different types of Bitcoin clients. The most secure are full nodes like Bitcoin Core, but full nodes are more resource-heavy, and they must do a lengthy initial syncing process. As a result, lightweight clients with somewhat less security are commonly used.
Advertised sites are not endorsed by the Bitcoin Forum. They may be unsafe, untrustworthy, or illegal in your jurisdiction.
1714140111
Hero Member
*
Offline Offline

Posts: 1714140111

View Profile Personal Message (Offline)

Ignore
1714140111
Reply with quote  #2

1714140111
Report to moderator
1714140111
Hero Member
*
Offline Offline

Posts: 1714140111

View Profile Personal Message (Offline)

Ignore
1714140111
Reply with quote  #2

1714140111
Report to moderator
solosequenosenada
Hero Member
*****
Offline Offline

Activity: 952
Merit: 542


Freedom dies from suicide


View Profile
August 29, 2017, 01:34:22 PM
 #2

Hola compi, puedes estar tranquilo que las GPU no se van a romper. Nunca he tenido esos problemas pero parece ser algun problema con el cambio de estado a bajo consumo de los puertos pci-e, te dejo la configuracion comun de la bios para placas Intel sacado de la ayuda de ethosdistro.com/kb/

Provisioning Intel boards

If you have an Intel board and have network connectivity issues or are unable to successfully boot with multiple GPUs, follow the below guide:

    If you have many GPUs, make sure that no GPU is plugged in directly to any 16x slot. Risers must be used for all GPUs.
    Unplug all GPUs except for gpu0 (ignore all 1x slots, gpu0 is always the 16x PCI-E slot physically closest to your motherboard's CPU socket).
    If your motherboard has molex or PCI-E onboard power jacks, make sure to plug the correct cable into them.
    Follow the guide for Using a keyboard and monitor on ethOS.
    Upon boot, go into the motherboard bios and set the following options (set as many of these options as you can find):
        set VTd INTEL VIRTUALIZATION to DISABLE.
        set ONBOARD AUDIO/SOUND (AZALIA) to DISABLE.
        set IEEE1394 to DISABLE.
        set PCI-E SUBSYSTEM/LANES to x8/x4/x4
        set ONBOARD GRAPHICS to DISABLE.
        set PCI-E GENERATION to GEN2.
    Save changes and reboot.


Espero que te ayude, un saludo.
adrian1357 (OP)
Newbie
*
Offline Offline

Activity: 12
Merit: 0


View Profile
August 30, 2017, 01:52:45 AM
 #3

Hola compi, puedes estar tranquilo que las GPU no se van a romper. Nunca he tenido esos problemas pero parece ser algun problema con el cambio de estado a bajo consumo de los puertos pci-e, te dejo la configuracion comun de la bios para placas Intel sacado de la ayuda de ethosdistro.com/kb/

Provisioning Intel boards

If you have an Intel board and have network connectivity issues or are unable to successfully boot with multiple GPUs, follow the below guide:

    If you have many GPUs, make sure that no GPU is plugged in directly to any 16x slot. Risers must be used for all GPUs.
    Unplug all GPUs except for gpu0 (ignore all 1x slots, gpu0 is always the 16x PCI-E slot physically closest to your motherboard's CPU socket).
    If your motherboard has molex or PCI-E onboard power jacks, make sure to plug the correct cable into them.
    Follow the guide for Using a keyboard and monitor on ethOS.
    Upon boot, go into the motherboard bios and set the following options (set as many of these options as you can find):
        set VTd INTEL VIRTUALIZATION to DISABLE.
        set ONBOARD AUDIO/SOUND (AZALIA) to DISABLE.
        set IEEE1394 to DISABLE.
        set PCI-E SUBSYSTEM/LANES to x8/x4/x4
        set ONBOARD GRAPHICS to DISABLE.
        set PCI-E GENERATION to GEN2.
    Save changes and reboot.


Espero que te ayude, un saludo.

Actualice el post, fijate y si tenes alguna idea de como salvar los risers agradeceria el aporte.
solosequenosenada
Hero Member
*****
Offline Offline

Activity: 952
Merit: 542


Freedom dies from suicide


View Profile
August 30, 2017, 08:38:59 AM
 #4

Hola, hiciste los cambios en la bios? Prueba a ver si encuentras estos valores en tu bios y cambialos como dice aqui:

  Upon boot, go into the motherboard bios and set the following options (set as many of these options as you can find):
        set VTd INTEL VIRTUALIZATION to DISABLE.
        set ONBOARD AUDIO/SOUND (AZALIA) to DISABLE.
        set IEEE1394 to DISABLE.
        set PCI-E SUBSYSTEM/LANES to x8/x4/x4
        set ONBOARD GRAPHICS to DISABLE.
        set PCI-E GENERATION to GEN2.
    Save changes and reboot.
mgpucela
Newbie
*
Offline Offline

Activity: 1
Merit: 0


View Profile
December 26, 2017, 08:13:00 PM
 #5

Buenas, sucede que tengo unas 6 rx580 (4x4gb y 2x8gb, ambas hynix) me funcionaban bien a 30,1 y 30,5 mh.
Probando los drivers nuevos de amd alcanzo a 31.1 y 31.9mh. Pero al cabo de unos dias se empieza a congelar el minero, revisando el after me aparece que entre los 1 y 15 minutos de minado ocurre un error con 4 gpus (2x4gb y 2x8gb) que se detienen y en el after muestran numeros absurdos:

https://drive.google.com/file/d/0B6bc1YA7Ia7zTXF4M2lmRUs5Uy04OEp3VlRib29uYXhBQ2Rr/view?usp=sharing

Luego decidi probar Simplemining, y ahi volvio a pasar, pero esta ves me decia la consola el error del titulo:
"PCIe Bus Error: Severity=Correcter, type=Physical layer..."
No se que significa, puede ser que el bios mod fallara pero no estoy seguro, no tienen oc y el mod solamente tiene cambiado el mem strap a 1500 (la de 8gb si tiene bios mod de otro pero comprobe con el bios editor que solamente cambia en el mem strap). Ademas, esto no pasaba antes de empezar a usar el nuevo driver amd.

Pero tengo que agregar que mi MOBO es una asus b250f strix, no me reconoce las 6 gpus a la vez conectadas, dificilmente logre que funcionara con 5, y en el smos si pongo una gpu en la pciex16 principal, falla el claymore si conecto a las 2 ultimas pciex1(se cuelga al poner el oc a gpu0), una pesima mobo para mi.
El punto de esto es que despues de instalar el driver de amd, funciono bien las 6 placas y duro una semana, despues inicio estos errores. Poco a poco fallaban las configuraciones de OC y al final pasa esto.

Por favor si alguien puede darme una ayuda, no quiero pensar que estropee las gpu que ni siquiera tienen 2 meses de uso


Actualizo: parece ser que tiene algo que ver con los risers, de los 2 que no tenian error, probe esos risers con las 6 gpus, no hay problema, asi que me quedo mas tranquilo que creo que puedo descartar las gpus como problema.
Ahora entre los risers y la mobo, probe 2 gpus con 2 risers "supuestamente" malos con el smos y me salta el error mas especifico en la consola, dejo imagen:

https://drive.google.com/file/d/0B6bc1YA7Ia7zYXVVNDk3dkNrNG8/view?usp=sharing

Eso pasa juntas, pero ahora estoy probando solo 1 a la ves y no pasa nada, los risers "dañados" individualmente funcionan bien, pero cuando se usan en paralelo le pasa el error que menciono, alguna idea de que pasa?

Buenas... Conseguiste arreglar el problema? como lo hiciste?
gaato77
Newbie
*
Offline Offline

Activity: 37
Merit: 0


View Profile
January 23, 2018, 01:19:19 PM
 #6

hola. tengo el mismo problema.
misma mother

ASUS B250F STRIXX

El error sale con todas las placas conectadas, con una sola placa conectada, con 2, con diferentes risers...
en fin. sale siempre.

que puede ser?
Pages: [1]
  Print  
 
Jump to:  

Powered by MySQL Powered by PHP Powered by SMF 1.1.19 | SMF © 2006-2009, Simple Machines Valid XHTML 1.0! Valid CSS!