Bonsoir Jano,
Me suis apercu que finalement acpi=ht et acpi_irq_balance ne suffisent pas, faut rajouter apm=off... et là mon systeme est "stable" (à peu pres...)
Niveau "repartition" acpi=ht c'est sur ca parait mieux que de désactiver carrément l'acpi...
CPU0 CPU1 CPU2 CPU3
0: 51 7 8 8 IO-APIC-edge timer
1: 4015 4163 4116 4136 IO-APIC-edge i8042
2: 0 0 0 0 XT-PIC-XT cascade
4: 1 1 0 0 IO-APIC-edge
8: 0 0 1 0 IO-APIC-edge rtc0
12: 1 1 1 1 IO-APIC-edge i8042
16: 0 0 0 0 IO-APIC-fasteoi ahci, pata_jmicron, uhci_hcd:usb3
17: 5 5 6 6 IO-APIC-fasteoi HDA Intel
18: 31316 31347 31419 31453 IO-APIC-fasteoi ehci_hcd:usb1, uhci_hcd:usb5, uhci_hcd:usb8
19: 31153 31009 31032 31045 IO-APIC-fasteoi ata_piix, ata_piix, uhci_hcd:usb7, ohci1394
21: 0 0 0 0 IO-APIC-fasteoi uhci_hcd:usb4
22: 517 512 524 503 IO-APIC-fasteoi HDA Intel
23: 18790 18837 18776 18772 IO-APIC-fasteoi ehci_hcd:usb2, uhci_hcd:usb6
2298: 146727 146659 146624 146551 PCI-MSI-edge fglrx[0]@PCI:1:0:0
2299: 5261 5257 5291 5322 PCI-MSI-edge eth0
NMI: 0 0 0 0 Non-maskable interrupts
LOC: 364955 223726 414307 469040 Local timer interrupts
RES: 3952 3617 3858 4017 Rescheduling interrupts
CAL: 75 86 88 78 Function call interrupts
TLB: 3711 4929 2820 3775 TLB shootdowns
SPU: 0 0 0 0 Spurious interrupts
ERR: 0
MIS: 0
Ton lien sur l'acpi ReschedulingInterrupts est interessant parce que ca "sent" mon probleme... vmstat 1 aussi je connaissais pas!
En revanche pour avoir un peu "tracé" avec un top... j'avais rien vu de tres pertinent... le seul processus qui etait à CHAQUE freeze: xorg... pas tres parlant comme truc...
Dommage que le truc sur le DSDT soit si compliqué...
MAis c'est vraiment bizarre que le flash plein ecran soit si "casse gueule"... ils parlent du flash sur le lien aussi...
Oui effectivement j'ai vu sur certains forum, pour des problemes similaires de freezes sous ASUS p5q3, ils conseillent de soit modifier le voltage soit de modifer la freqence de RAM... j'ai pas testé encore...
Mais là j'ai un peu peur, question idiote: ca risque pas de transformer mon ordi en grille pain ??? 😃
PArce que si ca me plante tout... en plus ca rentrera pas dans la garantie non plus... ca fait cher le grille pain! 🙂
sudo dmidecode -s bios-version
0806
Apres verif, il s'agit bien de la derniere MAJ possible...
Là pour les logs ce sont des "vieux" logs... la periode où j'ia commencé sous Koala... le Koala etait ingerable! à l'epoque je connaissais pas APCI APIC APM IRQ etc... donc j'ai jamais testé tout ca sous Koala; alors je soupconnais la carte ATI toute seule... et j'avais des freezes à repetition dès le demarrage meme...
Là j'ia "débloquer" les logs (j'avais oublié que je pouvais le faire sous Jaunty) et j'ia activé l'option apic=debug... résultat: un flot de charabia sur les IRQ et l'APIC! mais franchement j'y comprends rien...
j'ia vu par exemple:
pci 0000:00:1d.7: EHCI: BIOS handoff failed (BIOS bug?) 01010001
ca semble etre en rapport avec l'option USB legacy...
ou encore:
hda codec unknown model for ALC 883 trying autoprobe from bios
qui semble etre un probleme de reconnaissance de model pour les cartes ASUS (note j'ai jamais eu de probleme directement de son... enfin au moins un domaine où j'ai pas de probleme !!!!! aaahhh... :lol: )... mais je doute que ca soit vraiment probant pour mon probleme de freeze...
Enfin je tenterai de regler ces codes erreurs on sait jamais... vais aussi continuer à tracer les logs...
Ou dans le genre avec work around j'ia aussi du:
AMI BIOS detected: BIOS may corrupt low RAM, working it around.
Là j'ai trouvé ca sur ce message:
Non, le BIOS va très bien, il s'agit juste d'une précaution: lors du boot,le BIOS peut se charger dans la partie inferieure de la RAM (de mémoire, les 16 premiers Mo), et les modifier pendant que l'ordinateur fonctionne. Le noyau linux prend donc ses "précautions" ("working around it") pour eviter d'allouer de la mémoire dans cette zone (le BIOS peut modifier/corrompre cette memoire sans prevenir personne lol ). Tout à fait normal et sans danger.
Par contre comme avec les options au noyau mon systeme est plus stable il se peut que je n'ia pas d'erreur dans mes logs non plus, non ?
Là sur 2 cat /proc/interrupts pris à 20 secondes d'intervalles je vois pas grand chose de tres concluant:
CPU0 CPU1 CPU2 CPU3
0: 43 4 8 3 IO-APIC-edge timer
1: 2998 2975 3029 2932 IO-APIC-edge i8042
2: 0 0 0 0 XT-PIC-XT cascade
4: 0 0 1 1 IO-APIC-edge
8: 1 0 0 0 IO-APIC-edge rtc0
12: 1 1 1 1 IO-APIC-edge i8042
16: 0 0 0 0 IO-APIC-fasteoi ahci, pata_jmicron, uhci_hcd:usb3
17: 6 6 6 6 IO-APIC-fasteoi HDA Intel
18: 24835 25015 24832 24806 IO-APIC-fasteoi ehci_hcd:usb1, uhci_hcd:usb5, uhci_hcd:usb8
19: 19565 19543 19575 19620 IO-APIC-fasteoi ata_piix, ata_piix, uhci_hcd:usb7, ohci1394
21: 0 0 0 0 IO-APIC-fasteoi uhci_hcd:usb4
22: 32863 32997 33138 33048 IO-APIC-fasteoi HDA Intel
23: 16197 15998 16107 16241 IO-APIC-fasteoi ehci_hcd:usb2, uhci_hcd:usb6
2298: 76843 76718 76581 76561 PCI-MSI-edge fglrx[0]@PCI:1:0:0
2299: 8252 8307 8284 8345 PCI-MSI-edge eth0
NMI: 0 0 0 0 Non-maskable interrupts
LOC: 367596 212847 231512 170598 Local timer interrupts
RES: 5080 4211 4061 4042 Rescheduling interrupts
CAL: 90 87 85 65 Function call interrupts
TLB: 3079 3721 2945 3436 TLB shootdowns
SPU: 0 0 0 0 Spurious interrupts
ERR: 0
MIS: 0
CPU0 CPU1 CPU2 CPU3
0: 43 4 8 3 IO-APIC-edge timer
1: 2999 2978 3035 2934 IO-APIC-edge i8042
2: 0 0 0 0 XT-PIC-XT cascade
4: 0 0 1 1 IO-APIC-edge
8: 1 0 0 0 IO-APIC-edge rtc0
12: 1 1 1 1 IO-APIC-edge i8042
16: 0 0 0 0 IO-APIC-fasteoi ahci, pata_jmicron, uhci_hcd:usb3
17: 6 6 6 6 IO-APIC-fasteoi HDA Intel
18: 24938 25117 24939 24914 IO-APIC-fasteoi ehci_hcd:usb1, uhci_hcd:usb5, uhci_hcd:usb8
19: 19620 19600 19626 19667 IO-APIC-fasteoi ata_piix, ata_piix, uhci_hcd:usb7, ohci1394
21: 0 0 0 0 IO-APIC-fasteoi uhci_hcd:usb4
22: 32863 32997 33138 33048 IO-APIC-fasteoi HDA Intel
23: 16213 16016 16123 16257 IO-APIC-fasteoi ehci_hcd:usb2, uhci_hcd:usb6
2298: 77139 77009 76873 76859 PCI-MSI-edge fglrx[0]@PCI:1:0:0
2299: 8255 8310 8286 8347 PCI-MSI-edge eth0
NMI: 0 0 0 0 Non-maskable interrupts
LOC: 370655 213057 231685 170891 Local timer interrupts
RES: 5091 4212 4063 4046 Rescheduling interrupts
CAL: 90 87 85 65 Function call interrupts
TLB: 3079 3722 2945 3441 TLB shootdowns
SPU: 0 0 0 0 Spurious interrupts
ERR: 0
MIS: 0
Pour le launcpad, effectivement ca ressemble, j'avais vu ce message à l'epoque concernant le code erreur *ERROR* interrupt source ff000066... j'avais meme testé la soluce des derniers messages:
I've just discovered something interesting, after some time experimenting in Karmic -- somehow, I managed to catch a line about "failed to connect to acpid" just before the crash.
Apparently, the acpi-services part of the fglrx driver explicitly depends on having acpid up and running by the time Xorg starts, or else it fails rather inelegantly, as this bug report discusses.
I've managed to fix the problem on my system, by adding an explicit upstart dependency of 'acpid' for gdm.
I've edited /etc/init/gdm.conf as follows:
start on (filesystem
and started hal
and started acpid <=== Add this line.
and tty-device-added KERNEL=tty7
and (graphics-device-added or stopped udevtrigger))
stop on runlevel [016]
Sans succés...
Mais sur ma machine j'ai des freezes meme sans pilote proprio! deja le simple radeon => freeze pareil... meme dans les premieres secondes de démarrage parfois!
(d'ailleurs j'ai aussi viré le quiet splash voir un peu si j'ai un probleme de demarrage)
Donc ca semble plus acréditer la these des IRQ qui digerent pas de l'apic ou un truc du genre...
Pour le truc realtek alc1200 j'ai lu sur le manuel:
Audio 8 channel high definition audio codec etc...
Donc ca serait un autre truc audio... peut etre ca fait exactement comme toi ca entre en conflit avec justement hda intel comme tu disais ?
A l'occaz quand j'aurais un peu de temps je testerai de changer de port la carte graphique... voir aussi si dans les options du bios je peux désactiver des périphériques les uns apres les autres ou désactiver hda intel... ou je vais aussi mieux lire le manuel des fois que j'ai raté un paragraphe sur les IRQ (ca m'etonnerait mais bon...)
Enfin surtout je croise les doigts qu'une bonne nouvelle vienne des futurs noyaux (là je suis en 2.6.28-17-generic), va falloir attendre pour le 33... snif... 🙂
Là en fglrx je suis en "OpenGL version string: 2.1.8575", j'ai installé par systeme>pilote donc c'est pas vraiment "à jour", mais ca me parait pas capital... je viens de regarder à tout hasard si dans les releases notes du dernier pilote 9.12 ils parlent de ce genre de problemes qui seraient reglés mais non...
En tous cas merci encore d'avoir pris le temps d'etudier mon probleme et de m'avoir répondu! 🙂