bonjour,
ce n'est même pas du pur xml ... mais du html
A/ tu peux utiliser lynx -dump qui enlève les balises (donc pas de code source)
:~$ awk 'BEGIN{FPAT="[0-9,]+"}/Valeur liquidative/{getline; print $NF}' < <(lynx -dump /tmp/foo.html )
266,26
B/ variante gambas
:~$ gbs3 -u gb.xml.html -e 'dim d as new xmldocument: d.open("/tmp/foo.html"): print d.root.getchildrenbyfilter("Span[Class*=vl-box-value]")[0].value'
266,26 EUR
l'histoire du [0] ou [1] dépend du nombres d'élements capturés dans la liste
:~$ gbs3 -u gb.xml.html -e 'dim d as new xmldocument: d.open("/tmp/foo.html"): for each e as xmlelement In d.root.getchildrenbyfilter("Span[Class*=vl-box]"):print e.value: next'
Valeur liquidative
266,26 EUR
09/07/2020
>
print d.root.getchildrenbyfilter("Span[Class*=vl-box]")[1].value renvoie 266,26 EUR
-----
sputnick a écritOn ne doit pas proposer des solutions de bricolage du dimanche.
Ensuite, les personnes copient collent ces réponses peuvent être amenées à devenir pro.
Et avoir ce genre de code en monde pro, ben faut tout réaprendre, car en production, on ne bidouille pas.
Si il y a HTML/XML et regex/awk/sed/grep dans la mème question, c'est une erreur de débutant.
'xmllint' est souvent installé par défaut avec Ubuntu.
Utopique et inadéquate.
Le forum s'adresse à tout la monde. Les professionnels ont la rubrique "ubuntu en entreprise", et ils peuvent poster partout .
Arrêtez de casser les pieds des gens avec vos principes. Il n'y a pas UNE solution, TA solution, mais DES solutions.