tidy - Cómo eliminar ID duplicados de HTML

Tengo un HTML que necesita ser analizado por DOMDocument::loadHtml($html), pero me da un error:

DOMDocument::loadHTML(): ID 'my id' already defined in Entity

No tengo control sobre el $html, pero puedo usar tidy lib (o algo más, ¿ideas?) en él y hacer un HTML analizable. Pero no encuentro una opción en la configuración de tidy para eliminar los ID duplicados en la configuración tidy. Mi código es así:

$tidy = new tidy();
$tidy->parseString($this->getPageContents());
$html = new DOMDocument();
$html->loadHTML($tidy); // error here

Gracias

preguntado el 16 de mayo de 11 a las 20:05

1 Respuestas

tratan

$html->loadXML($tidy);

y luego reescribir la identificación usando xml dom antes de analizar como html dom

contestado el 17 de mayo de 11 a las 00:05

No es la respuesta que estás buscando? Examinar otras preguntas etiquetadas or haz tu propia pregunta.