Как читать вложенный div без определенного класса

У меня следующая проблема со скребком, у меня есть следующий код

    $text = get_content_of_element($html, 'div', 'class', 'text');

, и сайт, где мне нужно прочитать данные, имеет следующую структуру

<div class="text">
            <div style="estilos declarados">
                <div style="imagen aca"></div>

            <div><h3 style="font:18px arial, sans-serif; font-weight:bold; padding:10px 0;">Overview</h3></div>
            <div>recien aca el texto que quiero leer</div><br>
            <div>texto que me gustaria eliminar</b></a></div>
        <div></div></div>

. Как читать данные мне нужно? Можете ли вы передать в качестве параметра, который только что прочитал 5-й div? и в этом случае также в тексте я могу удалить "div" 6th?

Большое спасибо заранее

0
задан 08.01.2017, 01:06
0 ответов

У PHP есть классы, чтобы читать HTML... Считая, что твой HTML был правилен и у него не было ошибок:

<div class="text">
  <div style="estilos declarados">
    <div style="imagen aca"></div>
    <div><h3 style="font:18px arial, sans-serif; font-weight:bold; padding:10px 0;">Overview</h3></div>
    <div>recien aca el texto que quiero leer</div><br>
    <div>texto que me gustaria eliminar</div>
    <div></div>
  </div>
</div>

Мы выполнили бы следующее:

 $DOM = new DOMDocument;
 $DOM->loadHTML($string_con_el_html);
 $divs = $DOM->getElementsByTagName('div');

 print_r($divs[4]->textContent);

Потому что считая DIV что укрывают текст, что поиски он находится в положении #5 и ввиду того, что array считается с 0, что твой элемент - #4.

0
ответ дан 03.12.2019, 17:50