Извлекать текст между двумя словами

Как он говорит, что титул я хочу извлечь текст, который есть между двумя словами. Для этого мне случилось создавать систему с командой состойте в том, чтобы он позволил мне заменять то, что он искал для потом с greep, и cut извлекать это. Но результат в бывший во всех случаях абсолютное прекращение, я помещаю вас немного в ситуацию.

У меня есть этот текст с очень много кодом сверху и из-за внизу:

<div class="item">
    <div class="imagens">
        <a href="http://sitio.php">
            <img src="https://image.jpg" alt="texto" width="100%" height="100%"/></a>
        <span class="imdb"><b><b class="icon-star"></b></b> 7.2</span>
    </div>
    <span class="text">texto</span>
    <span class="fecha">2016</span>
</div>
<div class="item">
    <div class="imagens">
        <a href="http://sitio.php">
            <img src="https://image.jpg" alt="texto" width="100%" height="100%"/></a>
        <span class="imdb"><b><b class="icon-star"></b></b> 7.2</span>
    </div>
    <span class="text">texto</span>
    <span class="fecha">2015</span>
</div>

EJ: Parametrizo эти два текста"<div class="item"><div class="imagens">"и этот"</div>"таким образом что оставался такой текст как этот:

<a href="http://sitio.php">
        <img src="https://image.jpg" alt="texto" width="100%" height="100%"/></a>
    <span class="imdb"><b><b class="icon-star"></b></b> 7.2</span>
</div>
<span class="text">texto</span>
<span class="fecha">2016</span>

Я ИЗДАЮ

Ответ @Ivan Лодочник я думаю, что она самая близкая к решению проблемы, которая у меня есть, но остаюсь с проблемой, который я не могу выбрать второго </div> что у него есть.

И этикетки, которые, должно быть, не выходят:

<div class="item">
    <div class="imagens">

и второй:

</div>

Благодаря тому, что первый - посередине кода, я участвую в рыцарском турнире за этикеткой закрытия span. Какая-то помощь пожалуйста?

5
задан 13.04.2017, 16:00
0 ответов

Я приветствую, наблюдал то, чего ты требуешь, основанный на том, что ты говоришь (который могут использовать BASH), я сделал рукописный шрифт, который я жду, смогите помогать тебе с твоей проблемой.

script.sh

#!/bin/bash

# Parametros
INICIO=$1
FINAL=$2
ARCHIVO=$3

# Escapamos INICIO y FINAL
E_INICIO="${INICIO/\//\\/}"
E_FINAL="${FINAL/\//\\/}"

# Expresion a buscar
EXPRESION="/^$E_INICIO/,/^$E_FINAL/{p;/$E_FINAL/q}"

sed -n "$EXPRESION" $ARCHIVO

Этот берет три параметра, цепь начала, конец и файл, основанный на них реализуют утечку символов (А именно он меняет их / из-за/) для того, чтобы они смогли быть использованными в регулярном выражении, которое проходит позже в команду, будьте.

Я надеюсь, что он подает тебя.

Здесь пример функционирования:

archivo.html

<div class="item">
<div class="imagens">
    <a href="http://sitio.php">
        <img src="https://image.jpg" alt="texto" width="100%" height="100%"/></a>
    <span class="imdb"><b><b class="icon-star"></b></b> 7.2</span>
</div>
<span class="text">texto</span>
<span class="fecha">2016</span>
</div>
<div class="item">
<div class="imagens">
    <a href="http://sitio.php">
        <img src="https://image.jpg" alt="texto" width="100%" height="100%"/></a>
    <span class="imdb"><b><b class="icon-star"></b></b> 7.2</span>
</div>
<span class="text">texto</span>
<span class="fecha">2015</span>
</div>

Консоль

bash script.sh '<div class="item">' '</div>' archivo.html

Результат

<div class="item">
<div class="imagens">
    <a href="http://sitio.php">
        <img src="https://image.jpg" alt="texto" width="100%" height="100%"/></a>
    <span class="imdb"><b><b class="icon-star"></b></b> 7.2</span>
</div>
2
ответ дан 03.12.2019, 17:31
  • 1
    Спасибо! Но поскольку комментарий @Gepser есть 2 этикетки </div>, которые закрывают, и проблема была в этой точке, что có я говорю, что он остается отрезанным половиной, но оставшаяся часть - достаточно добра и страховки, что подает большое количество людей. Большое спасибо! –  27.01.2017, 17:56

Ошибка, которую он показывает тебе

SyntaxError: Non-ASCII character '\xc3' in file prueba.py он-лайн 7, but не encoding declared; see http://www.python.org/peps/pep-0263.html for detail

которым ты имеешь символы Non-ASCII в твоем рукописном шрифте (который ты схватил другого вопроса, обладает акцентом), ты Должен определять кодирование символов, которое использовало python, чтобы относиться к файлу: это для версии 2.7 и несовершеннолетние. так как python 3 не необходим.

# coding: utf-8
1
ответ дан 03.12.2019, 17:31
  • 1
    Спасибо. Но кажется, что это не единственная проблема, у которой есть код... Также я это использую как пример для кода в bash. Так как я реализовал вся мою программу в bash и встретился с этой проблемой, которую я не могу решить... –  25.01.2017, 22:41