Автор Тема: Как задать условие, чтоб с текстовго файла удалялся весь ненужный текст, кроме..  (Прочитано 3060 раз)

Oleghome

  • Newbie
  • *
  • Сообщений: 8
    • Просмотр профиля
Здравствуйте, очень понравилась программа uvFilesCorrector, но не могу понять как задать условие, чтоб с текстовго файла удалялся весь ненужный текст, кроме текста который закрыт тегами например ( <head><title> Красивая постель Cotton box</title><meta http-equiv="Content-Type" content="text/html; charset=utf-8"/><base/><linkhref="image/data/cart.png" rel="icon"/><link rel="stylesheet" type="text/css" href="catalog/view/theme/shoppica/stylesheet/960.css") нужно чтоб програма оставляла в файле только текст <title> Красивая постель Cotton box</title>. Очень буду благодарен за помощь, уже 3ий день ламаю себе голову. 

Oleghome

  • Newbie
  • *
  • Сообщений: 8
    • Просмотр профиля
Администратор мне помог, спасибо ему за это и прикрепляют его решения. Но когда мне нужно было оставить текст из нескольких тегов, то решение не срабатывает, остается только текст с первой пары тегов.

Прикрепил файл к которому хочу применить условия. Мне нужно чтоб в етом файле (indexfe21.html) остался текст закрытый в тегах (<title></title>), (<div id="product_description"></div>),(
<meta name="keywords"      />)(<meta name="description"                       />)  Пожалуйста, прошу помощи.

Arex

  • Jr. Member
  • **
  • Сообщений: 54
    • Просмотр профиля
Нужно просто добавить эти теги в регулярку:

.*(<title>.*<\/title>).*(<meta name="keywords".*?\/>).*(<meta name="description".*?\/>).*(<div id="product_description">.*?<\/div>).* заменить на $1$2$3$4 (или $1\r\n$2\r\n$3\r\n$4, чтобы были переносы строк между тегами).

Oleghome

  • Newbie
  • *
  • Сообщений: 8
    • Просмотр профиля
Здравствуйте, пробовал Ваш метод, программа не деалет замену, а зависает(((

Oleghome

  • Newbie
  • *
  • Сообщений: 8
    • Просмотр профиля
Нужно просто добавить эти теги в регулярку:

.*(<title>.*<\/title>).*(<meta name="keywords".*?\/>).*(<meta name="description".*?\/>).*(<div id="product_description">.*?<\/div>).* заменить на $1$2$3$4 (или $1\r\n$2\r\n$3\r\n$4, чтобы были переносы строк между тегами).
У меня не работает, программа зависает, скажыте хоть работало ли у Вас, или ета задача не выполняеться вобще етой программой??? Спасибо.

Arex

  • Jr. Member
  • **
  • Сообщений: 54
    • Просмотр профиля
Это баг последней версии программы, она почему-то периодически сбоит на некоторых xml-подобных документах (я уже писал об этом здесь (http://uvsoftium-forum.ru/index.php?topic=175.msg5997#msg5997)). Видимо, тут тоже какие-то проблемы с кодировкой, не знаю точно.
В качестве обхода проблемы, пока разрабы не исправят ошибку, можно либо вручную удалять первую строку <?xml version="1.0" encoding="UTF-8"?>, либо воспользоваться более старой версией программы (4.3.0.24).

Oleghome

  • Newbie
  • *
  • Сообщений: 8
    • Просмотр профиля
Спасибо, всьо заработало в другой версии программы.
« Последнее редактирование: Апрель 29, 2014, 05:23:56 am от Oleghome »

Oleghome

  • Newbie
  • *
  • Сообщений: 8
    • Просмотр профиля
А будьте еще добры подскажите пожалуйста, какую схему надо прописать например, чтобы информация, которая закрыта тегами отделялась точкой с запятой ?
Чтобы потом можно было залить всю информацыю в ексель файл?
Заранее спасибо.

Arex

  • Jr. Member
  • **
  • Сообщений: 54
    • Просмотр профиля
Просто замену надо производить на $1;$2;$3;$4[nw]. Но на мой взгляд, вместо точки с запятой лучше поставить табуляцию, так и в текстовом виде  смотреть удобно, и в Excel импортировать удобно.

Oleghome

  • Newbie
  • *
  • Сообщений: 8
    • Просмотр профиля
Спасибо, а табуляция пишеться $1[t]$2[t]$3[t]$4?
У Вас есть рекомендации как лучше импортировать информацию в Ексель?
« Последнее редактирование: Апрель 29, 2014, 12:38:01 pm от Oleghome »

Oleghome

  • Newbie
  • *
  • Сообщений: 8
    • Просмотр профиля
Походу усвоения новой для меня нформация, понимаю что задаю глупые вопросы) Но без вашей помощи не обойтись.)
С табуляцией разобрался, но когда делаю импорт в Эксель, оно все строки идут вперемешку, хотя все разделители правильно настроены, а малоб идти например столбец 1 (Title) и пошли все тайтлы, столбец 2 <H1>, самая большая проблема с ячейкой Description, информация выходит за область ячейки.
« Последнее редактирование: Апрель 29, 2014, 03:56:24 pm от Oleghome »