Разное

Как регуляркой в notepad++ удалить данные после «.html» до конца строки?

Как с помощью Notepad++ можно удалить лишние знаки после ссылки имеющей такой вид:

http:// mysite.com/test1.html	60%	3	Weekly	2015-03-29 04:19
http:// mysite.com/test2.html	60%	1	Weekly	2015-03-28 22:18
http:// mysite.com/test3.html	60%	2	Weekly	2015-03-30 08:06
http:// mysite.com/test4.html	60%	4	Weekly	2015-03-28 22:29
http:// mysite.com/test5.html	60%	1	Weekly	2015-03-30 17:31

Идём в меню: «Поиск» → «Замена«, или нажимаем «Ctrl + H»

Задаём что ищем и на что будем менять:

Найти: (.html.+)$
Заменить на: .html

Внизу отмечаем «Регуляр. выражен.»
notepad1

В итоге получаем чистый список адресов без мусора после .html

http:// mysite.com/test1.html
http:// mysite.com/test2.html
http:// mysite.com/test3.html
http:// mysite.com/test4.html
http:// mysite.com/test5.html
Хорошо если их штук 50, а если 500? Долго придётся руками чистить:-)

Оставить комментарий

3 комментария

  • я в регулярках не силен, поэтому все такие штуки делаю через перевод строки: \r\n
    в данном случае html заменяем на html\r\n
    Т.е. после html будет перевод строки
    Затем все сортируем по порядку и удаляем все ненужные строки.