E-Commerce Blog

Профессиональная реклама интернет-магазинов

  • Все
  • Разработка
    • Лайфхаки
    • Учим матчасть
    • Монетизация
  • Seo
    • «Seo тактика»
    • «Одной строкой»
    • Поведенческие факторы сайта
    • Эксперименты и аналитика
  • SMM
    • Маркетинг
    • Кейсы
  • E-Commerce
    • E-бизнес
    • E-гаджеты
    • E-дизайн
    • Креатив
    • Коммуникации
  • Site Projects
    • Наша команда
    • Сервисы и разработки
Главная / Для вебмастера / Лайфхаки / Как правильно отформатировать текст из множества элементов и превести его к единому виду, или готовим урлы и ссылки для массового добавления урлов в sape.ru

Михаил Мятов // 9 комментариев

Как правильно отформатировать текст из множества элементов и превести его к единому виду, или готовим урлы и ссылки для массового добавления урлов в sape.ru

Мне пришел с неформатированным текстом ( можно скачать здесь ).

В статье я объясняю как сделать файл с ссылками ( можно скачать здесь).

Результат — потраченное время 15-30 минут вместо 3-5 часов (в лучшем случае).

Мне пришел файл в формате:

Автозаводская  (0/5)
http://www.solidarnost.info/index.php?option=com_mtree&task=listcats&cat_id=43&Itemid=4
АГЕНТСТВО НЕДВИЖИМОСТИ ПРОФИИНВЕСТ 2002 ООО
ЛЮНАЯ РИЭЛ ЭСТЕЙТ
ОЦЕНКА И НЕДВИЖИМОСТЬ
АБСОЛЮТ
КРАСНЫЙ УГОЛ

…

Юго-Западная (0/3)
http://www.solidarnost.info/index.php?option=com_mtree&task=listcats&cat_id=198&Itemid=4
МИАН Отделение «ЮГО-ЗАПАДНОЕ»
МОНОЛИТ ИНВЕСТИЦИОННО-РИЭЛТЕРСКАЯ КОМПАНИЯ
СОДЕЙСТВИЕ XXI

где  Автозаводская и Юго-Западная — это станции метро,
урл страниц — это урл каждого метро,
а остальные элементы — это агентства недвижимости, соответствующие каждому метро.

Всего станций метро было около 180. Сам файл с неформатированным текстом можно скачать здесь.

Файл нужн нужно было привести к виду:
<name>Автозаводская  (0/5)</name><a href=»http://www.solidarnost.info/index.php?option=com_mtree&task=listcats&cat_id=43&Itemid=4″>АГЕНТСТВО НЕДВИЖИМОСТИ ПРОФИИНВЕСТ 2002 ООО</a>
<name>Автозаводская  (0/5)</name><a href=»http://www.solidarnost.info/index.php?option=com_mtree&task=listcats&cat_id=43&Itemid=4″>ЛЮНАЯ РИЭЛ ЭСТЕЙТ</a>
<name>Автозаводская  (0/5)</name><a href=»http://www.solidarnost.info/index.php?option=com_mtree&task=listcats&cat_id=43&Itemid=4″>ОЦЕНКА И НЕДВИЖИМОСТЬ</a>
<name>Автозаводская  (0/5)</name><a href=»http://www.solidarnost.info/index.php?option=com_mtree&task=listcats&cat_id=43&Itemid=4″>АБСОЛЮТ</a>
<name>Автозаводская  (0/5)</name><a href=»http://www.solidarnost.info/index.php?option=com_mtree&task=listcats&cat_id=43&Itemid=4″>КРАСНЫЙ УГОЛ</a>
…
<name>Юго-Западная (0/3)</name><a href=»http://www.solidarnost.info/index.php?option=com_mtree&task=listcats&cat_id=198&Itemid=4″>МИАН Отделение «ЮГО-ЗАПАДНОЕ»</a>
<name>Юго-Западная (0/3)</name><a href=»http://www.solidarnost.info/index.php?option=com_mtree&task=listcats&cat_id=198&Itemid=4″>МОНОЛИТ ИНВЕСТИЦИОННО-РИЭЛТЕРСКАЯ КОМПАНИЯ</a>
<name>Юго-Западная (0/3)</name><a href=»http://www.solidarnost.info/index.php?option=com_mtree&task=listcats&cat_id=198&Itemid=4»>СОДЕЙСТВИЕ XXI</a>

Итоговый файл можно скачать здесь.

Итак, как правильно отформатировать текст из множества элементов и превести его к единому виду, или готовим урлы и ссылки для массового добавления урлов в sape.ru?
1. Добавил всё это дело в блокнот
2. Заменил все вхождения «http://» на «/thttp://» («[скрытый-символ-Таб]http://») ; так мы пометили все адреса урлы
3. Заменил все вхождения «\n\thttp://» на «</name><a href=»http://» ; так мы сформировали центр наших ссылок.
4. Заменил все «\n\n» на «\т12345″ — тем самым избавившись от промежутков между блоков.
5. Заменил все » \n» на «\n» — тем самым убрав пробелы в конце строк
6. Заменил все «12345» на «\n\t\t<name>», тем самым выделив все значения (кроме 1го в отдельный будущий столбик экселя
7. У первого значения добавил таб.+таб.+<name>
8. Всё скопировал и вставил в документ экселя. Получилось 3 заполненных столбка:
столбец А — значениями агентств
столбец B — пустой
столбец C — станциями метро и урлами
9. В столбец D вставляем значение «> и копируем на весь столбик
10. Копируем все и вставляем в текстовый файл.
11. Меняем все \t»> на «>
12. Меняем все \t\t»> на ничего (пустое место). Получили чистое начало всех ссылок.
13. Всё скопировал и вставил в документ экселя, оставив спереди вставленного пустой столбец.
14. Выделяю ручками значения столбика D (не выделять весь столбик, а выделять значения этого столбика ручками!) и
вставляю значения в столбик A, только начиная со строчки №2.
15. В столбик C вставляем значение </a> и копируем на весь столбик
16. Копируем все и вставляем в текстовый файл.
17 Меняем все \t</a> на </a>
18. Меняем все \t</a> на ничего (пустое место). Получили чистое начало всех ссылок.
19. Используем регулярное выражение. Меняем все
<name>(.*)</name>(.*)href=»(.*)»>(.*)</a>\n\t
<name>\1</name>\2href=»\3″>\4</a>\n<name>\1</name>\2href=»\3″>
мы получили везде вторую строчку заполненную.
20. Осталось заполнить все остальные строчки (станции метро, где количество элементов больше двух).
Производим замену кодом, указанном в пункте 19, пока не будет написано, что замененных элементов = 0
(мне пришлось нажать на кнопку мыши раз 20).
21. Последний штрих. Убираем табуляцию у первых строк (она осталась после переноса из экселя).
Для этого меняем все «>\t на «>
22. При необходимости удаляем все промежутки между блоками.
Для этого меняем все \n\n на \n до тех пор, пока не будет написано, что замененных элементов = 0.

Все ссылки готовы! Итого потрачено времени — 15-30 минут.
Если бы каждую ссылку пришлось бы «проходить» и составлять руками, потратили бы часов 3-5 и кучу нервов.

Теперь можно идти в Сапе (сейпе) в проект и загружать все ссылки через Пакетное добавление урлов. В итоге будет добавлено около 180 урлов проекта и более чем 1000 текстов.

Читайте также

Массовая проверка pr страниц сайта, бесплатный онлайн сервис Основы seo — хорошие и плохие ссылки Вес ссылок с doc, ссылки с pdf, флеш Создание хорошей внутренней оптимизации и прекрасной индексации поисковых систем

Filed Under: Лайфхаки Tagged With: sape.ru, массовое добавление, сапа, сейп, ссылки, урлы, форматироваине, элементы

Comments

  1. Олег

    04.05.2010 в 16:37:37

    Спасибо за статью, не думал что такую работу можно проделать используя только блокнот!

  2. Dimon

    06.05.2010 в 18:56:02

    Спасибо полезная статья, я думал что надо спец ПО, а можно только через блокнот!

  3. Коля

    07.05.2010 в 11:58:33

    Ого, и это через блокнот! Спс автору!

  4. Eduard

    07.05.2010 в 16:26:33

    Очень интересный способ описан! Буду пробовать!

  5. Серёга

    10.05.2010 в 12:37:03

    Интересно, никогда такого не видел!

  6. Антон

    11.05.2010 в 11:39:44

    Супер, никогда такого ещё не видел!

  7. Юрий

    11.05.2010 в 12:02:26

    Очень удачный метод, так получается секономить много времени!

  8. Игорь

    11.05.2010 в 14:34:26

    Хороший удобный и простой метод!

  9. Михаил МятовМихаил Мятов (Эртэд)

    12.05.2010 в 6:39:00

    Спасибо всем.

    В дополнение.

    Как из формата
    щебень опт
    щебень розница
    щебень доставка от 1м3
    гранит опт
    гранит розница
    гранит доставка от 1м3

    получить ссылки для GoGetLinks формата
    http://www.gogetlinks.net/;текст ссылки;ключевое слово;5

    1. Заменяем

    на ;
    3. Заменяем

    на ;1

    Мы получили за 2 минуты ссылки для GGL вида:
    http://www.gravii.ru/index.php?option=com_content&task=view&id=171&Itemid=12;щебень опт;1
    http://www.gravii.ru/index.php?option=com_content&task=view&id=171&Itemid=12;щебень розница;1
    http://www.gravii.ru/index.php?option=com_content&task=view&id=171&Itemid=12;щебень доставка от 1м3;1
    http://www.gravii.ru/index.php?option=com_content&task=view&id=170&Itemid=1;гранит опт;1

Добавить комментарий Отменить ответ

Ваш e-mail не будет опубликован. Обязательные поля помечены *

  • Все
  • Разработка
  • Seo
  • SMM
  • E-Commerce
  • Site Projects

Copyright © 2006-2025 · Site Projects

· Log in

Политика конфидециальности