Готова разработка по подсчету количества слов в тексте нужной страницы анализируемого сайта.
Также скрипт позволяет задать слово, после чего происходит просмотр первой пятерки/десятки по этому слову в Яндексе и происходит анализ этих сайтов из выдачи. В результате выполнения скрипт высчитывает среднюю арфиметическую вхождения всех словосочетаний и высчитываем идеальное количество вхождения для этого слова, а также процент вхождения словосочетания относительно всего текста (в разной тематике оно отличается друг от друга).
Более того, мы реализовали такую возможность, которая не встречается больше нигде в Сети: мы производим анализ СЛОВОСОЧЕТАНИЯ! Т.е. есть слово ремонт квартир. Из текста страницы вытаскиваются все СЛОВОФОРМЫ этого словосочетания, такие как ремонт квартир, ремонту квартиры и т.д., и именно исходя из этих данных высчитывается идеальное количество слов в тексте.
Если рассматривать разработки конкурентов, то словоформа одного слова ремонт может встречаться 50 раз, а словоформа другого слова квартир — 30 раз, и лишь 12 раз они могут идти вместе. Т.е. погрешность в работе конкурирующих разработок достигает нескольких сот процентов!
Оттестировали разработку и запустили в активную эксплуатацию!
oleg
Прикольный скрипт. Нет желания поделиться?
Илья
Если бы всё так было просто.
В Яндексе вычисление внутри-документной частоты производится только по релевантным пассажам.
Эртэд
oleg, не вопрос. За $. Пишите в асю или скайп.
Илья, не всё так сложно как принято считать. 🙂
Vika
Большая просьба поделиться скриптом… очень большая…
Михаил Мятов (Эртэд)
Разработка находится по адресу http://www.siteprojects.ru/keys/