Добро пожаловать к нам в гости! Наш сайт посвящён программе NeoBook, с помощью которой вы легко сможете создавать собственные мультимедиа-приложения без необходимости изучать сложные языки программирования! Зарегистрируйтесь, чтобы стать членом нашего сообщества.
Вот в общем, давно хотел сделать парсер ленты форума на ucoz. Предлагал Сергею сделать для информера. С утра посидел, накропал. Проверил на нескольких сайтах, вроде пашет, кому интересно проверьте еще, возможно на своих форумах если есть. Интересует универсальность работы на разных сайтах и средняя скорость работы. Это зависит от степени изменения стандартного кода форума и его (кода) загаженности, замедляющей парсинг. Для вытаскивания заданы 12 элементов, все значения (имена, ссылки) засовываются в отдельные массивы переменных проекта, с которыми можно уже работать и показывать как вздумается (предполагался браузер с собственной состряпанной таблицей). Вход пока без авторизации...
а он ведь сделал эскиз и попросил посмотреть набросок(дабы убедится правильно ли понял идею), но все кануло в лету ps Делал парсинг rss ленты Работает на всех, которые я нашел в сети, сайтах юкоза
Сообщение отредактировано Сергей - Сб, 05 Февраля 2011, 11:57
универсальность не получится, ты привязку на некоторые элементы делаешь к классам (стили)?! А кто задает имена классов?
Quote (DEMBEL)
На одном загаженном сайте процесс занимал до 20сек
ссылку в студию, я проверю завтра и отпишу. А на счет универсальности, что-то я сомневаюсь... Цепляться для парсинга практически не за что (имею ввиду то, что не изменится или будет работать у всех). То ли дело у xml все разграничено
подстроить?? неужели ты думаешь, что подстройка займет пару примитивных действий юзера, типа нажать кнопку или поставить галочку...это утопия Сейчас, слово "Подстройка" включает в себя миниум знания хтмл, чтоб орентироватся, что и откуда цеплять Пока не будут на всех сайтах одинаковые "якоря", за которые можно цеплятся, про все остальное можно смело забыть. Многие имена классов совпадают, но тестил на одном форуме, и парсер половина выдал "лажу". И простой подстройкой там не обойтись, я минут 10 возился, пока не нашел в чем сабж. Зато на остальных 6 сработало, как часы
ты привязку на некоторые элементы делаешь к классам (стили)?! А кто задает имена классов?
именно. а задает их юкоз, поэтому они везде будут одинаковы. но так пока получается не везде сделать. я уже тоже наткнулся на один форум где все ок кроме ссылок на картинку темы, ну там можно подкорректировать. лучше бы вы показывали ссылки на форумы где косячит, я буду смотреть что можно сделать. Как задавать вопросы
просто пустой таймер без интервала TimerStart "Timer1" "" тогда он даже не выполняется, а потом TimerStop и берем прошедшее время из переменной таймера и /1000 Как задавать вопросы