Любителям парсить странички HTML на сайтах

Войти

Добро пожаловать к нам в гости!
Наш сайт посвящён программе NeoBook, с помощью которой вы легко сможете создавать собственные мультимедиа-приложения без необходимости изучать сложные языки программирования! Зарегистрируйтесь, чтобы стать членом нашего сообщества.

Страница 1 из 1 1
Модератор форума: DEMBEL, Peter, YURIY

Любителям парсить странички HTML на сайтах (Решение на VbScript (юзеры НБ, чуете?))

Любителям парсить странички HTML на сайтах

DEMBEL

Дата: Пт, 28 Августа 2009, 12:48 | Сообщение # 1

Наш дизайнер

Особенно это касается товарищей с этой темы.
В общем, есть возможность выхватывать нужные участки кода со странички в скрипте, причем получать ее содержимое сразу в переменную через GET запрос (нет гемора с предварительным скачиванием содержимого и сохранением в файл или применением разных плагинов). Требуется только указать уникальные участки кода служащие в качестве меток начала и конца требуемого куска. Далее, при парсинге получившейся переменной есть возможность выбросить (если требуется) хтмл-теги, и получать чистый текст (но можно и не выбрасывать, загружать сразу в обьект Браузер, получая страничку). Таким макаром можно лепить разные "информеры" содержимого сайтов. К примеру, я вытащил кусок кода с ммбилдер.ру с онлайн-юзерами.
Текущие геморы - не получается (пока что) грамотно "отфильтровать" хтмл-теги из переменной. И вообще вся эта байда в целом (пока что) работает через раз ). В общем, если это кому-то реально нада, то доделаю. Мож еще какие-то подводные камни есть, кто в курсе (Алекс?) просветите меня...

Как задавать вопросы

Win7x64 SP1 Neobook v5.70 (Trial)
WinXP SP3 Neobook v5.62

Сообщение отредактировано
DEMBEL - Пт, 28 Августа 2009, 15:19

Сергей

Дата: Пт, 28 Августа 2009, 14:40 | Сообщение # 2

Необукер

Quote (DEMBEL)

В общем, есть возможность выхватывать нужные участки кода со странички в скрипте

Я такой парсер делал на НБ в этой теме, потом хотел делать с плагином (там есть поиск по регулярке, так и повис, у всех один недостаток был, не все ключевые слова находили.
Думаю, для твоего скрипта народ найдет приминение

Добавлено (28 Август 2009, 14:40)
---------------------------------------------
я даже искал варианты на JS, чтоб потом подключать в объекте НБ, но для моих скудных знаниях JS отказался от затеи

DEMBEL

Дата: Пт, 28 Августа 2009, 14:40 | Сообщение # 3

Наш дизайнер

Кстати, вроде есть отдельные вбс-функции позволяющие не только получать код страницы напрямую, но и считывать специальные теги (meta, title) и другие свойства странички.
По парсингу - ээмм... в принципе сложно сделать универсальный парсер, но можно по крайней мере в вбс-функции откусывать хтмл теги гораздо проще, чем в необушных функциях, вследствие наличия спец.операторов... только я еще не прочухал до конца как это сделать правильно.

Как задавать вопросы

Win7x64 SP1 Neobook v5.70 (Trial)
WinXP SP3 Neobook v5.62

Любителям парсить странички HTML на сайтах (Решение на VbScript (юзеры НБ, чуете?))

Страница 1 из 1
1