Войти
NeoBooker.ru
Добро пожаловать к нам в гости!
Наш сайт посвящён программе NeoBook, с помощью которой вы легко сможете создавать собственные мультимедиа-приложения без необходимости изучать сложные языки программирования! Зарегистрируйтесь, чтобы стать членом нашего сообщества.
  • Страница 1 из 1
  • 1
Модератор форума: DEMBEL, Peter, YURIY  
Любителям парсить странички HTML на сайтах
DEMBELДата: Пт, 28 Августа 2009, 12:48 | Сообщение # 1
Наш дизайнер
Особенно это касается товарищей с этой темы.
В общем, есть возможность выхватывать нужные участки кода со странички в скрипте, причем получать ее содержимое сразу в переменную через GET запрос (нет гемора с предварительным скачиванием содержимого и сохранением в файл или применением разных плагинов). Требуется только указать уникальные участки кода служащие в качестве меток начала и конца требуемого куска. Далее, при парсинге получившейся переменной есть возможность выбросить (если требуется) хтмл-теги, и получать чистый текст (но можно и не выбрасывать, загружать сразу в обьект Браузер, получая страничку). Таким макаром можно лепить разные "информеры" содержимого сайтов. К примеру, я вытащил кусок кода с ммбилдер.ру с онлайн-юзерами.
Текущие геморы - не получается (пока что) грамотно "отфильтровать" хтмл-теги из переменной. И вообще вся эта байда в целом (пока что) работает через раз ). В общем, если это кому-то реально нада, то доделаю. Мож еще какие-то подводные камни есть, кто в курсе (Алекс?) просветите меня...


Как задавать вопросы

Win7x64 SP1 Neobook v5.70 (Trial)
WinXP SP3 Neobook v5.62


Сообщение отредактировано
DEMBEL - Пт, 28 Августа 2009, 15:19
 
СообщениеОсобенно это касается товарищей с этой темы.
В общем, есть возможность выхватывать нужные участки кода со странички в скрипте, причем получать ее содержимое сразу в переменную через GET запрос (нет гемора с предварительным скачиванием содержимого и сохранением в файл или применением разных плагинов). Требуется только указать уникальные участки кода служащие в качестве меток начала и конца требуемого куска. Далее, при парсинге получившейся переменной есть возможность выбросить (если требуется) хтмл-теги, и получать чистый текст (но можно и не выбрасывать, загружать сразу в обьект Браузер, получая страничку). Таким макаром можно лепить разные "информеры" содержимого сайтов. К примеру, я вытащил кусок кода с ммбилдер.ру с онлайн-юзерами.
Текущие геморы - не получается (пока что) грамотно "отфильтровать" хтмл-теги из переменной. И вообще вся эта байда в целом (пока что) работает через раз ). В общем, если это кому-то реально нада, то доделаю. Мож еще какие-то подводные камни есть, кто в курсе (Алекс?) просветите меня...

Автор - DEMBEL
Дата добавления - 28 Августа 2009 в 12:48
СергейДата: Пт, 28 Августа 2009, 14:40 | Сообщение # 2
Необукер
Quote (DEMBEL)
В общем, есть возможность выхватывать нужные участки кода со странички в скрипте
Я такой парсер делал на НБ в этой теме, потом хотел делать с плагином (там есть поиск по регулярке, так и повис, у всех один недостаток был, не все ключевые слова находили.
Думаю, для твоего скрипта народ найдет приминение

Добавлено (28 Август 2009, 14:40)
---------------------------------------------
я даже искал варианты на JS, чтоб потом подключать в объекте НБ, но для моих скудных знаниях JS отказался от затеи :D

 
Сообщение
Quote (DEMBEL)
В общем, есть возможность выхватывать нужные участки кода со странички в скрипте
Я такой парсер делал на НБ в этой теме, потом хотел делать с плагином (там есть поиск по регулярке, так и повис, у всех один недостаток был, не все ключевые слова находили.
Думаю, для твоего скрипта народ найдет приминение

Добавлено (28 Август 2009, 14:40)
---------------------------------------------
я даже искал варианты на JS, чтоб потом подключать в объекте НБ, но для моих скудных знаниях JS отказался от затеи :D


Автор - Сергей
Дата добавления - 28 Августа 2009 в 14:40
DEMBELДата: Пт, 28 Августа 2009, 14:40 | Сообщение # 3
Наш дизайнер
Кстати, вроде есть отдельные вбс-функции позволяющие не только получать код страницы напрямую, но и считывать специальные теги (meta, title) и другие свойства странички.
По парсингу - ээмм... в принципе сложно сделать универсальный парсер, но можно по крайней мере в вбс-функции откусывать хтмл теги гораздо проще, чем в необушных функциях, вследствие наличия спец.операторов... только я еще не прочухал до конца как это сделать правильно.


Как задавать вопросы

Win7x64 SP1 Neobook v5.70 (Trial)
WinXP SP3 Neobook v5.62
 
СообщениеКстати, вроде есть отдельные вбс-функции позволяющие не только получать код страницы напрямую, но и считывать специальные теги (meta, title) и другие свойства странички.
По парсингу - ээмм... в принципе сложно сделать универсальный парсер, но можно по крайней мере в вбс-функции откусывать хтмл теги гораздо проще, чем в необушных функциях, вследствие наличия спец.операторов... только я еще не прочухал до конца как это сделать правильно.

Автор - DEMBEL
Дата добавления - 28 Августа 2009 в 14:40
  • Страница 1 из 1
  • 1
Поиск: