Добро пожаловать к нам в гости! Наш сайт посвящён программе NeoBook, с помощью которой вы легко сможете создавать собственные мультимедиа-приложения без необходимости изучать сложные языки программирования! Зарегистрируйтесь, чтобы стать членом нашего сообщества.
Подскажите как NB заставить удалять куски типа <book-title>. Подскожите может есть какие плагины для работы со строками. Стандартных команд типа заменить символы, удалить, не достаточно для реализации задуманого. Кто может подсказать будте добры подскажите!
Где именно надо удалять? Подозоеваю, что в коде HTML-страницы...
Quote (Woha28)
Стандартных команд типа заменить символы, удалить, не достаточно
Почему недостаточно? В NB имеются вполне развитые средства для работы со строками. Woha28, покажите - что вы пытались проделать. - А вам какую операционку поставить - экспи, семерку или висту? - Это ты сейчас о чем? - Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный? - Ну, конечно, надежный! - Вот, значит - экспи, без вопросов! Сейчас сделаем...
(Улицы разбитых фонарей, сезон 10, серия 17)
Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!
При модном втюхе модоподдающимся начинает нравиться
FB2 Пардон, проглядел что именно надо обрабатывать.
Похоже, что здесь и впрямь может не хватить средств NB. Нужно изучить этот Fb2 - А вам какую операционку поставить - экспи, семерку или висту? - Это ты сейчас о чем? - Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный? - Ну, конечно, надежный! - Вот, значит - экспи, без вопросов! Сейчас сделаем...
(Улицы разбитых фонарей, сезон 10, серия 17)
Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!
При модном втюхе модоподдающимся начинает нравиться
Woha28, то, что вы показали в своем исходнике, не имеет никакого отношения к этому:
Quote (Woha28)
Подскажите как NB заставить удалять куски типа <book-title>. Подскожите может есть какие плагины для работы со строками
Еще раз: что именно требуется сделать? - А вам какую операционку поставить - экспи, семерку или висту? - Это ты сейчас о чем? - Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный? - Ну, конечно, надежный! - Вот, значит - экспи, без вопросов! Сейчас сделаем...
(Улицы разбитых фонарей, сезон 10, серия 17)
Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!
При модном втюхе модоподдающимся начинает нравиться
Сохранить весь этот текст в текстовый файл, но только без кода типа: <first-name>, <book-title>.
Добавлено (08 Февраля 2012, 02:59) --------------------------------------------- Всё дело в том что постоянно читаю разные книги, на телефоне который читает только файлы *.txt в кодировке UTF8 но как кодировать из ANSI в UTF8 я уже нашел.
Вот как Fb2 выглядит в редакторе, почти как код HTML
Понятно... Надо разобраться где начинается и заканчивается "полезная часть", т.е. сам текст, и какие слова являются ключевыми.
В принципе, выделить текст можно, но, боюсь, что на больших "объемах" скорость "конвертации" может оказаться небольшой или низкой.
Добавлено (08 Февраля 2012, 03:04) ---------------------------------------------
Quote (Woha28)
как кодировать из ANSI в UTF8 я уже нашел.
А "вырезать ненужное" пробовали? - А вам какую операционку поставить - экспи, семерку или висту? - Это ты сейчас о чем? - Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный? - Ну, конечно, надежный! - Вот, значит - экспи, без вопросов! Сейчас сделаем...
(Улицы разбитых фонарей, сезон 10, серия 17)
Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!
При модном втюхе модоподдающимся начинает нравиться
Woha28, кстати, а вы "готовые к употреблению" программы пробовали? Например, эту.
Или вы решили непременно написАть её самостоятельно на NB? - А вам какую операционку поставить - экспи, семерку или висту? - Это ты сейчас о чем? - Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный? - Ну, конечно, надежный! - Вот, значит - экспи, без вопросов! Сейчас сделаем...
(Улицы разбитых фонарей, сезон 10, серия 17)
Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!
При модном втюхе модоподдающимся начинает нравиться
Как "кодировал" это понятно, а вырезать ненужное из текста пробовали? - А вам какую операционку поставить - экспи, семерку или висту? - Это ты сейчас о чем? - Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный? - Ну, конечно, надежный! - Вот, значит - экспи, без вопросов! Сейчас сделаем...
(Улицы разбитых фонарей, сезон 10, серия 17)
Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!
При модном втюхе модоподдающимся начинает нравиться
Это похвально (хоть и нерационально), но я так и не могу понять: уже пробовали или только хотите попробовать?
Добавлено (08 Февраля 2012, 03:17) ---------------------------------------------
Quote (Woha28)
пробовал но так решение и не нашел!
Вот об этом я и говорил:
Quote (Peter)
Woha28, покажите - что вы пытались проделать.
Предложение не снимается. - А вам какую операционку поставить - экспи, семерку или висту? - Это ты сейчас о чем? - Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный? - Ну, конечно, надежный! - Вот, значит - экспи, без вопросов! Сейчас сделаем...
(Улицы разбитых фонарей, сезон 10, серия 17)
Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!
При модном втюхе модоподдающимся начинает нравиться
Добавлено (08 Февраля 2012, 03:32) --------------------------------------------- Переменная [File] содержит текст типа:
<?xml version="1.0" encoding="windows-1251"?> <FictionBook xmlns="http://www.gribuser.ru/xml/fictionbook/2.0" xmlns:l="http://www.w3.org/1999/xlink"> <description> <title-info> <genre>sf_fantasy</genre> <author> <first-name>Роджер</first-name> <last-name>Желязны</last-name> <id>0fdf4f39-2a81-102a-9ae1-2dfe723fe7c7</id> </author> <book-title>Девять принцев Амбера</book-title> <annotation> <p>Девять Принцев — девять претендентов на опустевший трон, девять братьев, в одночасье ставших врагами... Король Амбера, Оберон, исчез, и вот уже в Амбере междоусобица — его сыновья сражаются друг с другом... Принц Корвин кознями собственного брата лишен памяти, но сможет ли это остановить Принца Амбера в его борьбе за власть?</p> </annotation> <date>1970</date> <coverpage> <image l:href="#cover.jpg"/></coverpage> <lang>ru</lang> <sequence name="Хроники Амбера Пятикнижие Корвина" number="1"/> </title-info> <document-info> <author> <first-name>erick</first-name> <last-name>mack</last-name> </author> <author> <first-name>Faiber</first-name> <last-name>mack</last-name> <email>faiber@yandex.ru</email> </author> <author> <first-name>Tibioka</first-name> <last-name></last-name> </author> <program-used>FB Tools, FB Editor v2.0</program-used> <date value="2004-12-25">2004-12-25</date> <src-url>http://www.lib.aldebaran.ru</src-url>
Сообщение отредактировано Woha28 - Ср, 08 Февраля 2012, 03:27
Нужно разобрать структуру этих Fb2-файлов, чтобы понять с какого места и как конкретно производить выделение "полезного текста". Принципиально задача решаемая, но:
Quote (Peter)
на больших "объемах" скорость "конвертации" может оказаться небольшой или низкой.
потому-что скорость работы скриптового языка NB несоизмеримо ниже машинного у обычной программы. Учитывая, что тексты книг весьма и весьма немаленькие, я бы воспользовался уже готовой программой.
А стратегиечски решение на NB может выглядеть примерно так: делим текст на строки, а затем в каждой строке ищем те части, которые начинаются с "<" и заканчиваются ">" , и вырезаем (вместе с этими знаками) то, что внутри. Можно и напрямую (без разбивки на строки) парсить текст и "вырезать". Можно, наоборот - вырезать то, что между ">" и "<"...
Что в реальности окажется быстрее пока сказать сложно, но в любом случае, процесс будет не столь быстрым, как того хотелось бы. - А вам какую операционку поставить - экспи, семерку или висту? - Это ты сейчас о чем? - Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный? - Ну, конечно, надежный! - Вот, значит - экспи, без вопросов! Сейчас сделаем...
(Улицы разбитых фонарей, сезон 10, серия 17)
Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!
При модном втюхе модоподдающимся начинает нравиться
Заполните пожалуйста в профиле пункты Город и Дата рождения (которые были помечены как обязательные при регистрации). После чего ваш профиль будет проверен, и перенесен в группу Проверенные с повышенными правами.
Там в обоих случаях (и в функции мишема) применен скриптовый язык NB, а это уже без разницы, т.к. все это чисто вопрос "оформления кода". Единственная надежда - JScript. Но и это точно так же проиграет в скорости машинному коду. К тому же, во всех случаях решения через NB потребуется доработка кода.
Тут где-то мелькала тема про плагин с "регулярками", может его попробовать...
Правда, при наличии специальных программ для решения именно этой конкретной задачи (по сабжу), тема превращается в своего рода "упражнение", что ли...
Но, как я понял, автор сабжа реально и не пытался самостоятельно решить задачу, т.к. приведенный им код совершенно "не в тему". - А вам какую операционку поставить - экспи, семерку или висту? - Это ты сейчас о чем? - Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный? - Ну, конечно, надежный! - Вот, значит - экспи, без вопросов! Сейчас сделаем...
(Улицы разбитых фонарей, сезон 10, серия 17)
Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!
При модном втюхе модоподдающимся начинает нравиться
Вот эо вы тему развернули. Надо то, удалить "шапку" оставив название, автора. Удалить картинки от тега <binary и до конца. Составить список тегов и через цикл их удалить командой StrReplace Или если хочется после знать что и где находилось заменить теги на соответствующие значения. Допустим <author> = Автор: <book-title> = Название: <cite> = цитата: и т.д. Если же использовать парсер и просто даление по символам, то это займет очень много времени. Единственное что можно сделать парсером, то это после замены всех тегов проити по тексту на поиск оставшегося мусора. <*>.
Кстати, Петр, насчет плагина по тексту. Давно говорил что не хватает текстовых функций в НБ. Для мелочей, хватает. Для вот таких больших вариантов, маловато будет.
Не плохо было бы сделать поиск, замена, и удаление символов по маске. В данном случае можно было бы заменить, удалить символы по <*> = удалить все теги. Или заменить все теги <*title> на Заголовок: и т.д.
Не подумай что это очень редко надо. Кто с текстом связывается, тот знает на сколько этих функций не хватает. Да и не только этих. Не хочешь читать хелп?
Не плохо было бы сделать поиск, замена, и удаление символов по маске. В данном случае можно было бы заменить, удалить символы по <*> = удалить все теги. Или заменить все теги <*title> на Заголовок: и т.д.
А чем не устраивает:
Quote (mishem)
Составить список тегов и через цикл их удалить командой StrReplace
Quote (mishem)
тот знает на сколько этих функций не хватает. Да и не только этих.
Так и не пойму - чего же именно не хватает-то?
- А вам какую операционку поставить - экспи, семерку или висту? - Это ты сейчас о чем? - Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный? - Ну, конечно, надежный! - Вот, значит - экспи, без вопросов! Сейчас сделаем...
(Улицы разбитых фонарей, сезон 10, серия 17)
Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!
При модном втюхе модоподдающимся начинает нравиться
Вот смотри, командой StrReplace удаляется быстрее чем парсить, и удалять.
Quote (Peter)
А чем не устраивает:
когда ты знаешь этот список, еще куда не шло. И даже если знаешь, думаю что через плагин по маске <*> было бы быстрее чем
Quote (mishem)
Составить список тегов и через цикл их удалить командой StrReplace
Есть такие теги <image может быть любой текст/> придется парсить Найти <image, без плагина удалить предшествующий текст, найти />, произвести действие с этим тегом. По маске <image */> все это можно сделать в разы быстрее.
Сейчас посмотрел повнимательнее. Если автору нужно только читать, и не нужна никакая информация больше. Тоесть только для себя, а не для распространения, то обрабатывать текст можно только тот, который находиться между тегами <body></body>
Сколько я не пробовал понять смысл регулярки, так и не вышло. Вроде все понятно, и в тот же момент...
Quote (DEMBEL)
вообще это работа для регулярных выражений, для этого есть как функции различного типа
Нууу , так скоро можно всех будет посылать изучать дельфи или с++. Получается что бы что то сделать в НБ, надо изучить PHP, HTML, CSS, яву ну и т.д. Не хочешь читать хелп?
Да, через плагин будет быстрее. Любые портянки NB-скриптов, будут работать многократно медленнее, чем машинный код плагина. Но, если так рассуждать, то можно вообще дойти до того, что потребуются функции "на заказ", и заточенные под конкретную рАзовую задачу, а о самом языке NB можно будет забыть.
mishem, не забывай, что истинные необукеры не ищут легких путей!
Когда NB начинает реально не хватать, автоматом напрашивается мысль: не разумнее ли, уж тогда заняться изучением нормального языка? Ограничений, по крайней мере потенциально, не будет.
Quote (DEMBEL)
вообще это работа для регулярных выражений
Совершенно верно!
Я пытаюсь сейчас смотреть в сторону "регулярок", но пока мало чего в этом смыслю, все в процессе познания... - А вам какую операционку поставить - экспи, семерку или висту? - Это ты сейчас о чем? - Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный? - Ну, конечно, надежный! - Вот, значит - экспи, без вопросов! Сейчас сделаем...
(Улицы разбитых фонарей, сезон 10, серия 17)
Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!
При модном втюхе модоподдающимся начинает нравиться
не разумнее ли, уж тогда заняться изучением нормального языка?
Дык с одной стороны хочется, с другой, засыпаю я при изучении теории. Странице на 2ой ловлю себя на мысли что просто читаю а сам думаю совсем о другом.
Вот и замечательно! В чем проблема-то? Ну, будет плагином побыстрее на пару секунд... Это так критично?
- А вам какую операционку поставить - экспи, семерку или висту? - Это ты сейчас о чем? - Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный? - Ну, конечно, надежный! - Вот, значит - экспи, без вопросов! Сейчас сделаем...
(Улицы разбитых фонарей, сезон 10, серия 17)
Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!
При модном втюхе модоподдающимся начинает нравиться
Да!!! Я не за этот случай говорю. Это просто как пример получилось. Представь что нужно найти такие как <image, <a type и т.д. Не, в принципе я давно уже понял что эту тему нечего поднимать. Ладно, проехали.
Представь что нужно найти такие как <image, <a type и т.д.
Может через "регулярки" это можно делать...
Quote (mishem)
эту тему нечего поднимать.
Тему поднимать есть смысл, когда в ней реально есть смысл, а не для того, "чтобы было".
Quote (mishem)
в больницу. Полежу.
А что такое? Профилактически или есть проблемы?
- А вам какую операционку поставить - экспи, семерку или висту? - Это ты сейчас о чем? - Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный? - Ну, конечно, надежный! - Вот, значит - экспи, без вопросов! Сейчас сделаем...
(Улицы разбитых фонарей, сезон 10, серия 17)
Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!
При модном втюхе модоподдающимся начинает нравиться
Смысл есть реальный. Просто если люди пользуются функциями парсер что выкладывал алиен и я, то о чем говорить? Если поднаторевший спрашивает
Quote (Woha28)
удалять куски типа <book-title>.
то конечно смысла нет. Какая разница есть плагин или нет?
Quote (Peter)
что истинные необукеры не ищут легких путей!
Мягко говоря , это глупо. Умный в гору не пойдет, умный гору обойдет. Только Русские могут создать сами себе проблему, а после ГЕРОИЧЕСКИ ее преодолеть. Я вышел из того возраста когда слушал байки про какой бы то ни было патриотизм. Предвкушая твой вопрос, отвечу. За державу обидно.А то что касается родина-мать... Так даже хреновая мать так со своими детьми не поступает.
Quote (Peter)
А что такое?
Да что то распух. Ноги отекли. Говорят сердечная недостаточность. Ща попозже скорую вызову, а то у нас по направлению не кладут. Мож ты после инфаркта когда курить бросил просто опух, а решил что толстеешь?
Организм себя ведет не предсказуемо... Сначала зубы ВСЕ болели недели 2. После так же быстро боль проша как и началась. Теперь отечность... Я просто ржу... А моя меня достала. Вот и сейчас каждые 5 минут, Вызывать?... Говорю подожди, она уже вызвала.