Войти
NeoBooker.ru
Добро пожаловать к нам в гости!
Наш сайт посвящён программе NeoBook, с помощью которой вы легко сможете создавать собственные мультимедиа-приложения без необходимости изучать сложные языки программирования! Зарегистрируйтесь, чтобы стать членом нашего сообщества.
Страница 1 из 212»
Модератор форума: Peter, DEMBEL 
Форум NeoBook » Всё о программе NeoBook » Мир NeoBook » Конвертер Fb2 в TXT (Как заставить удалять куски кода типа <book-title>)
Конвертер Fb2 в TXT
Woha28Дата: Ср, 08 Февраля 2012, 02:13 | Сообщение # 1
Участник
Подскажите как NB заставить удалять куски типа <book-title>.
Подскожите может есть какие плагины для работы со строками.
Стандартных команд типа заменить символы, удалить, не достаточно для реализации задуманого.
Кто может подсказать будте добры подскажите!


 
СообщениеПодскажите как NB заставить удалять куски типа <book-title>.
Подскожите может есть какие плагины для работы со строками.
Стандартных команд типа заменить символы, удалить, не достаточно для реализации задуманого.
Кто может подсказать будте добры подскажите!

Автор - Woha28
Дата добавления - 08 Февраля 2012 в 02:13
PeterДата: Ср, 08 Февраля 2012, 02:33 | Сообщение # 2
Админ NeoBook
Quote (Woha28)
заставить удалять куски типа

Где именно надо удалять?
Подозоеваю, что в коде HTML-страницы...
Quote (Woha28)
Стандартных команд типа заменить символы, удалить, не достаточно

Почему недостаточно?
В NB имеются вполне развитые средства для работы со строками.
Woha28, покажите - что вы пытались проделать.


- А вам какую операционку поставить - экспи, семерку или висту?
- Это ты сейчас о чем?
- Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный?
- Ну, конечно, надежный!
- Вот, значит - экспи, без вопросов! Сейчас сделаем...

(Улицы разбитых фонарей, сезон 10, серия 17)

Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!


При модном втюхе модоподдающимся начинает нравиться
 
Сообщение
Quote (Woha28)
заставить удалять куски типа

Где именно надо удалять?
Подозоеваю, что в коде HTML-страницы...
Quote (Woha28)
Стандартных команд типа заменить символы, удалить, не достаточно

Почему недостаточно?
В NB имеются вполне развитые средства для работы со строками.
Woha28, покажите - что вы пытались проделать.

Автор - Peter
Дата добавления - 08 Февраля 2012 в 02:33
Woha28Дата: Ср, 08 Февраля 2012, 02:38 | Сообщение # 3
Участник
Вот файл Fb2 to Txt.exe кинуть в:
C:\Users\Admin\AppData\Roaming\Microsoft\Windows\SendTo
Чёто не могу вложение файла зделать.
Прикрепления: Fb2_to_Txt.zip(2Kb)




Сообщение отредактировано
Woha28 - Ср, 08 Февраля 2012, 02:42
 
СообщениеВот файл Fb2 to Txt.exe кинуть в:
C:\Users\Admin\AppData\Roaming\Microsoft\Windows\SendTo
Чёто не могу вложение файла зделать.

Автор - Woha28
Дата добавления - 08 Февраля 2012 в 02:38
PeterДата: Ср, 08 Февраля 2012, 02:40 | Сообщение # 4
Админ NeoBook
FB2
Пардон, проглядел что именно надо обрабатывать.

Похоже, что здесь и впрямь может не хватить средств NB.
Нужно изучить этот Fb2


- А вам какую операционку поставить - экспи, семерку или висту?
- Это ты сейчас о чем?
- Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный?
- Ну, конечно, надежный!
- Вот, значит - экспи, без вопросов! Сейчас сделаем...

(Улицы разбитых фонарей, сезон 10, серия 17)

Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!


При модном втюхе модоподдающимся начинает нравиться
 
СообщениеFB2
Пардон, проглядел что именно надо обрабатывать.

Похоже, что здесь и впрямь может не хватить средств NB.
Нужно изучить этот Fb2

Автор - Peter
Дата добавления - 08 Февраля 2012 в 02:40
Woha28Дата: Ср, 08 Февраля 2012, 02:47 | Сообщение # 5
Участник
Вот как Fb2 выглядит в редакторе, почти как код HTML
Прикрепления: 1-__.zip(159Kb)


 
СообщениеВот как Fb2 выглядит в редакторе, почти как код HTML

Автор - Woha28
Дата добавления - 08 Февраля 2012 в 02:47
PeterДата: Ср, 08 Февраля 2012, 02:50 | Сообщение # 6
Админ NeoBook
Quote (Woha28)
Вот файл Fb2 to Txt.exe

Woha28, то, что вы показали в своем исходнике, не имеет никакого отношения к этому:
Quote (Woha28)
Подскажите как NB заставить удалять куски типа <book-title>.
Подскожите может есть какие плагины для работы со строками


Еще раз: что именно требуется сделать?


- А вам какую операционку поставить - экспи, семерку или висту?
- Это ты сейчас о чем?
- Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный?
- Ну, конечно, надежный!
- Вот, значит - экспи, без вопросов! Сейчас сделаем...

(Улицы разбитых фонарей, сезон 10, серия 17)

Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!


При модном втюхе модоподдающимся начинает нравиться
 
Сообщение
Quote (Woha28)
Вот файл Fb2 to Txt.exe

Woha28, то, что вы показали в своем исходнике, не имеет никакого отношения к этому:
Quote (Woha28)
Подскажите как NB заставить удалять куски типа <book-title>.
Подскожите может есть какие плагины для работы со строками


Еще раз: что именно требуется сделать?

Автор - Peter
Дата добавления - 08 Февраля 2012 в 02:50
Woha28Дата: Ср, 08 Февраля 2012, 02:59 | Сообщение # 7
Участник
Сохранить весь этот текст в текстовый файл, но только без кода типа:
<first-name>, <book-title>.

Добавлено (08 Февраля 2012, 02:59)
---------------------------------------------
Всё дело в том что постоянно читаю разные книги, на телефоне который читает только файлы *.txt в кодировке UTF8 но как кодировать из ANSI в UTF8 я уже нашел.


 
СообщениеСохранить весь этот текст в текстовый файл, но только без кода типа:
<first-name>, <book-title>.

Добавлено (08 Февраля 2012, 02:59)
---------------------------------------------
Всё дело в том что постоянно читаю разные книги, на телефоне который читает только файлы *.txt в кодировке UTF8 но как кодировать из ANSI в UTF8 я уже нашел.


Автор - Woha28
Дата добавления - 08 Февраля 2012 в 02:59
PeterДата: Ср, 08 Февраля 2012, 03:04 | Сообщение # 8
Админ NeoBook
Quote (Woha28)
Вот как Fb2 выглядит в редакторе, почти как код HTML

Понятно...
Надо разобраться где начинается и заканчивается "полезная часть", т.е. сам текст, и какие слова являются ключевыми.

В принципе, выделить текст можно, но, боюсь, что на больших "объемах" скорость "конвертации" может оказаться небольшой или низкой.

Добавлено (08 Февраля 2012, 03:04)
---------------------------------------------

Quote (Woha28)
как кодировать из ANSI в UTF8 я уже нашел.

А "вырезать ненужное" пробовали?


- А вам какую операционку поставить - экспи, семерку или висту?
- Это ты сейчас о чем?
- Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный?
- Ну, конечно, надежный!
- Вот, значит - экспи, без вопросов! Сейчас сделаем...

(Улицы разбитых фонарей, сезон 10, серия 17)

Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!


При модном втюхе модоподдающимся начинает нравиться
 
Сообщение
Quote (Woha28)
Вот как Fb2 выглядит в редакторе, почти как код HTML

Понятно...
Надо разобраться где начинается и заканчивается "полезная часть", т.е. сам текст, и какие слова являются ключевыми.

В принципе, выделить текст можно, но, боюсь, что на больших "объемах" скорость "конвертации" может оказаться небольшой или низкой.

Добавлено (08 Февраля 2012, 03:04)
---------------------------------------------

Quote (Woha28)
как кодировать из ANSI в UTF8 я уже нашел.

А "вырезать ненужное" пробовали?

Автор - Peter
Дата добавления - 08 Февраля 2012 в 03:04
Woha28Дата: Ср, 08 Февраля 2012, 03:09 | Сообщение # 9
Участник
Quote (Peter)
как кодировать из ANSI в UTF8 я уже нашел.

Кодировал командой:
Code

zmConvertString "AnsiToUtf8" "[Clipboard1]" "[Text]"

из плагина: zmFunctions.


 
Сообщение
Quote (Peter)
как кодировать из ANSI в UTF8 я уже нашел.

Кодировал командой:
Code

zmConvertString "AnsiToUtf8" "[Clipboard1]" "[Text]"

из плагина: zmFunctions.

Автор - Woha28
Дата добавления - 08 Февраля 2012 в 03:09
PeterДата: Ср, 08 Февраля 2012, 03:10 | Сообщение # 10
Админ NeoBook
Woha28, кстати, а вы "готовые к употреблению" программы пробовали?
Например, эту.

Или вы решили непременно написАть её самостоятельно на NB?


- А вам какую операционку поставить - экспи, семерку или висту?
- Это ты сейчас о чем?
- Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный?
- Ну, конечно, надежный!
- Вот, значит - экспи, без вопросов! Сейчас сделаем...

(Улицы разбитых фонарей, сезон 10, серия 17)

Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!


При модном втюхе модоподдающимся начинает нравиться
 
СообщениеWoha28, кстати, а вы "готовые к употреблению" программы пробовали?
Например, эту.

Или вы решили непременно написАть её самостоятельно на NB?

Автор - Peter
Дата добавления - 08 Февраля 2012 в 03:10
Woha28Дата: Ср, 08 Февраля 2012, 03:13 | Сообщение # 11
Участник
У меня в принципе есть чем конвертировать Fb2 в TXT прогой Fb2 to TXT.exe
просто хотелось попробовать сделать это NB.


 
СообщениеУ меня в принципе есть чем конвертировать Fb2 в TXT прогой Fb2 to TXT.exe
просто хотелось попробовать сделать это NB.

Автор - Woha28
Дата добавления - 08 Февраля 2012 в 03:13
PeterДата: Ср, 08 Февраля 2012, 03:14 | Сообщение # 12
Админ NeoBook
Quote (Woha28)
Кодировал командой:

Как "кодировал" это понятно, а вырезать ненужное из текста пробовали?


- А вам какую операционку поставить - экспи, семерку или висту?
- Это ты сейчас о чем?
- Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный?
- Ну, конечно, надежный!
- Вот, значит - экспи, без вопросов! Сейчас сделаем...

(Улицы разбитых фонарей, сезон 10, серия 17)

Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!


При модном втюхе модоподдающимся начинает нравиться
 
Сообщение
Quote (Woha28)
Кодировал командой:

Как "кодировал" это понятно, а вырезать ненужное из текста пробовали?

Автор - Peter
Дата добавления - 08 Февраля 2012 в 03:14
Woha28Дата: Ср, 08 Февраля 2012, 03:15 | Сообщение # 13
Участник
пробовал но так решение и не нашел!

 
Сообщениепробовал но так решение и не нашел!

Автор - Woha28
Дата добавления - 08 Февраля 2012 в 03:15
PeterДата: Ср, 08 Февраля 2012, 03:17 | Сообщение # 14
Админ NeoBook
Quote (Woha28)
просто хотелось попробовать сделать это NB.

Это похвально (хоть и нерационально), но я так и не могу понять: уже пробовали или только хотите попробовать?
:)

Добавлено (08 Февраля 2012, 03:17)
---------------------------------------------

Quote (Woha28)
пробовал но так решение и не нашел!

Вот об этом я и говорил:
Quote (Peter)
Woha28, покажите - что вы пытались проделать.


Предложение не снимается.


- А вам какую операционку поставить - экспи, семерку или висту?
- Это ты сейчас о чем?
- Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный?
- Ну, конечно, надежный!
- Вот, значит - экспи, без вопросов! Сейчас сделаем...

(Улицы разбитых фонарей, сезон 10, серия 17)

Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!


При модном втюхе модоподдающимся начинает нравиться
 
Сообщение
Quote (Woha28)
просто хотелось попробовать сделать это NB.

Это похвально (хоть и нерационально), но я так и не могу понять: уже пробовали или только хотите попробовать?
:)

Добавлено (08 Февраля 2012, 03:17)
---------------------------------------------

Quote (Woha28)
пробовал но так решение и не нашел!

Вот об этом я и говорил:
Quote (Peter)
Woha28, покажите - что вы пытались проделать.


Предложение не снимается.

Автор - Peter
Дата добавления - 08 Февраля 2012 в 03:17
Woha28Дата: Ср, 08 Февраля 2012, 03:32 | Сообщение # 15
Участник
Пробовал файл разделял комондой:
Code
StrParse "[CommandLine]" "[#13]" "[Path]" "[Path-Kol]"
FileRead "[Path2]" "All" "[File]"
StrParse "[File]" ">" "[Simvol]" "[w]
Loop "1" "[w]" "[i]"
StrIns "[Simvol[i]]" "[File]" "[i]" "[File-txt]"

но это очень долго.

Добавлено (08 Февраля 2012, 03:32)
---------------------------------------------
Переменная [File] содержит текст типа:





Сообщение отредактировано
Woha28 - Ср, 08 Февраля 2012, 03:27
 
СообщениеПробовал файл разделял комондой:
Code
StrParse "[CommandLine]" "[#13]" "[Path]" "[Path-Kol]"
FileRead "[Path2]" "All" "[File]"
StrParse "[File]" ">" "[Simvol]" "[w]
Loop "1" "[w]" "[i]"
StrIns "[Simvol[i]]" "[File]" "[i]" "[File-txt]"

но это очень долго.

Добавлено (08 Февраля 2012, 03:32)
---------------------------------------------
Переменная [File] содержит текст типа:


Автор - Woha28
Дата добавления - 08 Февраля 2012 в 03:32
PeterДата: Ср, 08 Февраля 2012, 05:05 | Сообщение # 16
Админ NeoBook
Quote (Woha28)
но это очень долго.

Это не просто долго, а вообще работать не должно.

Нужно разобрать структуру этих Fb2-файлов, чтобы понять с какого места и как конкретно производить выделение "полезного текста".
Принципиально задача решаемая, но:
Quote (Peter)
на больших "объемах" скорость "конвертации" может оказаться небольшой или низкой.

потому-что скорость работы скриптового языка NB несоизмеримо ниже машинного у обычной программы.
Учитывая, что тексты книг весьма и весьма немаленькие, я бы воспользовался уже готовой программой.

А стратегиечски решение на NB может выглядеть примерно так: делим текст на строки, а затем в каждой строке ищем те части, которые начинаются с "<" и заканчиваются ">" , и вырезаем (вместе с этими знаками) то, что внутри.
Можно и напрямую (без разбивки на строки) парсить текст и "вырезать".
Можно, наоборот - вырезать то, что между ">" и "<"...

Что в реальности окажется быстрее пока сказать сложно, но в любом случае, процесс будет не столь быстрым, как того хотелось бы.


- А вам какую операционку поставить - экспи, семерку или висту?
- Это ты сейчас о чем?
- Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный?
- Ну, конечно, надежный!
- Вот, значит - экспи, без вопросов! Сейчас сделаем...

(Улицы разбитых фонарей, сезон 10, серия 17)

Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!


При модном втюхе модоподдающимся начинает нравиться
 
Сообщение
Quote (Woha28)
но это очень долго.

Это не просто долго, а вообще работать не должно.

Нужно разобрать структуру этих Fb2-файлов, чтобы понять с какого места и как конкретно производить выделение "полезного текста".
Принципиально задача решаемая, но:
Quote (Peter)
на больших "объемах" скорость "конвертации" может оказаться небольшой или низкой.

потому-что скорость работы скриптового языка NB несоизмеримо ниже машинного у обычной программы.
Учитывая, что тексты книг весьма и весьма немаленькие, я бы воспользовался уже готовой программой.

А стратегиечски решение на NB может выглядеть примерно так: делим текст на строки, а затем в каждой строке ищем те части, которые начинаются с "<" и заканчиваются ">" , и вырезаем (вместе с этими знаками) то, что внутри.
Можно и напрямую (без разбивки на строки) парсить текст и "вырезать".
Можно, наоборот - вырезать то, что между ">" и "<"...

Что в реальности окажется быстрее пока сказать сложно, но в любом случае, процесс будет не столь быстрым, как того хотелось бы.

Автор - Peter
Дата добавления - 08 Февраля 2012 в 05:05
antonДата: Ср, 08 Февраля 2012, 08:22 | Сообщение # 17
Ветеран форума
А если парсек Alienа применить? По моему это ему по силам...
тут тема

Добавлено (08 Февраля 2012, 08:22)
---------------------------------------------



"Вы знаете, нам очень понравились все варианты, что вы прислали. Даже не знаем, что выбрать… А может попробуем объединить все три логотипа в один?"
 
СообщениеА если парсек Alienа применить? По моему это ему по силам...
тут тема

Добавлено (08 Февраля 2012, 08:22)
---------------------------------------------


Автор - anton
Дата добавления - 08 Февраля 2012 в 08:22
DEMBELДата: Ср, 08 Февраля 2012, 10:53 | Сообщение # 18
Наш дизайнер


Как задавать вопросы

Win7x64 SP1 Neobook v5.70 (Trial)
WinXP SP3 Neobook v5.62
 
Сообщение

Автор - DEMBEL
Дата добавления - 08 Февраля 2012 в 10:53
PeterДата: Ср, 08 Февраля 2012, 11:26 | Сообщение # 19
Админ NeoBook
Quote (anton)
По моему это ему по силам...

Там в обоих случаях (и в функции мишема) применен скриптовый язык NB, а это уже без разницы, т.к. все это чисто вопрос "оформления кода".
Единственная надежда - JScript.
Но и это точно так же проиграет в скорости машинному коду.
К тому же, во всех случаях решения через NB потребуется доработка кода.

Тут где-то мелькала тема про плагин с "регулярками", может его попробовать...

Правда, при наличии специальных программ для решения именно этой конкретной задачи (по сабжу), тема превращается в своего рода "упражнение", что ли...

Но, как я понял, автор сабжа реально и не пытался самостоятельно решить задачу, т.к. приведенный им код совершенно "не в тему".


- А вам какую операционку поставить - экспи, семерку или висту?
- Это ты сейчас о чем?
- Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный?
- Ну, конечно, надежный!
- Вот, значит - экспи, без вопросов! Сейчас сделаем...

(Улицы разбитых фонарей, сезон 10, серия 17)

Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!


При модном втюхе модоподдающимся начинает нравиться
 
Сообщение
Quote (anton)
По моему это ему по силам...

Там в обоих случаях (и в функции мишема) применен скриптовый язык NB, а это уже без разницы, т.к. все это чисто вопрос "оформления кода".
Единственная надежда - JScript.
Но и это точно так же проиграет в скорости машинному коду.
К тому же, во всех случаях решения через NB потребуется доработка кода.

Тут где-то мелькала тема про плагин с "регулярками", может его попробовать...

Правда, при наличии специальных программ для решения именно этой конкретной задачи (по сабжу), тема превращается в своего рода "упражнение", что ли...

Но, как я понял, автор сабжа реально и не пытался самостоятельно решить задачу, т.к. приведенный им код совершенно "не в тему".

Автор - Peter
Дата добавления - 08 Февраля 2012 в 11:26
mishemДата: Ср, 08 Февраля 2012, 13:23 | Сообщение # 20
Эксперт форума
Вот эо вы тему развернули. %)
Надо то, удалить "шапку" оставив название, автора.
Удалить картинки от тега <binary и до конца.
Составить список тегов и через цикл их удалить командой
StrReplace
Или если хочется после знать что и где находилось заменить теги на соответствующие значения.
Допустим
<author> = Автор:
<book-title> = Название:
<cite> = цитата:
и т.д.
Если же использовать парсер и просто даление по символам, то это займет очень много времени.
Единственное что можно сделать парсером, то это после замены всех тегов проити по тексту на поиск оставшегося мусора. <*>.

Кстати, Петр, насчет плагина по тексту. Давно говорил что не хватает текстовых функций в НБ. Для мелочей, хватает. Для вот таких больших вариантов, маловато будет.

Не плохо было бы сделать поиск, замена, и удаление символов по маске.
В данном случае можно было бы заменить, удалить символы по <*> = удалить все теги.
Или заменить все теги <*title> на Заголовок: и т.д.

Не подумай что это очень редко надо. Кто с текстом связывается, тот знает на сколько этих функций не хватает. Да и не только этих.


Не хочешь читать хелп?

Если хелп и форум не помогли, тогда все ответы здесь



Если вы думаете, что сможете — вы сможете, если думаете, что нет — вы правы.
 
СообщениеВот эо вы тему развернули. %)
Надо то, удалить "шапку" оставив название, автора.
Удалить картинки от тега <binary и до конца.
Составить список тегов и через цикл их удалить командой
StrReplace
Или если хочется после знать что и где находилось заменить теги на соответствующие значения.
Допустим
<author> = Автор:
<book-title> = Название:
<cite> = цитата:
и т.д.
Если же использовать парсер и просто даление по символам, то это займет очень много времени.
Единственное что можно сделать парсером, то это после замены всех тегов проити по тексту на поиск оставшегося мусора. <*>.

Кстати, Петр, насчет плагина по тексту. Давно говорил что не хватает текстовых функций в НБ. Для мелочей, хватает. Для вот таких больших вариантов, маловато будет.

Не плохо было бы сделать поиск, замена, и удаление символов по маске.
В данном случае можно было бы заменить, удалить символы по <*> = удалить все теги.
Или заменить все теги <*title> на Заголовок: и т.д.

Не подумай что это очень редко надо. Кто с текстом связывается, тот знает на сколько этих функций не хватает. Да и не только этих.

Автор - mishem
Дата добавления - 08 Февраля 2012 в 13:23
PeterДата: Ср, 08 Февраля 2012, 14:30 | Сообщение # 21
Админ NeoBook
Quote (mishem)
Не плохо было бы сделать поиск, замена, и удаление символов по маске.
В данном случае можно было бы заменить, удалить символы по <*> = удалить все теги.
Или заменить все теги <*title> на Заголовок: и т.д.

А чем не устраивает:
Quote (mishem)
Составить список тегов и через цикл их удалить командой
StrReplace

:)

Quote (mishem)
тот знает на сколько этих функций не хватает. Да и не только этих.

Так и не пойму - чего же именно не хватает-то?
%)


- А вам какую операционку поставить - экспи, семерку или висту?
- Это ты сейчас о чем?
- Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный?
- Ну, конечно, надежный!
- Вот, значит - экспи, без вопросов! Сейчас сделаем...

(Улицы разбитых фонарей, сезон 10, серия 17)

Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!


При модном втюхе модоподдающимся начинает нравиться
 
Сообщение
Quote (mishem)
Не плохо было бы сделать поиск, замена, и удаление символов по маске.
В данном случае можно было бы заменить, удалить символы по <*> = удалить все теги.
Или заменить все теги <*title> на Заголовок: и т.д.

А чем не устраивает:
Quote (mishem)
Составить список тегов и через цикл их удалить командой
StrReplace

:)

Quote (mishem)
тот знает на сколько этих функций не хватает. Да и не только этих.

Так и не пойму - чего же именно не хватает-то?
%)

Автор - Peter
Дата добавления - 08 Февраля 2012 в 14:30
mishemДата: Ср, 08 Февраля 2012, 14:45 | Сообщение # 22
Эксперт форума


Сейчас посмотрел повнимательнее. Если автору нужно только читать, и не нужна никакая информация больше. Тоесть только для себя, а не для распространения, то обрабатывать текст можно только тот, который находиться между тегами <body></body>

Вот список тегов, правда не уверен что все )))


Такие теги как <image, <a type и т.д. придется обрабатывать отдельно.


Не хочешь читать хелп?

Если хелп и форум не помогли, тогда все ответы здесь



Если вы думаете, что сможете — вы сможете, если думаете, что нет — вы правы.
 
Сообщение


Сейчас посмотрел повнимательнее. Если автору нужно только читать, и не нужна никакая информация больше. Тоесть только для себя, а не для распространения, то обрабатывать текст можно только тот, который находиться между тегами <body></body>

Вот список тегов, правда не уверен что все )))


Такие теги как <image, <a type и т.д. придется обрабатывать отдельно.

Автор - mishem
Дата добавления - 08 Февраля 2012 в 14:45
DEMBELДата: Ср, 08 Февраля 2012, 14:55 | Сообщение # 23
Наш дизайнер
вообще это работа для регулярных выражений, для этого есть как функции различного типа, так и плагин. Регулярка работает достаточно быстро.

Добавлено (08 Февраля 2012, 14:55)
---------------------------------------------
самое сложное - составить правильно шаблон для замены


Как задавать вопросы

Win7x64 SP1 Neobook v5.70 (Trial)
WinXP SP3 Neobook v5.62
 
Сообщениевообще это работа для регулярных выражений, для этого есть как функции различного типа, так и плагин. Регулярка работает достаточно быстро.

Добавлено (08 Февраля 2012, 14:55)
---------------------------------------------
самое сложное - составить правильно шаблон для замены


Автор - DEMBEL
Дата добавления - 08 Февраля 2012 в 14:55
mishemДата: Ср, 08 Февраля 2012, 15:27 | Сообщение # 24
Эксперт форума
Quote (DEMBEL)
Регулярка работает достаточно быстро.

Сколько я не пробовал понять смысл регулярки, так и не вышло. Вроде все понятно, и в тот же момент...

Quote (DEMBEL)
вообще это работа для регулярных выражений, для этого есть как функции различного типа

Нууу , так скоро можно всех будет посылать изучать дельфи или с++. ;)
Получается что бы что то сделать в НБ, надо изучить PHP, HTML, CSS, яву ну и т.д.


Не хочешь читать хелп?

Если хелп и форум не помогли, тогда все ответы здесь



Если вы думаете, что сможете — вы сможете, если думаете, что нет — вы правы.
 
Сообщение
Quote (DEMBEL)
Регулярка работает достаточно быстро.

Сколько я не пробовал понять смысл регулярки, так и не вышло. Вроде все понятно, и в тот же момент...

Quote (DEMBEL)
вообще это работа для регулярных выражений, для этого есть как функции различного типа

Нууу , так скоро можно всех будет посылать изучать дельфи или с++. ;)
Получается что бы что то сделать в НБ, надо изучить PHP, HTML, CSS, яву ну и т.д.

Автор - mishem
Дата добавления - 08 Февраля 2012 в 15:27
PeterДата: Ср, 08 Февраля 2012, 15:41 | Сообщение # 25
Админ NeoBook
Quote (mishem)
через плагин по маске <*> было бы быстрее чем

Да, через плагин будет быстрее.
Любые портянки NB-скриптов, будут работать многократно медленнее, чем машинный код плагина.
Но, если так рассуждать, то можно вообще дойти до того, что потребуются функции "на заказ", и заточенные под конкретную рАзовую задачу, а о самом языке NB можно будет забыть.

mishem, не забывай, что истинные необукеры не ищут легких путей!
:)

Когда NB начинает реально не хватать, автоматом напрашивается мысль: не разумнее ли, уж тогда заняться изучением нормального языка?
Ограничений, по крайней мере потенциально, не будет.

Quote (DEMBEL)
вообще это работа для регулярных выражений

Совершенно верно!

Я пытаюсь сейчас смотреть в сторону "регулярок", но пока мало чего в этом смыслю, все в процессе познания...


- А вам какую операционку поставить - экспи, семерку или висту?
- Это ты сейчас о чем?
- Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный?
- Ну, конечно, надежный!
- Вот, значит - экспи, без вопросов! Сейчас сделаем...

(Улицы разбитых фонарей, сезон 10, серия 17)

Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!


При модном втюхе модоподдающимся начинает нравиться
 
Сообщение
Quote (mishem)
через плагин по маске <*> было бы быстрее чем

Да, через плагин будет быстрее.
Любые портянки NB-скриптов, будут работать многократно медленнее, чем машинный код плагина.
Но, если так рассуждать, то можно вообще дойти до того, что потребуются функции "на заказ", и заточенные под конкретную рАзовую задачу, а о самом языке NB можно будет забыть.

mishem, не забывай, что истинные необукеры не ищут легких путей!
:)

Когда NB начинает реально не хватать, автоматом напрашивается мысль: не разумнее ли, уж тогда заняться изучением нормального языка?
Ограничений, по крайней мере потенциально, не будет.

Quote (DEMBEL)
вообще это работа для регулярных выражений

Совершенно верно!

Я пытаюсь сейчас смотреть в сторону "регулярок", но пока мало чего в этом смыслю, все в процессе познания...

Автор - Peter
Дата добавления - 08 Февраля 2012 в 15:41
mishemДата: Ср, 08 Февраля 2012, 15:57 | Сообщение # 26
Эксперт форума
Quote (Peter)
не разумнее ли, уж тогда заняться изучением нормального языка?

Дык с одной стороны хочется, с другой, засыпаю я при изучении теории. :(
Странице на 2ой ловлю себя на мысли что просто читаю а сам думаю совсем о другом. :D

По теме
Code

FileOpenBox "Открыть" "fb2|*.fb2" "[LastDir]" "[File]" ""
FileRead "[File]" "All" "[text]"
SearchStr "<body>" "[text]" "[poisk]" ""
SearchStr "</body>" "[text]" "[poisk2]" ""
SubStr "[text]" "[poisk]" "[poisk2]-[poisk]" "[text]"
SetVar "[poisk]" ""
SetVar "[tegi]" "<p>|</p>|<section>|</section>|<empty-line/>|<epigraph>|</epigraph>|<text-author>|</text-author>|<description>|<title-info>|<genre>|</genre>|<author>|<first-name>|</first-name>|<middle-name>|</middle-name>|<last-name>|</last-name>|</author>|<book-title>|</book-title>|<annotation>|</annotation>|</title-info>|</description>|<body>|<poem>|<stanza>|</v>|</stanza>|</a>|<strong>|</strong>|<cite>|</cite>|</body>"
StrParse "[tegi]" "|" "[tegi]" "[tegi_K]"
Loop "1" "[tegi_K]" "[i]"
   StrReplace "[text]" "[tegi[i]]" "[#32]" "[text]" ""
EndLoop
DeleteArray "[tegi]" "All"
StrReplace "[text]" "<v>" "[#13][#10]" "[text]" ""
StrReplace "[text]" "<title>" "[#13][#10]" "[text]" ""
StrReplace "[text]" "</title>" "[#13][#10]" "[text]" ""
StrReplace "[text]" "</poem>" "[#13][#10]" "[text]" ""
StrReplace "[text]" "<subtitle>" "[#13][#10]" "[text]" ""
StrReplace "[text]" "</subtitle>" "[#13][#10]" "[text]" ""
SetVar "[poisk]" ""
While "[poisk]" "<>" "0"
  SearchStr "<" "[text]" "[poisk]" ""
  SearchStr ">" "[text]" "[poisk2]" ""
  StrDel "[text]" "[poisk]" "[poisk2]-[poisk]+1" "[text]"
EndWhile
FileSaveBox "Сохранить как..." "TXT|*.txt" "[LastDir]" "[File]"
FileWrite "[File]" "All" "[text]"


Файл в 2 мб. при закрытом отладчике обрабатывает за 6-7 сек. При открытом 40. :)
Если скомпилирвать, мж еще быстрей будет.


Не хочешь читать хелп?

Если хелп и форум не помогли, тогда все ответы здесь



Если вы думаете, что сможете — вы сможете, если думаете, что нет — вы правы.
 
Сообщение
Quote (Peter)
не разумнее ли, уж тогда заняться изучением нормального языка?

Дык с одной стороны хочется, с другой, засыпаю я при изучении теории. :(
Странице на 2ой ловлю себя на мысли что просто читаю а сам думаю совсем о другом. :D

По теме
Code

FileOpenBox "Открыть" "fb2|*.fb2" "[LastDir]" "[File]" ""
FileRead "[File]" "All" "[text]"
SearchStr "<body>" "[text]" "[poisk]" ""
SearchStr "</body>" "[text]" "[poisk2]" ""
SubStr "[text]" "[poisk]" "[poisk2]-[poisk]" "[text]"
SetVar "[poisk]" ""
SetVar "[tegi]" "<p>|</p>|<section>|</section>|<empty-line/>|<epigraph>|</epigraph>|<text-author>|</text-author>|<description>|<title-info>|<genre>|</genre>|<author>|<first-name>|</first-name>|<middle-name>|</middle-name>|<last-name>|</last-name>|</author>|<book-title>|</book-title>|<annotation>|</annotation>|</title-info>|</description>|<body>|<poem>|<stanza>|</v>|</stanza>|</a>|<strong>|</strong>|<cite>|</cite>|</body>"
StrParse "[tegi]" "|" "[tegi]" "[tegi_K]"
Loop "1" "[tegi_K]" "[i]"
   StrReplace "[text]" "[tegi[i]]" "[#32]" "[text]" ""
EndLoop
DeleteArray "[tegi]" "All"
StrReplace "[text]" "<v>" "[#13][#10]" "[text]" ""
StrReplace "[text]" "<title>" "[#13][#10]" "[text]" ""
StrReplace "[text]" "</title>" "[#13][#10]" "[text]" ""
StrReplace "[text]" "</poem>" "[#13][#10]" "[text]" ""
StrReplace "[text]" "<subtitle>" "[#13][#10]" "[text]" ""
StrReplace "[text]" "</subtitle>" "[#13][#10]" "[text]" ""
SetVar "[poisk]" ""
While "[poisk]" "<>" "0"
  SearchStr "<" "[text]" "[poisk]" ""
  SearchStr ">" "[text]" "[poisk2]" ""
  StrDel "[text]" "[poisk]" "[poisk2]-[poisk]+1" "[text]"
EndWhile
FileSaveBox "Сохранить как..." "TXT|*.txt" "[LastDir]" "[File]"
FileWrite "[File]" "All" "[text]"


Файл в 2 мб. при закрытом отладчике обрабатывает за 6-7 сек. При открытом 40. :)
Если скомпилирвать, мж еще быстрей будет.

Автор - mishem
Дата добавления - 08 Февраля 2012 в 15:57
PeterДата: Ср, 08 Февраля 2012, 16:16 | Сообщение # 27
Админ NeoBook


Quote (mishem)
Если скомпилирвать, мж еще быстрей будет

Вот и замечательно!
В чем проблема-то?
Ну, будет плагином побыстрее на пару секунд...
Это так критично?
:)


- А вам какую операционку поставить - экспи, семерку или висту?
- Это ты сейчас о чем?
- Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный?
- Ну, конечно, надежный!
- Вот, значит - экспи, без вопросов! Сейчас сделаем...

(Улицы разбитых фонарей, сезон 10, серия 17)

Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!


При модном втюхе модоподдающимся начинает нравиться
 
Сообщение


Quote (mishem)
Если скомпилирвать, мж еще быстрей будет

Вот и замечательно!
В чем проблема-то?
Ну, будет плагином побыстрее на пару секунд...
Это так критично?
:)

Автор - Peter
Дата добавления - 08 Февраля 2012 в 16:16
mishemДата: Ср, 08 Февраля 2012, 16:44 | Сообщение # 28
Эксперт форума
Quote (Peter)
Это так критично?

Да!!!
Я не за этот случай говорю. Это просто как пример получилось.
Представь что нужно найти такие как <image, <a type и т.д.
Не, в принципе я давно уже понял что эту тему нечего поднимать.
Ладно, проехали.


Не хочешь читать хелп?

Если хелп и форум не помогли, тогда все ответы здесь



Если вы думаете, что сможете — вы сможете, если думаете, что нет — вы правы.
 
Сообщение
Quote (Peter)
Это так критично?

Да!!!
Я не за этот случай говорю. Это просто как пример получилось.
Представь что нужно найти такие как <image, <a type и т.д.
Не, в принципе я давно уже понял что эту тему нечего поднимать.
Ладно, проехали.

Автор - mishem
Дата добавления - 08 Февраля 2012 в 16:44
PeterДата: Ср, 08 Февраля 2012, 16:53 | Сообщение # 29
Админ NeoBook
Quote (mishem)
Это просто как пример получилось.

Ну ведь получилось же!
;)
Quote (mishem)
Представь что нужно найти такие как <image, <a type и т.д.

Может через "регулярки" это можно делать...
Quote (mishem)
эту тему нечего поднимать.

Тему поднимать есть смысл, когда в ней реально есть смысл, а не для того, "чтобы было".



- А вам какую операционку поставить - экспи, семерку или висту?
- Это ты сейчас о чем?
- Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный?
- Ну, конечно, надежный!
- Вот, значит - экспи, без вопросов! Сейчас сделаем...

(Улицы разбитых фонарей, сезон 10, серия 17)

Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!


При модном втюхе модоподдающимся начинает нравиться
 
Сообщение
Quote (mishem)
Это просто как пример получилось.

Ну ведь получилось же!
;)
Quote (mishem)
Представь что нужно найти такие как <image, <a type и т.д.

Может через "регулярки" это можно делать...
Quote (mishem)
эту тему нечего поднимать.

Тему поднимать есть смысл, когда в ней реально есть смысл, а не для того, "чтобы было".


Автор - Peter
Дата добавления - 08 Февраля 2012 в 16:53
mishemДата: Ср, 08 Февраля 2012, 17:33 | Сообщение # 30
Эксперт форума


Не хочешь читать хелп?

Если хелп и форум не помогли, тогда все ответы здесь



Если вы думаете, что сможете — вы сможете, если думаете, что нет — вы правы.
 
Сообщение

Автор - mishem
Дата добавления - 08 Февраля 2012 в 17:33
Форум NeoBook » Всё о программе NeoBook » Мир NeoBook » Конвертер Fb2 в TXT (Как заставить удалять куски кода типа <book-title>)
Страница 1 из 212»
Поиск: