Войти
NeoBooker.ru
Добро пожаловать к нам в гости!
Наш сайт посвящён программе NeoBook, с помощью которой вы легко сможете создавать собственные мультимедиа-приложения без необходимости изучать сложные языки программирования! Зарегистрируйтесь, чтобы стать членом нашего сообщества.
  • Страница 1 из 3
  • 1
  • 2
  • 3
  • »
Модератор форума: Peter, DEMBEL, YURIY  
Возможно ли в NB-проекте определить раскладку букв в тексте?
ВадимДата: Пт, 28 Января 2011, 23:03 | Сообщение # 1
Генератор идей
Возможно ли средствами NB при анализе готового текста определить раскладку (кириллица-латиница) в какой вводился тот или иной символ?

Пока что это для меня чисто теоретический вопрос, но хотелось бы знать - возможно это или нет.
Поясню задачу. Различные программные системы направленные на поиск плагиата в текстах научных работ спорят с желанием находчивых студентов и нерадивых аспирантов содрать готовый текст из сети Интернет и выдать за свой.
Находчивые студенты придумали, в частности, такой трюк: если, к примеру, заменить все русские "с" на латинские "с", то визуально в тексте разницы нет, а система "антиплагиат" уже не видит заимствование...
В antiplagiat.ru утверждают, что их систему уже нельзя обмануть.

Однако мне стало любопытно - возможно ли, например, с помощью NB сделать так, чтобы после обработки проверяемого файла, символы, написанные латиницей, выделялись бы цветным шрифтом или маркером? Так можно было бы увидеть - пытается ли ловкий студент стать находчивым, т.е. надуть систему данным способом.

Берем, скажем, доковский файл (присланный реферат), переводим его в rtf, а затем надо как-то определить символ какой раскладки используется, если английский, то применяем к нему форматирование.
Это возможно?

P.S.: Конечно, экспериментальным путем я бы мог проверить последнюю гипотезу, но может быть у кого-то уже есть ответ?


Бесплатный онлайн курс программирования в VisualNEO Win (NeoBook)
 
СообщениеВозможно ли средствами NB при анализе готового текста определить раскладку (кириллица-латиница) в какой вводился тот или иной символ?

Пока что это для меня чисто теоретический вопрос, но хотелось бы знать - возможно это или нет.
Поясню задачу. Различные программные системы направленные на поиск плагиата в текстах научных работ спорят с желанием находчивых студентов и нерадивых аспирантов содрать готовый текст из сети Интернет и выдать за свой.
Находчивые студенты придумали, в частности, такой трюк: если, к примеру, заменить все русские "с" на латинские "с", то визуально в тексте разницы нет, а система "антиплагиат" уже не видит заимствование...
В antiplagiat.ru утверждают, что их систему уже нельзя обмануть.

Однако мне стало любопытно - возможно ли, например, с помощью NB сделать так, чтобы после обработки проверяемого файла, символы, написанные латиницей, выделялись бы цветным шрифтом или маркером? Так можно было бы увидеть - пытается ли ловкий студент стать находчивым, т.е. надуть систему данным способом.

Берем, скажем, доковский файл (присланный реферат), переводим его в rtf, а затем надо как-то определить символ какой раскладки используется, если английский, то применяем к нему форматирование.
Это возможно?

P.S.: Конечно, экспериментальным путем я бы мог проверить последнюю гипотезу, но может быть у кого-то уже есть ответ?


Автор - Вадим
Дата добавления - 28 Января 2011 в 23:03
Alex3AДата: Пт, 28 Января 2011, 23:40 | Сообщение # 2
Друг клуба ММВ
Вадим, русские и ангельские букавы могут выглядеть одинаково, но коды у них разные. то есть диапазоны кодов, следовательно твоя задача имеет решение. :D
В нб наверное должна быть функция дающая код символа, вот с ее помощью и попробуй это реализовать. Естественно, текст нужно привести к какому либо стандарту, по кодировке.

Добавлено (28 Январь 2011, 23:32)
---------------------------------------------
посмотри тут

Добавлено (28 Январь 2011, 23:40)
---------------------------------------------
Win(cp1251) Unicode KOI8-R DOS,cp866 (альтернативная) IS08859-5 (основная) Mac
А C0 0410 E1 80 B0 80
если втречается код символа меньше чем код буквы А , и он не входит в диапазон цифр и знаков, и управляющих символов, то текст содержит английские букавы.

 
СообщениеВадим, русские и ангельские букавы могут выглядеть одинаково, но коды у них разные. то есть диапазоны кодов, следовательно твоя задача имеет решение. :D
В нб наверное должна быть функция дающая код символа, вот с ее помощью и попробуй это реализовать. Естественно, текст нужно привести к какому либо стандарту, по кодировке.

Добавлено (28 Январь 2011, 23:32)
---------------------------------------------
посмотри тут

Добавлено (28 Январь 2011, 23:40)
---------------------------------------------
Win(cp1251) Unicode KOI8-R DOS,cp866 (альтернативная) IS08859-5 (основная) Mac
А C0 0410 E1 80 B0 80
если втречается код символа меньше чем код буквы А , и он не входит в диапазон цифр и знаков, и управляющих символов, то текст содержит английские букавы.


Автор - Alex3A
Дата добавления - 28 Января 2011 в 23:40
AlienДата: Пт, 28 Января 2011, 23:42 | Сообщение # 3
Quote (Вадим)
Это возможно?

конечно возможно, почему бы и нет? :)
 
Сообщение
Quote (Вадим)
Это возможно?

конечно возможно, почему бы и нет? :)

Автор - Alien
Дата добавления - 28 Января 2011 в 23:42
DEMBELДата: Пт, 28 Января 2011, 23:49 | Сообщение # 4
Наш дизайнер
Теоретически (да и наверное практически) реализовать возможно, но это же придется каждый символ перебирать да проверять, да выделять, мне кажется эта штука медленно будет работать с обьемными текстами, да еще и с rtf, где своих посторонних тегов (и на англ к тому же) помимо текста много, и они мешаться будут. вероятно, в этом есть смысл разве что делать внутри плага и с чистым текстом.

Как задавать вопросы

Win7x64 SP1 Neobook v5.70 (Trial)
WinXP SP3 Neobook v5.62
 
СообщениеТеоретически (да и наверное практически) реализовать возможно, но это же придется каждый символ перебирать да проверять, да выделять, мне кажется эта штука медленно будет работать с обьемными текстами, да еще и с rtf, где своих посторонних тегов (и на англ к тому же) помимо текста много, и они мешаться будут. вероятно, в этом есть смысл разве что делать внутри плага и с чистым текстом.

Автор - DEMBEL
Дата добавления - 28 Января 2011 в 23:49
PeterДата: Сб, 29 Января 2011, 00:03 | Сообщение # 5
Админ NeoBook
Quote (Вадим)
Это возможно?

Теоретически все возможно!
А практически...
Поиск английских символов с одновременным форматированием RTF-текста - специализированная задача для целого текстового процессора, и естесственно, что созданием подобного "чуда в перьях" никто заниматься, без нужды, не станет!
:D
Quote (DEMBEL)
внутри плага и с чистым текстом

Именно - с чистым текстом, и то всего-лишь простой поиск "пиратских" символов.


- А вам какую операционку поставить - экспи, семерку или висту?
- Это ты сейчас о чем?
- Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный?
- Ну, конечно, надежный!
- Вот, значит - экспи, без вопросов! Сейчас сделаем...

(Улицы разбитых фонарей, сезон 10, серия 17)

Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!


При модном втюхе модоподдающимся начинает нравиться
 
Сообщение
Quote (Вадим)
Это возможно?

Теоретически все возможно!
А практически...
Поиск английских символов с одновременным форматированием RTF-текста - специализированная задача для целого текстового процессора, и естесственно, что созданием подобного "чуда в перьях" никто заниматься, без нужды, не станет!
:D
Quote (DEMBEL)
внутри плага и с чистым текстом

Именно - с чистым текстом, и то всего-лишь простой поиск "пиратских" символов.

Автор - Peter
Дата добавления - 29 Января 2011 в 00:03
Alex3AДата: Сб, 29 Января 2011, 00:09 | Сообщение # 6
Друг клуба ММВ
Quote (Peter)
Именно - с чистым текстом, и то всего-лишь простой поиск "пиратских" символов.

Естественно с чистым, и приведеным к нужной кодировке, ну и в случае нужности, можно и автозамену сделать.
 
Сообщение
Quote (Peter)
Именно - с чистым текстом, и то всего-лишь простой поиск "пиратских" символов.

Естественно с чистым, и приведеным к нужной кодировке, ну и в случае нужности, можно и автозамену сделать.

Автор - Alex3A
Дата добавления - 29 Января 2011 в 00:09
СергейДата: Сб, 29 Января 2011, 00:16 | Сообщение # 7
Необукер
возможно, но исполнить, да еще на НБ это архисложная задача...
если док перегнать в ртф и открыть его в НБ, то можно проанализировать перебором.
Пример слова Наскок
Quote
Наскок
Hacкoк
Hackok

\'ed\'e0\'f1\'ea\'ee\'ea
\'edac\'ea o\'ea
Hackok


Но речь же не о двух словах, а о многостраничных документов! А цикл такого масштаба на НБ, это зависание
Есть еще анализировать в анси, но это тоже самое

Quote
Чудо инет глючит %)


Сообщение отредактировано
Сергей - Сб, 29 Января 2011, 00:43
 
Сообщениевозможно, но исполнить, да еще на НБ это архисложная задача...
если док перегнать в ртф и открыть его в НБ, то можно проанализировать перебором.
Пример слова Наскок
Quote
Наскок
Hacкoк
Hackok

\'ed\'e0\'f1\'ea\'ee\'ea
\'edac\'ea o\'ea
Hackok


Но речь же не о двух словах, а о многостраничных документов! А цикл такого масштаба на НБ, это зависание
Есть еще анализировать в анси, но это тоже самое

Quote
Чудо инет глючит %)

Автор - Сергей
Дата добавления - 29 Января 2011 в 00:16
PeterДата: Сб, 29 Января 2011, 00:16 | Сообщение # 8
Админ NeoBook
Quote (Alex3A)
можно и автозамену сделать.

Это все можно и средствами самой NB сделать, вот только скорость обработки (особенно больших текстов) будет некудышная.

Но у Вадима-то, как всегда, "сверхзадача":

Quote (Вадим)
чтобы после обработки проверяемого файла, символы, написанные латиницей, выделялись бы цветным шрифтом или маркером?

Quote (Вадим)
Берем, скажем, доковский файл (присланный реферат), переводим его в rtf, а затем надо как-то определить символ какой раскладки используется, если английский, то применяем к нему форматирование.

.........
:)


- А вам какую операционку поставить - экспи, семерку или висту?
- Это ты сейчас о чем?
- Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный?
- Ну, конечно, надежный!
- Вот, значит - экспи, без вопросов! Сейчас сделаем...

(Улицы разбитых фонарей, сезон 10, серия 17)

Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!


При модном втюхе модоподдающимся начинает нравиться
 
Сообщение
Quote (Alex3A)
можно и автозамену сделать.

Это все можно и средствами самой NB сделать, вот только скорость обработки (особенно больших текстов) будет некудышная.

Но у Вадима-то, как всегда, "сверхзадача":

Quote (Вадим)
чтобы после обработки проверяемого файла, символы, написанные латиницей, выделялись бы цветным шрифтом или маркером?

Quote (Вадим)
Берем, скажем, доковский файл (присланный реферат), переводим его в rtf, а затем надо как-то определить символ какой раскладки используется, если английский, то применяем к нему форматирование.

.........
:)

Автор - Peter
Дата добавления - 29 Января 2011 в 00:16
AlienДата: Сб, 29 Января 2011, 00:18 | Сообщение # 9
Вот, ради интереса написал пример :)
Code
SetVar "[text]" "Кaкой-тo тeкcт"
StrLen "[text]" "[len]"
Loop "0" "[len]" "[i]"
     SubStr "[text]" "[i]" "1" "[s]"
     IfEx "[s]=a or [s]=o or [s]=e or [s]=c"
         AlertBox "Латинский символ!" "Обнаружен латинский символ [#34][s][#34].|Символ № [i]"
     EndIf
EndLoop
 
СообщениеВот, ради интереса написал пример :)
Code
SetVar "[text]" "Кaкой-тo тeкcт"
StrLen "[text]" "[len]"
Loop "0" "[len]" "[i]"
     SubStr "[text]" "[i]" "1" "[s]"
     IfEx "[s]=a or [s]=o or [s]=e or [s]=c"
         AlertBox "Латинский символ!" "Обнаружен латинский символ [#34][s][#34].|Символ № [i]"
     EndIf
EndLoop

Автор - Alien
Дата добавления - 29 Января 2011 в 00:18
PeterДата: Сб, 29 Января 2011, 00:25 | Сообщение # 10
Админ NeoBook
И, кстати, возникает такой вопрос: а если в реферате "легально" присутствуют английские символы (ведь могут же быть какие-то "цитаты" и т.п)?
Как в этом случае быть?
;)

Добавлено (29 Январь 2011, 00:25)
---------------------------------------------

Quote (Alien)
Вот, ради интереса написал пример

Quote (Alien)
Кaкой-тo тeкcт

mda
А если этот "какой-то текст" листов, этак, на 50 формата А4, да ещё и с мелким шрифтом впридачу?
:D


- А вам какую операционку поставить - экспи, семерку или висту?
- Это ты сейчас о чем?
- Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный?
- Ну, конечно, надежный!
- Вот, значит - экспи, без вопросов! Сейчас сделаем...

(Улицы разбитых фонарей, сезон 10, серия 17)

Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!


При модном втюхе модоподдающимся начинает нравиться
 
СообщениеИ, кстати, возникает такой вопрос: а если в реферате "легально" присутствуют английские символы (ведь могут же быть какие-то "цитаты" и т.п)?
Как в этом случае быть?
;)

Добавлено (29 Январь 2011, 00:25)
---------------------------------------------

Quote (Alien)
Вот, ради интереса написал пример

Quote (Alien)
Кaкой-тo тeкcт

mda
А если этот "какой-то текст" листов, этак, на 50 формата А4, да ещё и с мелким шрифтом впридачу?
:D

Автор - Peter
Дата добавления - 29 Января 2011 в 00:25
Alex3AДата: Сб, 29 Января 2011, 00:32 | Сообщение # 11
Друг клуба ММВ
При сверхзадачах, время не имеет значения, главное автоматизм, запустил и пошел спать. :D
Я как то делал шнягу, для замены ссылок на сайте, там хренова туча страниц, и подсчитать трудно, но со шнягой за неделю другую управились. :D

Добавлено (29 Январь 2011, 00:28)
---------------------------------------------

Quote (Peter)
А если этот "какой-то текст" листов, этак, на 50 формата А4, да ещё и с мелким шрифтом впридачу?

Не тама было в районе несколько десятков тыс.
Сложные задачи нужно упрощать, тогда и черт не страшен будет.

Добавлено (29 Январь 2011, 00:32)
---------------------------------------------
Самый простой и тупой способ, в ворде проверить орфографию, фсе сразу и вылезет. :D
Вот тебе и техставый прохвессар. :D

 
СообщениеПри сверхзадачах, время не имеет значения, главное автоматизм, запустил и пошел спать. :D
Я как то делал шнягу, для замены ссылок на сайте, там хренова туча страниц, и подсчитать трудно, но со шнягой за неделю другую управились. :D

Добавлено (29 Январь 2011, 00:28)
---------------------------------------------

Quote (Peter)
А если этот "какой-то текст" листов, этак, на 50 формата А4, да ещё и с мелким шрифтом впридачу?

Не тама было в районе несколько десятков тыс.
Сложные задачи нужно упрощать, тогда и черт не страшен будет.

Добавлено (29 Январь 2011, 00:32)
---------------------------------------------
Самый простой и тупой способ, в ворде проверить орфографию, фсе сразу и вылезет. :D
Вот тебе и техставый прохвессар. :D


Автор - Alex3A
Дата добавления - 29 Января 2011 в 00:32
PeterДата: Сб, 29 Января 2011, 00:35 | Сообщение # 12
Админ NeoBook
Quote (Alex3A)
запустил и пошел спать

Quote (Alex3A)
но со шнягой за неделю другую управились.

Ну, коли так, то...
:D
Quote (Alex3A)
Самый простой и тупой способ, в ворде проверить орфографию, фсе сразу и вылезет.

thumbs_up
:)


- А вам какую операционку поставить - экспи, семерку или висту?
- Это ты сейчас о чем?
- Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный?
- Ну, конечно, надежный!
- Вот, значит - экспи, без вопросов! Сейчас сделаем...

(Улицы разбитых фонарей, сезон 10, серия 17)

Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!


При модном втюхе модоподдающимся начинает нравиться
 
Сообщение
Quote (Alex3A)
запустил и пошел спать

Quote (Alex3A)
но со шнягой за неделю другую управились.

Ну, коли так, то...
:D
Quote (Alex3A)
Самый простой и тупой способ, в ворде проверить орфографию, фсе сразу и вылезет.

thumbs_up
:)

Автор - Peter
Дата добавления - 29 Января 2011 в 00:35
СергейДата: Сб, 29 Января 2011, 00:57 | Сообщение # 13
Необукер
Quote (Alex3A)
Самый простой и тупой способ, в ворде проверить орфографию

Интересно, а есть ли в ворде пакетной проверки орфографии, или пакетного поиска текста по регулярке?

Добавлено (29 Январь 2011, 00:57)
---------------------------------------------

 
Сообщение
Quote (Alex3A)
Самый простой и тупой способ, в ворде проверить орфографию

Интересно, а есть ли в ворде пакетной проверки орфографии, или пакетного поиска текста по регулярке?

Добавлено (29 Январь 2011, 00:57)
---------------------------------------------


Автор - Сергей
Дата добавления - 29 Января 2011 в 00:57
Alex3AДата: Сб, 29 Января 2011, 00:58 | Сообщение # 14
Друг клуба ММВ
Quote (Сергей)
Интересно, а есть ли в ворде пакетной проверки орфографии, или пакетного поиска текста по регулярке?

В ворде фсе есть, как в греции, билл сказал. :D
Весь васик к твоим услугам. :D
 
Сообщение
Quote (Сергей)
Интересно, а есть ли в ворде пакетной проверки орфографии, или пакетного поиска текста по регулярке?

В ворде фсе есть, как в греции, билл сказал. :D
Весь васик к твоим услугам. :D

Автор - Alex3A
Дата добавления - 29 Января 2011 в 00:58
СергейДата: Сб, 29 Января 2011, 01:01 | Сообщение # 15
Необукер
Quote (Alex3A)
Весь васик к твоим услугам
а, точно, там же (непомню как наз-ся) есть фича, в которой можно вб код выполнить, вот впринцепе и решение :)


Сообщение отредактировано
Сергей - Сб, 29 Января 2011, 01:07
 
Сообщение
Quote (Alex3A)
Весь васик к твоим услугам
а, точно, там же (непомню как наз-ся) есть фича, в которой можно вб код выполнить, вот впринцепе и решение :)

Автор - Сергей
Дата добавления - 29 Января 2011 в 01:01
PeterДата: Сб, 29 Января 2011, 01:04 | Сообщение # 16
Админ NeoBook
Quote (Alex3A)
В ворде фсе есть, как в греции, билл сказал.
Весь васик к твоим услугам.

:)

А что - классная тема, в целом, вышла!
"Побрызгали слюной", поломали головы...

Это из серии "А слона-то мы и не заметили!"...
:D


- А вам какую операционку поставить - экспи, семерку или висту?
- Это ты сейчас о чем?
- Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный?
- Ну, конечно, надежный!
- Вот, значит - экспи, без вопросов! Сейчас сделаем...

(Улицы разбитых фонарей, сезон 10, серия 17)

Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!


При модном втюхе модоподдающимся начинает нравиться
 
Сообщение
Quote (Alex3A)
В ворде фсе есть, как в греции, билл сказал.
Весь васик к твоим услугам.

:)

А что - классная тема, в целом, вышла!
"Побрызгали слюной", поломали головы...

Это из серии "А слона-то мы и не заметили!"...
:D


Автор - Peter
Дата добавления - 29 Января 2011 в 01:04
Alex3AДата: Сб, 29 Января 2011, 01:08 | Сообщение # 17
Друг клуба ММВ
Quote (Сергей)
а, точно, там же (непомню как наз-ся) есть фича, в которой можно вб код втюхать, вот впринцепе и решение

А че так слабо, только лиш вб? Я и бинкод свой савал. :D Ну в виде активса. :D
Quote (Peter)
Это из серии "А слона-то мы и не заметили!"...

Да он то маленький, да и билл паганый, раз усмотриш то. :D
 
Сообщение
Quote (Сергей)
а, точно, там же (непомню как наз-ся) есть фича, в которой можно вб код втюхать, вот впринцепе и решение

А че так слабо, только лиш вб? Я и бинкод свой савал. :D Ну в виде активса. :D
Quote (Peter)
Это из серии "А слона-то мы и не заметили!"...

Да он то маленький, да и билл паганый, раз усмотриш то. :D

Автор - Alex3A
Дата добавления - 29 Января 2011 в 01:08
СергейДата: Сб, 29 Января 2011, 01:13 | Сообщение # 18
Необукер
Quote (Alex3A)
А че так слабо
это как, "так"?
 
Сообщение
Quote (Alex3A)
А че так слабо
это как, "так"?

Автор - Сергей
Дата добавления - 29 Января 2011 в 01:13
Alex3AДата: Сб, 29 Января 2011, 01:16 | Сообщение # 19
Друг клуба ММВ
Quote (Сергей)
это как, "так"?

Лепиш че нада на сях иль делфях и делаеш в виде активса, потом прикручиваеш к ворду.
Я прикручивал ну фсякое там умное шелезо, промышленного характера.
 
Сообщение
Quote (Сергей)
это как, "так"?

Лепиш че нада на сях иль делфях и делаеш в виде активса, потом прикручиваеш к ворду.
Я прикручивал ну фсякое там умное шелезо, промышленного характера.

Автор - Alex3A
Дата добавления - 29 Января 2011 в 01:16
ВадимДата: Сб, 29 Января 2011, 03:42 | Сообщение # 20
Генератор идей
Ого, отлучился от компьютера, называется! :)
Quote (Alex3A)
если встречается код символа меньше чем код буквы А , и он не входит в диапазон цифр и знаков, и управляющих символов, то текст содержит английские букавы
Спасибо за пример алгоритма!
Quote (Alex3A)
В нб наверное должна быть функция дающая код символа
Интересно, надо будет поискать. В любом случае - это полезное знание.
Quote (Alex3A)
Естественно, текст нужно привести к какому либо стандарту, по кодировке.
А может быть такое, что в одном доковском документе разные абзацы (слова, символы) разной кодировки? Или речь идет лишь о разных файлах?
Quote (Peter)
Это все можно и средствами самой NB сделать, вот только скорость обработки
Quote (DEMBEL)
придется каждый символ перебирать да проверять, да выделять
Quote (Сергей)
Но речь же не о двух словах, а о многостраничных документов!
Да, тоже мысли такие были... Документы бывают от 10 до 300 стр. (уровня от простых контрольных до диссертаций).
Quote (Alien)
Вот, ради интереса написал пример
Спасибо, интересный пример!
Quote (Peter)
И, кстати, возникает такой вопрос: а если в реферате "легально" присутствуют английские символы (ведь могут же быть какие-то "цитаты" и т.п)?
Ну, визуальный контроль же предполагается. Цитату можно отличить по наличию ссылки. Открываем обработанный файл и либо ставим диагноз - "пестрит", либо файл здоров и без цветных узоров "воспаленных слов".
Quote (Alex3A)
Самый простой и тупой способ, в ворде проверить орфографию, фсе сразу и вылезет.
Действительно, для указанной цели это, должно быть, самый простой способ! :D Хех, вот ведь как бывает! И взаправду Слон! :D

Большущее спасибо всем за ответы! Я понял, что сделать это в принципе возможно, но не очень просто и есть вероятность, что работать прога будет крайне медленно. Однако все равно радует то, что на NB это возможно!


Бесплатный онлайн курс программирования в VisualNEO Win (NeoBook)
 
СообщениеОго, отлучился от компьютера, называется! :)
Quote (Alex3A)
если встречается код символа меньше чем код буквы А , и он не входит в диапазон цифр и знаков, и управляющих символов, то текст содержит английские букавы
Спасибо за пример алгоритма!
Quote (Alex3A)
В нб наверное должна быть функция дающая код символа
Интересно, надо будет поискать. В любом случае - это полезное знание.
Quote (Alex3A)
Естественно, текст нужно привести к какому либо стандарту, по кодировке.
А может быть такое, что в одном доковском документе разные абзацы (слова, символы) разной кодировки? Или речь идет лишь о разных файлах?
Quote (Peter)
Это все можно и средствами самой NB сделать, вот только скорость обработки
Quote (DEMBEL)
придется каждый символ перебирать да проверять, да выделять
Quote (Сергей)
Но речь же не о двух словах, а о многостраничных документов!
Да, тоже мысли такие были... Документы бывают от 10 до 300 стр. (уровня от простых контрольных до диссертаций).
Quote (Alien)
Вот, ради интереса написал пример
Спасибо, интересный пример!
Quote (Peter)
И, кстати, возникает такой вопрос: а если в реферате "легально" присутствуют английские символы (ведь могут же быть какие-то "цитаты" и т.п)?
Ну, визуальный контроль же предполагается. Цитату можно отличить по наличию ссылки. Открываем обработанный файл и либо ставим диагноз - "пестрит", либо файл здоров и без цветных узоров "воспаленных слов".
Quote (Alex3A)
Самый простой и тупой способ, в ворде проверить орфографию, фсе сразу и вылезет.
Действительно, для указанной цели это, должно быть, самый простой способ! :D Хех, вот ведь как бывает! И взаправду Слон! :D

Большущее спасибо всем за ответы! Я понял, что сделать это в принципе возможно, но не очень просто и есть вероятность, что работать прога будет крайне медленно. Однако все равно радует то, что на NB это возможно!


Автор - Вадим
Дата добавления - 29 Января 2011 в 03:42
СергейДата: Сб, 29 Января 2011, 09:07 | Сообщение # 21
Необукер
Quote (Вадим)
Большущее спасибо всем за ответы! Я понял, что сделать это в принципе возможно
да ненужно ничего делать, ворд сам все тебе покажет.
Заменил букву русскую о на английскую :D
Прикрепления: 9000801.jpg (29.7 Kb)


Сообщение отредактировано
Сергей - Сб, 29 Января 2011, 09:08
 
Сообщение
Quote (Вадим)
Большущее спасибо всем за ответы! Я понял, что сделать это в принципе возможно
да ненужно ничего делать, ворд сам все тебе покажет.
Заменил букву русскую о на английскую :D

Автор - Сергей
Дата добавления - 29 Января 2011 в 09:07
Alex3AДата: Сб, 29 Января 2011, 12:03 | Сообщение # 22
Друг клуба ММВ
Quote (Вадим)
Или речь идет лишь о разных файлах?

Мона сказать что не текст в кодировке, а документ имеет некую кодировку текста. :D
Хотя это не справедливо скажем к хтмл странице, как раз там и любят тыкать в разной кодировке. Но энто динамически клепаемые страницы страдают подобным.
 
Сообщение
Quote (Вадим)
Или речь идет лишь о разных файлах?

Мона сказать что не текст в кодировке, а документ имеет некую кодировку текста. :D
Хотя это не справедливо скажем к хтмл странице, как раз там и любят тыкать в разной кодировке. Но энто динамически клепаемые страницы страдают подобным.

Автор - Alex3A
Дата добавления - 29 Января 2011 в 12:03
ВадимДата: Сб, 29 Января 2011, 19:13 | Сообщение # 23
Генератор идей
Quote (Сергей)
ворд сам все тебе покажет.
Да, я уже понял, что решение лежало на поверхности :)
Quote (Alex3A)
а документ имеет некую кодировку текста
Т.е. любой файл .doc или docx содержит текст в единой кодировке (или только "документ", как часть файла?).


Бесплатный онлайн курс программирования в VisualNEO Win (NeoBook)
 
Сообщение
Quote (Сергей)
ворд сам все тебе покажет.
Да, я уже понял, что решение лежало на поверхности :)
Quote (Alex3A)
а документ имеет некую кодировку текста
Т.е. любой файл .doc или docx содержит текст в единой кодировке (или только "документ", как часть файла?).

Автор - Вадим
Дата добавления - 29 Января 2011 в 19:13
Alex3AДата: Вс, 30 Января 2011, 12:22 | Сообщение # 24
Друг клуба ММВ
Quote (Вадим)
Т.е. любой файл .doc или docx содержит текст в единой кодировке (или только "документ", как часть файла?).

Мда, вопрос канечна не детский. :D Скажем так, что скорее всего файл, ибо некоторые кодировки содержат в начале файла дескриптор указывающий на кодировку текста, но!
Могут быть хрен знать какой структуры, файлы, вот там можлива и документ. Но шибка не переживай, в основных, стандартных форматах - файл, за исключением скажем аксеса и мож екселя. И то, когда читаемые данные делались на ином софте, юзающем другую кодировку.
 
Сообщение
Quote (Вадим)
Т.е. любой файл .doc или docx содержит текст в единой кодировке (или только "документ", как часть файла?).

Мда, вопрос канечна не детский. :D Скажем так, что скорее всего файл, ибо некоторые кодировки содержат в начале файла дескриптор указывающий на кодировку текста, но!
Могут быть хрен знать какой структуры, файлы, вот там можлива и документ. Но шибка не переживай, в основных, стандартных форматах - файл, за исключением скажем аксеса и мож екселя. И то, когда читаемые данные делались на ином софте, юзающем другую кодировку.

Автор - Alex3A
Дата добавления - 30 Января 2011 в 12:22
ВадимДата: Пн, 31 Января 2011, 00:47 | Сообщение # 25
Генератор идей
Quote (Alex3A)
в основных, стандартных форматах - файл
Да, у меня кажется каша в голове, на предмет, что такое файл... Поправьте, если я не прав. В моем понимании как-то сложилось, что файл - это информация, размещенная (и доступная для считывания) посредством упорядоченного кодирования на определенной (целостной или связанной) области памяти носителя.
Таким образом мы получаем аппаратно независимое определение файла. Но если так понимать файл, то как объяснить, что всяческие хеши подсчитывают лишь "тело" файла, исключая "голову" - название файла, исключая "руки и ноги" - свойства и атрибуты файла? Я убедился, в том, что изменение имени, свойств и атрибутов файла не влияют на его хеш; хотя это странно, поскольку в свойствах файла можно указать очень даже не мало информации... Ну, кроме "тела", "рук" и "ног" файл должен иметь еще и "одежду" - т.е. описание того как этот файл понимать (всяческие дескрипторы, метки и прочие шмотки, представляющие файл в определенном "свете", указывающие на его "роль" и соответственно на то, как к нему относиться...).
Если я правильно понял, то "тело" файла имеет как правило одну кодировку, а вот "голова" (название файла) может иметь другую кодировку, про "одежду" не знаю...


Бесплатный онлайн курс программирования в VisualNEO Win (NeoBook)

Сообщение отредактировано
Вадим - Пн, 31 Января 2011, 01:19
 
Сообщение
Quote (Alex3A)
в основных, стандартных форматах - файл
Да, у меня кажется каша в голове, на предмет, что такое файл... Поправьте, если я не прав. В моем понимании как-то сложилось, что файл - это информация, размещенная (и доступная для считывания) посредством упорядоченного кодирования на определенной (целостной или связанной) области памяти носителя.
Таким образом мы получаем аппаратно независимое определение файла. Но если так понимать файл, то как объяснить, что всяческие хеши подсчитывают лишь "тело" файла, исключая "голову" - название файла, исключая "руки и ноги" - свойства и атрибуты файла? Я убедился, в том, что изменение имени, свойств и атрибутов файла не влияют на его хеш; хотя это странно, поскольку в свойствах файла можно указать очень даже не мало информации... Ну, кроме "тела", "рук" и "ног" файл должен иметь еще и "одежду" - т.е. описание того как этот файл понимать (всяческие дескрипторы, метки и прочие шмотки, представляющие файл в определенном "свете", указывающие на его "роль" и соответственно на то, как к нему относиться...).
Если я правильно понял, то "тело" файла имеет как правило одну кодировку, а вот "голова" (название файла) может иметь другую кодировку, про "одежду" не знаю...

Автор - Вадим
Дата добавления - 31 Января 2011 в 00:47
Alex3AДата: Пн, 31 Января 2011, 02:20 | Сообщение # 26
Друг клуба ММВ
Вадим, файл и есть то что вы называете телом файла, все остальное это его характеристики и описания. Вадим это файл, его имя, возраст, размер сапог и усе остальное уже описание, такм образом имея Вадима можно сделать его описание, и оно существует отдельно, вовсе не являясь частью самого файла.

Добавлено (31 Январь 2011, 02:20)
---------------------------------------------
По сути файл это набор ноликов и единиц, существующий сам по себе, а вот для его использования уже необходимо некое его описание, скажем, для передачи важно знать его размер, при его пересыке можно передавать только его тело, если в пункте приема известны необходимые его характеристики. Вы сами можете определить что важно для его использования а что нет, что является постоянной его характеристикой а что можно изменить. Имя и расширение файла несут некую информацию о его использовании, и для человека и для машины, но это все условно, изменив имя и даже расширение вы не измените его сути. К примеру, блокнот.ехе можете переименовать в вадим.хрен, и дать машине инструкцию, информацию что делать с этим файлом. В итоге комп его запустит и вы получите тот же блокнот.

 
СообщениеВадим, файл и есть то что вы называете телом файла, все остальное это его характеристики и описания. Вадим это файл, его имя, возраст, размер сапог и усе остальное уже описание, такм образом имея Вадима можно сделать его описание, и оно существует отдельно, вовсе не являясь частью самого файла.

Добавлено (31 Январь 2011, 02:20)
---------------------------------------------
По сути файл это набор ноликов и единиц, существующий сам по себе, а вот для его использования уже необходимо некое его описание, скажем, для передачи важно знать его размер, при его пересыке можно передавать только его тело, если в пункте приема известны необходимые его характеристики. Вы сами можете определить что важно для его использования а что нет, что является постоянной его характеристикой а что можно изменить. Имя и расширение файла несут некую информацию о его использовании, и для человека и для машины, но это все условно, изменив имя и даже расширение вы не измените его сути. К примеру, блокнот.ехе можете переименовать в вадим.хрен, и дать машине инструкцию, информацию что делать с этим файлом. В итоге комп его запустит и вы получите тот же блокнот.


Автор - Alex3A
Дата добавления - 31 Января 2011 в 02:20
PeterДата: Пн, 31 Января 2011, 02:58 | Сообщение # 27
Админ NeoBook
Quote (Alex3A)
По сути файл это набор ноликов и единиц, существующий сам по себе

И это (по сути) - самое лаконичное определение!

А вообще - что такое файл?
:)
Информации в сети море!



- А вам какую операционку поставить - экспи, семерку или висту?
- Это ты сейчас о чем?
- Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный?
- Ну, конечно, надежный!
- Вот, значит - экспи, без вопросов! Сейчас сделаем...

(Улицы разбитых фонарей, сезон 10, серия 17)

Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!


При модном втюхе модоподдающимся начинает нравиться
 
Сообщение
Quote (Alex3A)
По сути файл это набор ноликов и единиц, существующий сам по себе

И это (по сути) - самое лаконичное определение!

А вообще - что такое файл?
:)
Информации в сети море!


Автор - Peter
Дата добавления - 31 Января 2011 в 02:58
ВадимДата: Пн, 31 Января 2011, 03:54 | Сообщение # 28
Генератор идей
Quote (Alex3A)
описание <...> существует отдельно, вовсе не являясь частью самого файла
Понятно. Значит с файлом всегда идет "бирка", изменения в которой не считаются изменениями в файле. Ну, теперь понятнее как-то... :). Хотя все равно странно, что пересылаем один "объект", а на самом деле два (тогда надо и целостность описания файла проверять отдельно, поскольку там можно такого понаписать..., что и будет настоящей информацией, а само тело файла будет только прикрытием...).
Quote (Peter)
Информации в сети море!
Да, мы как-то поднимали уже эту тему, я тогда искал, но имеющиеся определения меня не устраивают, все время по разным причинам. Вот, например, во многих определениях файла "имя файла" является частью файла...

Quote (Peter)
зачем
У меня еще недостаточно понимания, чтобы иметь свое интуитивное определение. Поэтому и пытаюсь понять сущность. С чем же мы работаем...


Бесплатный онлайн курс программирования в VisualNEO Win (NeoBook)

Сообщение отредактировано
Вадим - Пн, 31 Января 2011, 03:56
 
Сообщение
Quote (Alex3A)
описание <...> существует отдельно, вовсе не являясь частью самого файла
Понятно. Значит с файлом всегда идет "бирка", изменения в которой не считаются изменениями в файле. Ну, теперь понятнее как-то... :). Хотя все равно странно, что пересылаем один "объект", а на самом деле два (тогда надо и целостность описания файла проверять отдельно, поскольку там можно такого понаписать..., что и будет настоящей информацией, а само тело файла будет только прикрытием...).
Quote (Peter)
Информации в сети море!
Да, мы как-то поднимали уже эту тему, я тогда искал, но имеющиеся определения меня не устраивают, все время по разным причинам. Вот, например, во многих определениях файла "имя файла" является частью файла...

Quote (Peter)
зачем
У меня еще недостаточно понимания, чтобы иметь свое интуитивное определение. Поэтому и пытаюсь понять сущность. С чем же мы работаем...

Автор - Вадим
Дата добавления - 31 Января 2011 в 03:54
DEMBELДата: Пн, 31 Января 2011, 04:03 | Сообщение # 29
Наш дизайнер
например, возьми мою функцию для создания процесса, возьми блокнот, переименуй его в notepad.temp и создай процесс этого файла. файл будет запущен и откроется блокнот несмотря на такое имя. Расширение и пр. это скорее для внешних связей программы (с интерфейсом, системой), а сущность файла может реализовываться на более низком уровне совсем по другому.

Как задавать вопросы

Win7x64 SP1 Neobook v5.70 (Trial)
WinXP SP3 Neobook v5.62
 
Сообщениенапример, возьми мою функцию для создания процесса, возьми блокнот, переименуй его в notepad.temp и создай процесс этого файла. файл будет запущен и откроется блокнот несмотря на такое имя. Расширение и пр. это скорее для внешних связей программы (с интерфейсом, системой), а сущность файла может реализовываться на более низком уровне совсем по другому.

Автор - DEMBEL
Дата добавления - 31 Января 2011 в 04:03
mishemДата: Пн, 31 Января 2011, 04:03 | Сообщение # 30
Эксперт форума
Quote (Вадим)
У меня еще недостаточно понимания, чтобы иметь свое интуитивное определение.

Как мне товарищь один объяснял когда то давно что такое файл, это книга стоящая на полке, подшитая папка, или просто листок бумаги. Все что внутри, информация. Файл, это касета магнитофонная, а компьютер это магнитофон. И т.д. Поправьте если не правильно. :D


Не хочешь читать хелп?

Если хелп и форум не помогли, тогда все ответы здесь



Если вы думаете, что сможете — вы сможете, если думаете, что нет — вы правы.
 
Сообщение
Quote (Вадим)
У меня еще недостаточно понимания, чтобы иметь свое интуитивное определение.

Как мне товарищь один объяснял когда то давно что такое файл, это книга стоящая на полке, подшитая папка, или просто листок бумаги. Все что внутри, информация. Файл, это касета магнитофонная, а компьютер это магнитофон. И т.д. Поправьте если не правильно. :D

Автор - mishem
Дата добавления - 31 Января 2011 в 04:03
  • Страница 1 из 3
  • 1
  • 2
  • 3
  • »
Поиск: