Добро пожаловать к нам в гости! Наш сайт посвящён программе NeoBook, с помощью которой вы легко сможете создавать собственные мультимедиа-приложения без необходимости изучать сложные языки программирования! Зарегистрируйтесь, чтобы стать членом нашего сообщества.
Функция определения кодировки файла по маркеру последовательности байтов (англ. Byte Order Mark (BOM)) и текста. Файлы определяемые по BOM UTF-8, UTF-16BE, UTF-16LE, UTF32BE, UTF32LE Текст (кириллица) определяемая функцией CP 1251, KOI8-R, IBM866 ( DOS , CP-866), ISO-8859-5, MAK
Добавлено (22 Апреля 2016, 09:56) --------------------------------------------- все доступные перекодировки находятся в реестре по адресу HKEY_CLASSES_ROOT\MIME\Database\Charset Теоретически можно написать в функцию - только вряд ли кому нужно.
Добавлено (22 Апреля 2016, 10:39) --------------------------------------------- есть ещё таблица перекодировки CP1252 -> CP1251 на кириллические буквы.-теоретически можно написать(если надо)
Добавлено (22 Апреля 2016, 10:40) --------------------------------------------- из файла PDF в Word
Определяет, но не всё... Html файлы через раз. Беру просто по компьютеру лазию, что найду то и открываю. Что то определяет на "ура", что то вообще не определяет. Ни файл ни текст... Но уже хоть что то. Благодарю. Не хочешь читать хелп?
mishem -ткни- покажи что и как определяешь- я как то непонял .Я попробывал бы что то изменить и переделать...-несовсем понимаю чётко задачу... может Html файлы в какой то другой кодировке ?-В функции же идёт кириллица до 255, - ещё б проследить в самой функции срабатывает ли конструкция
Set fso = CreateObject("Scripting.FileSystemObject") Set ts = fso.OpenTextFile("C:\1234.txt") sSTR = ts.ReadAll 'читаем в переменную весь файл
sSTR -в эту переменную считывается текст файла В общем надо открыть функцию для редактирования и после строчки sSTR = ts.ReadAll вставить MsgBox sSTR далее сохранить-и пробовать функцию В этом случае можно отслеживать что же считывается из файла, и примерно видеть кодировку(внешне-вожможны кракозябры) При этом будет каждый раз выскакивать окно с текстом. Ну хотя бы как то попытаться найти причину...
Добавлено (22 Апреля 2016, 20:31) --------------------------------------------- или хотя бы обьясни как ты файлы открываешь этой функцией- я не совсем понимаю...- а далее я сам отыщу причину..
Добавлено (22 Апреля 2016, 20:37) --------------------------------------------- -или скинь файлы которые не определяются...
html mishem - так там и не определится ничего. Практически всё что посмотрел -все html файлы на латинице. В функции же идёт просмотр и перебор кириллицы(от 127 до 255) А латиница она и в африканском языке латиница... может что то есть на кириллице ?
Добавлено (22 Апреля 2016, 21:33) --------------------------------------------- Да- и подскажи откуда такая команда " FileOpenBox" (всё знать невозможно)
- А вам какую операционку поставить - экспи, семерку или висту? - Это ты сейчас о чем? - Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный? - Ну, конечно, надежный! - Вот, значит - экспи, без вопросов! Сейчас сделаем...
(Улицы разбитых фонарей, сезон 10, серия 17)
Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!
При модном втюхе модоподдающимся начинает нравиться
Тут в одной из тем вообще высказывалась мысль, что без плагинов (и костылей) NeoBook ничего не может (видимо с другим неософтовским "конструктором" перепутали).
- А вам какую операционку поставить - экспи, семерку или висту? - Это ты сейчас о чем? - Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный? - Ну, конечно, надежный! - Вот, значит - экспи, без вопросов! Сейчас сделаем...
(Улицы разбитых фонарей, сезон 10, серия 17)
Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!
При модном втюхе модоподдающимся начинает нравиться
mishem - так там и не определится ничего. Практически всё что посмотрел -все html файлы на латинице.
Так вот у меня задача определить независимо от того на чем там текст. Нужно определить кодировку файла и текста. Пойдем теперь в этой теме по новому кругу. Ладно. Забей. Попытался, и на том спасибо.
Буду надеяться что Петр понял задачу и может быть сделает то что надо. Ну а нет, на нет и спроса нет. Позже сам попробую что нибудь изобразить.
ЦитатаPeter ()
это прикол такой?
ЦитатаAS3856 ()
и подскажи откуда такая команда " FileOpenBox"
Когда не знаешь что за команда, вверху списка команд есть поле ввода для поиска команд. Введи нужную, и найдешь... Есть исключение, если команда плагина и плагин не установлен, тогда не найдешь.
штатного NeoBooka вполне хватает для решения несложных задач - всё что написано в справке соответствует- и даже больше., - просто я погряз в скриптах ( на данном этапе времени мне с ним интересно разбираться) , А тамдем VBScript и NeoBook так "горы свернут"(Визуальные формы плюс несложный язык VB - отличное решение множества задач)
ЦитатаPeter ()
Тут в одной из тем вообще высказывалась мысль, что без плагинов (и костылей) NeoBook ничего не может (видимо с другим неософтовским "конструктором" перепутали).
многое чего говорят - невсему же верить.. но вот забыть диалог выбора ------- да ужжж лет 6-7 назад писал проект на NB- передача текстовых файлов по лок сети- причём всё было рабочее- и работало же(на работе там надо было между компами передачу файлов)(проект так и не воплотили- хотя всё работало) без плагинов(без alTCP)- просто надо творчески подходить - креативно(гдето исходники остались-применялся лишь один файл мной же написанный и случайно заработавший в делфи )(куда ж без сокетов то) Надо искать какую то проблемму-сделал эту работу- скушно становиться..
Добавлено (22 Апреля 2016, 23:29) ---------------------------------------------
ЦитатаAS3856 ()
Так вот у меня задача определить независимо от того на чем там текст.
mishem- так вроде латиница то одинакова,- если неопределяется кодировка файла- значит отсутствует BOM,(зничит можно писать кириллицу и будет нормально отображаться,(так вроде),(и скорее всего ANSI)(кстати в функции вывод "BOM Unknown" означает что скорее всего ANSI- и вообще файлы UTF- только и отличаются BOM, при перезаписях BOM у меня иногда стирался, и Notepad определял файл как ANSI, просто это не прописано в функции. если не определяется кодировка текста - значит латиница, - латиница одинакова и UTF и ANSI, тут нет кодировки(хотя я с латиницей конкретно не разбирался). Ну не думаю что по латинице можно определить кодировку. А если б я написал в функции не "BOM Unknown" а сразу ANSI ? Вы были б спокойны и всё?
Нужно определить кодировку файла и текста. Пойдем теперь в этой теме по новому кругу. :D Ладно. Забей. Попытался, и на том спасибо.
mishem, по-правде говоря, иикак не могу взять в толк зачем в NB определять кодировку файла?
Это имеет смысл только в том случае, когда нужно что-то записать в файл, но записать именно в той кодировке, в которой он и записан, а, насколько мне известно, NB это делать не умеет.
ЦитатаAS3856 ()
А тамдем VBScript и NeoBook так "горы свернут
Не свернут, и ты в этом очень быстро убедишься, от силы - маленькие бугорки и холмики. Свернуть горы может только тандем NB + плагин (Delphi, C++), и то не самые высокие горы. Это надо усвоить как "Отче наш!", и, если хочется "сворачивать горы", то не тратить силы и время впустую.
ЦитатаAS3856 ()
надо творчески подходить - креативно
Тогда - тем более! Креатива будет столько, что и не унесешь!
ЦитатаAS3856 ()
скушно становиться.
Скучать некогда будет! Не сумневайся.
- А вам какую операционку поставить - экспи, семерку или висту? - Это ты сейчас о чем? - Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный? - Ну, конечно, надежный! - Вот, значит - экспи, без вопросов! Сейчас сделаем...
(Улицы разбитых фонарей, сезон 10, серия 17)
Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!
При модном втюхе модоподдающимся начинает нравиться
Добавлено (22 Апреля 2016, 23:40) ---------------------------------------------
ЦитатаPeter ()
А тамдем VBScript и NeoBook так "горы свернут
- ну это аллегория- ну покататься то можно на заднице?
Добавлено (22 Апреля 2016, 23:45) --------------------------------------------- mishem - извините- но всё что могу- добавить ещё определение какой то кодировки КИРИЛЛИЦЫ, - или подправить существующий скрипт определения - недумаю что может получится что то более крутое в наших силах( ну если обратиться к разрабам Notepada)
AS3856, я уже устал "агитировать", просто вижу, что у человека голова работает, и жалко, если все распыляться будет "по мелочам", но, каждый сам себе "режиссер".
Цитатаmishem ()
Отстань от меня...
Понимаю - запутался. ОК!
- А вам какую операционку поставить - экспи, семерку или висту? - Это ты сейчас о чем? - Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный? - Ну, конечно, надежный! - Вот, значит - экспи, без вопросов! Сейчас сделаем...
(Улицы разбитых фонарей, сезон 10, серия 17)
Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!
При модном втюхе модоподдающимся начинает нравиться
кстати по HTML - вроде как кодировка должна указываться(рекомендуется) между метатегами в заголовке,Заголовки актуальны до тех пор, пока веб-страница не будет сохранена на локальный диск. В этом случае HTTP-заголовки будут утеряны . всё упирается откуда эти файлы у ВАс и зачем
ЦитатаPeter ()
AS3856, я уже устал "агитировать", просто вижу, что у человека голова работает, и жалко, если все распыляться будет "по мелочам", но, каждый сам себе "режиссер".
1. мне просто нехватает знаний и учителей 2. по моей работе нетребуется(как правило профи станешь если это твоя работа) 3. это просто моё хобби Отсюда вывод- изучить и хорошо овладеть я вряд ли смогу,так что лучше быть хорошим "дворником" чем плохим "программистом" Изучаю то что мне по зубам...( в пору моей учёбы в энерго - небыло компов- были зачатки на перфолентах)
Добавлено (23 Апреля 2016, 00:22) --------------------------------------------- mishem откуда вы берёте эти файлы ? открыл сейчас проверить- пишется в мететегах кодировка может перед сохранением имеет смысл парсить -определять кодир- где то записывать ?
Тоже не говорил? Декомпилировал справку. Нужно сделать перевод. Метатегов может вообще не быть. Кодировка может быть любая! Текст может быть на любом языке. Может быть в виде 16тиричного значения, может быть в виде мнемоник, может быть в виде 10тичного значения и т.д. В браузере НБ он будет отображаться как надо, а вот в текстовом редакторе не факт... Чтобы кириллица отображалась верно, нужно перекодировать текст, установить метатеги, и т.д.
Больше не спрашивайте. Все. Ша, уже никто, никуда не идет...
Еврей через границу тащит громадный чемодан. Пограничник: Стой! Кто идет? Еврей: Ша, уже никто, никуда не идет...
Добавлено (23 Апреля 2016, 00:31) --------------------------------------------- Про utf в utf я уже молчу... И это все вкратце, там еще куча всяких не предвиденных ситуаций. Я не могу сейчас дать примеры файлов. Все находится в процессе работы, методом проб и ошибок. Появляется проблема, ищу решение... Сейчас я не работаю с проектом. Не до него пока...
Чтобы кириллица отображалась верно, нужно перекодировать текст, установить метатеги, и т.д.
ЦитатаAS3856 ()
но там при двойной перекодировке и при тройной- вид одинаков
Сумашедший дом! Вот так почитаешь про этот геморрой, и всякое желание разбираться со всем этим пропадает напрочь!
- А вам какую операционку поставить - экспи, семерку или висту? - Это ты сейчас о чем? - Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный? - Ну, конечно, надежный! - Вот, значит - экспи, без вопросов! Сейчас сделаем...
(Улицы разбитых фонарей, сезон 10, серия 17)
Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!
При модном втюхе модоподдающимся начинает нравиться
mishem - пришла такая мысль- если файл не определён в кодировке, и текст не определён в кодировке - то создать файл в ANCI, Скопировать текст(он скорее всего весь латиница т.к. кириллица определилась бы,)и вставить в новый файл-таким образом уже получаем 100% файл в кодировке ANSI , а латиница она и есть латиница