Добро пожаловать к нам в гости! Наш сайт посвящён программе NeoBook, с помощью которой вы легко сможете создавать собственные мультимедиа-приложения без необходимости изучать сложные языки программирования! Зарегистрируйтесь, чтобы стать членом нашего сообщества.
Джентльмены, вы, пожалуйста, для начала определитесь с названиями кодировок, к примеру, что это такое:
Цитатаmishem ()
ANCI
Цитатаmishem ()
Бери любой файл, txt, xml, html, любую страницу из интернета. И пробуй определить кодировки. Возьми любой текстовый редактор который может перекодировать файлы, сохраняй в разных кодировках какие только в голову не придут, и пробуй...
Иными словами, я задачу поставил, а вы сами догадывайтесь и изголяйтесь, когда найдете решение, тогда и скажете. а покуда не морочьте мне голову!
- А вам какую операционку поставить - экспи, семерку или висту? - Это ты сейчас о чем? - Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный? - Ну, конечно, надежный! - Вот, значит - экспи, без вопросов! Сейчас сделаем...
(Улицы разбитых фонарей, сезон 10, серия 17)
Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!
При модном втюхе модоподдающимся начинает нравиться
все что пишется, читается через строчку, или вообще не читается.
Цитатаmishem ()
Какая разница, смысл понятен...
Причем, далеко не один пост, просто я все ждал когда же наконец "на одном языке" разговор-то пойдет.
И после этого мне еще говорят, что я, дескать, читаю через строчку.
Цитатаmishem ()
НУЖНО ОПРЕДЕЛИТЬ КОДИРОВКУ ТЕКСТА!
Да это уже поняли! Правильнее сказать - догадалися.
Добавлено (18 Апреля 2016, 00:41) ---------------------------------------------
Немного поразмыслил над проблемой....
Цитатаmishem ()
ВСЕ! Хотя бы предположительно.
mishem, а ты представляешь сколько их? И тебе они все нужны?
Хоть и википедию никоим образом нельзя считать "авторитетом", тем-не-менее некоторую информацию почерпнуть из нее можно. А акцент хочется сделать вот на этом параграфе:
Цитата
Автоматическое распознавание кодировок
Использование множества кодировок в современном ПО создаёт много неудобств не только программистам, но и пользователям. Согласно одной точке зрения, справиться с кракозябрами[en] можно, если программы будут автоматически распознавать кодировку входящего текста.
Для однобайтных кодировок можно учитывать тот факт, что частота использования разных букв сильно различается (например, в русском часто используется «о», но редко «ъ»). Поэтому, зная язык текста, можно легко выбрать кодировку, в которой частота байтов лучше соответствует частоте букв данного языка.
Альтернативная точка зрения считает подобные эвристические алгоритмы определения кодировки текста вредными, поскольку современные информационные технологии располагают средствами недвусмысленно сопоставить тексту положенную ему кодовую страницу (см., например, MIME). Широкое же распространение эвристических анализаторов поощряет использование некачественных программ создания текстовых данных, нарушающих стандарты.
И особенно на выделенном тексте, с которым я полностью солидарен. Но, главное то, что проделать подобную работу... это гм... Да и перед этим еще и "изучить вопрос". Отделить ANSI от UTF8, пожалуй, несложно, а вот как быть дальше... Короче, даже подумать страшно. А ради чего?
Единственный вариант - уповать на то, что кто-то уже решил подобную задачу, и искать в сети "подсказки", а еще лучше - готовые решения. И самое прикольное - предположим кодировку определили, а дальше что?
- А вам какую операционку поставить - экспи, семерку или висту? - Это ты сейчас о чем? - Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный? - Ну, конечно, надежный! - Вот, значит - экспи, без вопросов! Сейчас сделаем...
(Улицы разбитых фонарей, сезон 10, серия 17)
Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!
При модном втюхе модоподдающимся начинает нравиться
mishem - задача как то размыто поставлена,определить все кодировки всех языков,любых документов + пробовать определить редактором- ....Ну попробовал-вотт файл с инета, 1251 ANSI кириллица - дальше то что ?
Добавлено (18 Апреля 2016, 08:25) --------------------------------------------- И всё же думаю надо конкретно задачу - под неё уже и решение индивидуально подбирать-слишком широк получается спектр
Добавлено (18 Апреля 2016, 09:37) --------------------------------------------- Может на основе этих таблиц написать функцию определения кодировки? - но это для кириллицы,где найти для китайского французского и тд незнаю.. http://f9r.ru/kodir3a.html
Добавлено (18 Апреля 2016, 10:05) --------------------------------------------- mishem - кстати мысль неплоха- открываем ТЕКС (по умолчанию всё в ANSI)(неважно в какой кодировке) - начинаем перебор ищем символы которые различаются в разных кодировках-сверяем-определяем кодировку Текста Может так сделать ? - или опять тебя неправильно поняли ? (Данное предложение относится только к кириллице- все остальные языки искать надо)
Добавлено (18 Апреля 2016, 10:30) --------------------------------------------- Будет процент погрешности- чем больше текст- тем меньше погрешность
Unicode, UTF-8 Unicode, UTF-32 little endian Unicode, UTF-32 big endian Unicode, UTF-16 little endian Unicode, UTF-16 big endian ASCII + \uFFFF Unicode Escapes ASCII + &SXFFFF; NCR ASCII + &S65535; NCR ASCII + &htmlchar; US-ASCII (7-bit) Windows 1250: Central European Windows 1251: Cyrillic Windows 1252: Western European Windows 1253: Greek Windows 1254: Turkish Windows 1255: Hebrew Windows 1256: Arabic Windows 1257: Baltic Windows 1258: Vietnam Windows 874: Thai Windows 949: Korean Windows 932: Japanese (Shift-JIS) Windows 936: Simplified Chinese (GBK) Windows 950: Traditional Chinese (Big 5) ISO-8859-1 Latin-1 Western European ISO-8859-2 Latin-2 Central European ISO-8859-3 Latin-3 South European ISO-8859-4 Latin-4 North European ISO-8859-5 Cyrillic ISO-8859-6 Arabic ISO-8859-7 Greek ISO-8859-8 Hebrew ISO-8859-9 Latin-5 Turkish ISO-8859-10 Latin-6 Nordic ISO-8859-11 Thai CTIS-620) ISO-8859-13 Latin-7 Baltic Rim ISO-8859-14 Latin-8 Celtic ISO-8859-15 Latin-9 ISO-8859-16 Latin-10 South-Eastern European EUC-JP: Japanese (JIS 201+208) EUC-JP-212: Japanese (JIS 201+208+212) EUC-KR: Korean (KS 1001) EUC-CN: Simplified Chinese (GB 2312) EUC-TW: Traditional Chinese (CNS 11643) DOS 437: United States DOS 737: Greek DOS 775: Baltic Rim DOS 850: Western European DOS 852: Central European DOS 855: Cyrillic DOS 857: Turkish DOS 860: Portuguese JOS 861: Icelandic JOS 862: Hebrew JOS 863: Canadian French JOS 864: Arabic JOS 865: Nordic JOS 866: Cyrillic Russian JOS 869: Greek 2 :SO-10858: Armenian \rmSCII-7: Armenian \rmSCII-8: Armenian \rmSCII-8A: Armenian 3EOSTD8: Georgian :SIRI 3342: Farsi Kamenicky: Czech & Slovak KOI8-R: Russian KOI84J: Ukranian KZ-1048: Kazach Mazo via: Polish MIK: Bulgarian PTCP154: Cyrillic Asian TCVN: Vietnamese VIQR: Vietnamese VISCII: Vietnamese VNI: Vietnamese VPS: Vietnamese YUSCII Cyrillic: Yugoslavia YUSCII Latin: Yugoslavia ISCII Devanagari ISCII Bengali & Assamese ISCII Punjabi (Gurmukhi) ISCII Gujarati ISCII Oriya ISCII Tamil ISCII Telugu ISCII Kannada ISCII Malayalam EBCDIC 037: US & Canada EBCDIC 424: Hebrew EBCDIC 500: International EBCDIC 875: Greek EBCDIC 1026: Turkish Mac Arabic Mac Celtic Mac Central European Mac Chinese Simplified Mac Chinese Traditional Mac Croatian Mac Cyrillic Mac Devanagari Mac Dingbats Mac Farsi Mac Gaelic Mac Greek Mac Gujarati Mac Gurmukhi Mac Hebrew Mac Icelandic Mac Inuit Mac Japanese Mac Korean Mac Roman (Western European) Mac Romanian Mac Symbol Mac Thai fyac Turkish Unicode, UTF-7 ISO-2022-JP: Japanese (JIS 201+208) ISO-2022-JP-1: Japanese (JIS 201+208+212) ISO-2022-JP-2: Japanese multilingual (JIS 201+208+212) ISO-2022-KR: Korean (KS 1001) ISO-2022-CN: Chinese (GB 2312 +CNS 11643) HZ: Simplified Chinese TSCII: Tamil
И тебе они все нужны?
Можно не все, а хотя бы основные.
ЦитатаAS3856 ()
кстати мысль неплоха- открываем ТЕКС (по умолчанию всё в ANSI)(неважно в какой кодировке) - начинаем перебор ищем символы которые различаются в разных кодировках-сверяем-определяем кодировку Текста
Ну об этом я примерно еще где то на первой странице говорил.
Забейте. Похоже вам эта задача не по зубам. А то скоро будет 100 страниц, и я не смогу уже искать то что я говорил. Хотя везде говорится одно и то же. Даже текстовый редактор указал в котором манипулировать текстом проще. На регулярки внимание обратил, потому что простым методом перебора это просто не реально делать.
ЦитатаPeter ()
Но, главное то, что проделать подобную работу... это гм...
Смотришь ты не в том направлении, по этому и гм...
Добавлено (18 Апреля 2016, 11:00) ---------------------------------------------
ЦитатаAS3856 ()
Будет процент погрешности- чем больше текст- тем меньше погрешность
А без погрешности никак. 100% точность определения не может сделать ни один редактор. Не хочешь читать хелп?
Думаю Для меня это решаемо Ну и когда Вам талдычил(извини) вопросом что же определять- отсылали куда то по ссылкам-редакторам - mishem - Вы просто изначально неопределённо поставили задачу -занялся теперь определением кодировки текста - смысл понятен для меня- делать можно по таблицам(ссылка выше)
Добавлено (18 Апреля 2016, 11:20) --------------------------------------------- похожие решения есть на php
Только это решение не для детского сада (типа скрыть\показать кнопку при наведении мыши на нее), по этому в сети мало разговоров.
Ну, наконец-то спускаемся с небес на землю. То, что решение существует я и не сомневаюсь.
Цитатаmishem ()
Определение кодировки может практически каждый продвинутый текстовый редактор.
Определение языка может делать любой переводчик.
Разумеется, а иначе нафиг они нужны? Это как графический редактор, который неспособен выбрать цвет для кисти.
Решить можно любую задачу (я уж говорил об этом). Проблема только в "стоимости" решения, не в буквальном смысле, а в "человеко-часах".
Цитатаmishem ()
Смотришь ты не в том направлении, по этому и гм...
Вот как-раз то я смотрю в правильном направлении (никогда бы не пошел путем "сбора статистики", бред), и хорошо представляю какой реально объем работы надо проделать, чтобы превратить эту мечту в реальность. Конечное решение может выглядеть одной единственной командой плагина (и кажется что все элементарно, одна команда - фигня, работы на полчаса), но вот внутри этой команды работы может скрываться не на одну неделю. Если уж в РНР это решили (а решили скорее всего именно на Delphi), то на Delphi это и подавно решаемо. Но для этого нужны "знание вопроса", целеустремленность и "стимул" (упрямство, заинтересованность), а лично я этим похвастаться не могу, увы...
Добавлено (18 Апреля 2016, 12:04) --------------------------------------------- И самое главное... Кодировку определили, дальше что? Что с текстом-то делать?
- А вам какую операционку поставить - экспи, семерку или висту? - Это ты сейчас о чем? - Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный? - Ну, конечно, надежный! - Вот, значит - экспи, без вопросов! Сейчас сделаем...
(Улицы разбитых фонарей, сезон 10, серия 17)
Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!
При модном втюхе модоподдающимся начинает нравиться
Набросал скрипт-определять коды символов (в разных кодировках-разные коды получаются(кириллица))- - сравнивать с кодами ANSI(под кириллицу выделены свои коды)-далее можно определить (теоретически покка) текст ANSI или нет, ну а дальше определять к какой кодировке относятся полученные символы - как то так... По ходу работы посмотрю что будет получаться..
Добавлено (18 Апреля 2016, 14:22) --------------------------------------------- хотя может это и неправильно - поэкспериментирую ........посмотрю результаты
Добавлено (18 Апреля 2016, 14:44) --------------------------------------------- придётся возможно всё же не с кодами работать- а с сравнением
Добавлено (18 Апреля 2016, 14:56) --------------------------------------------- Ещё раз посмотрел на "питон" - чем петру непонравился??- старый язык-мало где применяется и функционал видимо ограничен-но функция то видимо рабочая- разобраться и переписать. Ну не ДЕЛФИ конечно - хотя можно и на делфи - но плагин несмогу сделать,VBS проще... http://patttern.blogspot.ru/2012/07/php-python.html
Сообщение отредактировано AS3856 - Пн, 18 Апреля 2016, 14:59
А где петр говорил, что ему не нравится "питон"? Ему не питон не понравился, а подход к решению задачи, а на чем будет решение не столь важно (хоть на анаконде), главное чтобы было надежно и удобно, и неважно что там считает петр.
Цитатаmishem ()
Перекодировать в нужную кодировку.
О!!! И как? Например 1252 в 1251.
Сейчас "ковырнул" эти кодировки... Сумашедший дом!
Лично мне терпения не хватит, 100%! Так-что, AS3856, на тебя вся надежда.
ЦитатаAS3856 ()
можно и на делфи - но плагин несмогу сделать
Ничего - подскажем!
- А вам какую операционку поставить - экспи, семерку или висту? - Это ты сейчас о чем? - Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный? - Ну, конечно, надежный! - Вот, значит - экспи, без вопросов! Сейчас сделаем...
(Улицы разбитых фонарей, сезон 10, серия 17)
Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!
При модном втюхе модоподдающимся начинает нравиться
Нет определения кодировки, смысл дальше что то думать? :)
Но ведь для чего-то определение кодировки тебе понадобилось?
Цитатаmishem ()
Это уже другой вопрос.
В том-то и дело, что этот "другой вопрос" автоматом вытекает из первого, а потом "потекут" другие, и, в конечном итоге, придем к выводу (неминуемо придем!), что тебе нужен... полноценный текстовой редактор со всеми прибамбасами. Как известно, аппетит приходит во время еды!
Впрочем, я ничего не имею против того, чтобы в NB появилась такая возможность, только вот проделывать такую работу "на всякий случай" ... Очень "любить тему" надо.
Добавлено (18 Апреля 2016, 18:58) ---------------------------------------------
ЦитатаAS3856 ()
:redface
AS3856, чего стесняться-то? Если сможешь сделать в Delphi просто в виде экзешника, то - делай, главное, чтобы в принципе заработало. "Перевести на плагин" это чисто технический вопрос, сделаем.
- А вам какую операционку поставить - экспи, семерку или висту? - Это ты сейчас о чем? - Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный? - Ну, конечно, надежный! - Вот, значит - экспи, без вопросов! Сейчас сделаем...
(Улицы разбитых фонарей, сезон 10, серия 17)
Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!
При модном втюхе модоподдающимся начинает нравиться
function ord(str){ var ch = str.charCodeAt(0); if (ch>0xFF) ch-=0x350; return ch; }
function compareReversed(a, b) { return b.id - a.id; }
Выпилил из нее проверку KOI8-R, ибо работает неверно. Текст который закодирован в IBM866 всегда определялся как KOI8-R. Тут можно посмотреть как она себя ведет на практике. По мне, так-себе методика... Верность кодировки в районе 65-70%. И чем больше разновидностей в нее впихивать, тем ниже будет вероятность угадывания.
Добавлено (18 Апреля 2016, 19:54) --------------------------------------------- По мне так лучше эвристический анализ, может он и медленнее будет... но вероятность будет значительно выше.
"Вы знаете, нам очень понравились все варианты, что вы прислали. Даже не знаем, что выбрать… А может попробуем объединить все три логотипа в один?"
Но ведь для чего-то определение кодировки тебе понадобилось?
Не, я честное слово уже устал объяснять.
ЦитатаPeter ()
В том-то и дело, что этот "другой вопрос" автоматом вытекает из первого,
Ну если автоматом, попробовал в нб прочитать файл в кодировке 1252. Нб автоматом преобразовало текст в utf8, конвертируем из utf8 в 1251. Получается 1252>1251.
Нужно просто брать, и в НБ пробовать что получается на входе\выходе.
Петр, я сейчас не в теме. Отвлекся на другое занятие. Вообще для решения всех этих вопросов нужно чтобы нб поддерживала юникод. Когда это будет? Хрен его знает.
Был задан вопрос:
ЦитатаAS3856 ()
Кстати-затронул ты вопрос кодировок-может фунцию перекодировок отдельно написать..... есть поле для работы..
Последовало предложение:
Цитатаmishem ()
Найди и напиши определение кодировки файла, текста.
А дальше уже пошло не пойми что... Что нужно конкретно? А если так? А если эдак? Нужна конкретная задача.. Нужен конкретный проект... и т.д. и т.п.
По моему все ясно и понятно было с самого начала:
Цитатаmishem ()
Найди и напиши определение кодировки файла, текста.
Или это просто я такой стоумовый, а другим еще что то надо объяснять? Не хочешь читать хелп?
anton - я как раз и переделываю это на VBS (Верность методики также зависит от количества текста)
Добавлено (18 Апреля 2016, 20:25) --------------------------------------------- думаю будет функция для NB
Добавлено (18 Апреля 2016, 20:44) ---------------------------------------------
Цитатаanton ()
Верность кодировки в районе 65-70%.
Да - и стопудовый результат никто не даст, такова специфика Если кстати есть какой то скрипт-код или функция - поделись- может что то действительно лучше- и можно из этого функцию к NB сделать...
Цитатаanton ()
По мне так лучше эвристический анализ, может он и медленнее будет... но вероятность будет значительно выше
Эвристический анализ Слово "эвристика" происходит от греческого глагола "находить". Суть эвристических методов состоит в том, что решение проблемы основывается на некоторых правдоподобных предположениях, а не на строгих выводах из имеющихся фактов и предпосылок
Поделись своим анализом - хотелось в копилку знаний копейку положить
Да ладно, чего там... В принципе, если получиться сделать, то я буду только "ЗА"! К сожалению, я не силен в теме кодировок, чтобы хоть как-то помочь в этих вопросах. Просто хотелось AS3856, на плагин "подтолкнуть", что ли, но, к сожалению, не получилось.
Кстати...
Цитатаmishem ()
Найди и напиши определение кодировки файла, текста.
Сам же написАл "файла", а потом еще говоришь, что тебя не понимают.
Ладно, подождем решения на VBS... - А вам какую операционку поставить - экспи, семерку или висту? - Это ты сейчас о чем? - Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный? - Ну, конечно, надежный! - Вот, значит - экспи, без вопросов! Сейчас сделаем...
(Улицы разбитых фонарей, сезон 10, серия 17)
Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!
При модном втюхе модоподдающимся начинает нравиться
Сам же написАл "файла", а потом еще говоришь, что тебя не понимают.
Написал файла и текста.
После последовал вопрос, типа что именно, файла или текста. Нужно и то, и то. Но так как средствами нб можно определить кодировку файла, то важнее определить кодировку текста.
Так тебе и начали делать определение "файла", а потом выяснилось, что "файла" нахрен не надо, а надо "текста" Цитаты привести, или так вспомнишь?
Цитатаmishem ()
Нужно и то, и то. Но так как средствами нб можно определить кодировку файла, то важнее определить кодировку текста.
А зачем тогда "и то и то"? Понятно, что текст "важнее", но первым-то шло "файла". За что боролись на то и напоролись! А если NB и так может "файла", то зачем еще раз определять "файла", хоть это и не "важнее".
Вот тут лично меня клинит капитально!
- А вам какую операционку поставить - экспи, семерку или висту? - Это ты сейчас о чем? - Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный? - Ну, конечно, надежный! - Вот, значит - экспи, без вопросов! Сейчас сделаем...
(Улицы разбитых фонарей, сезон 10, серия 17)
Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!
При модном втюхе модоподдающимся начинает нравиться
Как будит время попробую с помощью плагина Петра, переложить ее на рельсы NB "Вы знаете, нам очень понравились все варианты, что вы прислали. Даже не знаем, что выбрать… А может попробуем объединить все три логотипа в один?"
Чтобы НБ смогла определить, нужно подключать плагин который может получить шестнадцатеричное значение файла. Так зачем использовать плагин, если делается функция в которой можно сделать и то и то? Когда началось выяснение что же все таки важнее? Я остановился на втором варианте. Мне просто надоело пытаться вам что то объяснять.
Плюс у меня была хоть маленькая, но надежда что ты сможешь все это реализовать в плагине. Не хочешь читать хелп?
Я уже описывал в теме логику анализа которым можно определить кодировку
Мысль неплоха.. но иду проторённым путём,, спасибо за JS - её легче перелопатить на VBS
Добавлено (18 Апреля 2016, 21:57) --------------------------------------------- Только щас дошло- а нафига(извините за французский) пишу на VBS если есть готовый JS ???? NB же поддерживает JS- скрипты.........
Добавлено (18 Апреля 2016, 22:24) --------------------------------------------- прописал в скрипте JS параметры, вроде всё так как должно быть- запускаю скрипт- на 71 строке ошибка-и всё - в JS я нуль буду дальше пилить VBS ( изучать ещё и JS меня нехватит) (там ещё функция- а какие параметры и куда разобраться немогу-да и небуду)
Так зачем использовать плагин, если делается функция в которой можно сделать и то и то?
Вот так бы и сказал с самого начала типа в первую очередь"текста", а "файла" потом, если получится, а то:
Цитатаmishem ()
Найди и напиши определение кодировки файла, текста.
Так чего ж ты ждал-то? Все правильно - каков "запрос", таков и ответ!
Цитатаmishem ()
надежда что ты сможешь все это реализовать в плагине.
Я уже сказал, что не силен в кодировках (еще когда с этими мнемониками, что б их, возился), и для того, чтобы сделать (и желательно "по уму"), нужно хорошенько изучить тему (как минимум), а у меня руки не доходят просто привести в порядок (не говоря о развитии) то, что самому-то интересно, и вдруг еще "левак"... Тут ничего личного.... Вот, AS3856 окучивал-окучивал, но, увы... - А вам какую операционку поставить - экспи, семерку или висту? - Это ты сейчас о чем? - Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный? - Ну, конечно, надежный! - Вот, значит - экспи, без вопросов! Сейчас сделаем...
(Улицы разбитых фонарей, сезон 10, серия 17)
Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!
При модном втюхе модоподдающимся начинает нравиться
Запишу в одну функцию и определение файла и текста- ничего сложного(определение BOM)(тем более что определение файла практически завершено- нехватает там по мелочи- ну и только для личного пользования- т.к. вручную надо переписывать пути файла)
Добавлено (19 Апреля 2016, 00:54) --------------------------------------------- дописал определение UTF остальное побыстрее пойдёт по накатанной....
Добавлено (19 Апреля 2016, 01:00) --------------------------------------------- кстати - на мой взгляд там ошибки в JS который anton скинул - определение неправильно.
Сообщение отредактировано AS3856 - Вт, 19 Апреля 2016, 08:01
Совершенно верно, я местам поменял проверку UTF8 и CP1251 ибо я реализовывал как плагин для другой программы, и там читабельный текст из себя представляет всегда UTF8, а он оригинальным скриптом определялся как CP1251. и для IBM866 поставил проверку от KOI8-R почему уже писал выше. Если есть желание могу сделать как в оригинале, посмотришь как работает. "Вы знаете, нам очень понравились все варианты, что вы прислали. Даже не знаем, что выбрать… А может попробуем объединить все три логотипа в один?"
anton - может скрипт сделаешь для NB на JS ? Я то в JS слабоват совсем, а потом сравним(ну чисто интерес)-тем более скрипт пракически готов (JS). На VBs немного делаю по другому-проверки то те же - ну небольшая разница.......(хотя может и нет разницы -плохо читаю JS)
Цитатаanton ()
посмотришь как работает.
-Я уже свой начинаю тестить- пока вроде всё ОТЛИЧНО.(определение UTF-текста)
Добавлено (19 Апреля 2016, 18:06) --------------------------------------------- Всё дописал-всё работает. переделаю под функцию NB выложу для тестирования (пока без определения кодировки файла)
Добавлено (19 Апреля 2016, 18:14) --------------------------------------------- На первый взляд совсем неплохо,ограничил максимальную проверку символов в 300 знаков(пропишу чтоб сам пользователь определял сколько ему надо) -Ну определение файлов займусь допишу тут же... Времени нехватает, сад-огород начинается..(не до бани..)
Добавлено (19 Апреля 2016, 23:30) --------------------------------------------- Дописал определение кодировки файлов Определяется по ВОМ : UTF-8, UTF-16LE, UTF16BE, UTF32LE и BE ну и определение кодировки текста : UTF, WIN 1251, KOI8-R, IBM866 ( DOS , CP-866) , ISO-8859-5, MAK Функция готова, потестил,работает шустро.Поставил ограничение не менее 20 сиволов для определения и максимум 300. Думаю нормально..(в тексте может быть что угодно и скоко угодно) займусьь теперь под NB её подгонять..
Добавлено (21 Апреля 2016, 10:17) --------------------------------------------- Конструкция вида;
Set fso = WScript.CreateObject("Scripting.FileSystemObject") Set ts = fso.OpenTextFile("C:\UTF8.txt") sSTR = ts.ReadAll из скрипта VBS, не работает в функции NB - придётся идти другим путём(вырезать эту часть и считывать файл средствами NeoBook, - а хотелось просто в NB указывать путь до файла а далее сам скрипт бы отрабатывал., Может кто из "зубров" VBS знает как обойти данное ?? Требуется получить в переменную sSTR весь текст из файла -или всё же задействовать команду NB "FileRead" (подгоняю скрип VB в функцию NB - что то мне подсказывает что при исползовании делфи(плагина) такого бы небыло )
Добавлено (21 Апреля 2016, 18:10) --------------------------------------------- Set fso = CreateObject("Scripting.FileSystemObject") Set ts = fso.OpenTextFile("C:\UTF8.txt") sSTR = ts.ReadAll
-подразобрался - заработало..
Сообщение отредактировано AS3856 - Чт, 21 Апреля 2016, 10:18
mishem, скачай прикрепление к этому сообщению, затем:
Цитатаmishem ()
Возьми любой текстовый редактор который может перекодировать файлы, сохраняй в разных кодировках какие только в голову не придут, и пробуй...
открыть файл в этом прикреплении... Посмотри что будет - текст в Мемо всегда будет в ANSI (сделано в Turbo Delphi), т.е правильно ли отображается текст. Сообщи результат. Может и выйдет какой толк... когда-нибудь... Да, забыл сказать, прикрепление надо предварительно распаковать.
- А вам какую операционку поставить - экспи, семерку или висту? - Это ты сейчас о чем? - Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный? - Ну, конечно, надежный! - Вот, значит - экспи, без вопросов! Сейчас сделаем...
(Улицы разбитых фонарей, сезон 10, серия 17)
Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!
При модном втюхе модоподдающимся начинает нравиться
Все правильно. Просто ковырнул тему, ведь винда как-то определяет кодировку, да и тот же notepad тоже, теперь вроде знаю как. Правда 100% гарантии тоже нет, и даже IE бывает ошибается с кодировкой. Но, по крайней мере, теперь понятно в каком направлении копать, а там видно будет.
- А вам какую операционку поставить - экспи, семерку или висту? - Это ты сейчас о чем? - Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный? - Ну, конечно, надежный! - Вот, значит - экспи, без вопросов! Сейчас сделаем...
(Улицы разбитых фонарей, сезон 10, серия 17)
Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!
При модном втюхе модоподдающимся начинает нравиться