Добро пожаловать к нам в гости! Наш сайт посвящён программе NeoBook, с помощью которой вы легко сможете создавать собственные мультимедиа-приложения без необходимости изучать сложные языки программирования! Зарегистрируйтесь, чтобы стать членом нашего сообщества.
то что расписал автор опуса о кодировке т.е. он то на питоне писал- я ж могу это в vbs
Гм... Мне легче не станет даже если он распишет еще и на анаконде, а не только на питоне.
ЦитатаAS3856 ()
Боюсь что я "недорос" до планиностроительства......
Когда-то начинать надо?
Глаза боятся, руки делают.
Я уж миллион раз говорил, что после NeoBook "движением вперед" (с точки зрения развития возможностей и "покорения высот") может быть только изучение нормального языка программирования. Все остальное (VBS, JS, PHP, и проч) - "движение в бок" и пустая трата времени, если, конечно, не требуется решить какую-нибудь конкретную рАзовую узконаправленную задачу. Цель определяет "инструмент". - А вам какую операционку поставить - экспи, семерку или висту? - Это ты сейчас о чем? - Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный? - Ну, конечно, надежный! - Вот, значит - экспи, без вопросов! Сейчас сделаем...
(Улицы разбитых фонарей, сезон 10, серия 17)
Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!
При модном втюхе модоподдающимся начинает нравиться
Peter подскажите имеет смысл воплотить в код то что расписал автор опуса или нет всё остальное- типа переходов на другие языки- я пишу понемногу и там и там- но пока чую слабоват...
имеет смысл воплотить в код то что расписал автор опуса или нет
Боюсь, что не смогу вразумительно ответить на этот вопрос, поскольку для этого нужно хоть что-то понимать в теме, а я в ней ни бум-бум, увы... Единственное, что могу сказать определенно, лучше сделать и пожалеть, чем не сделать, а потом жалеть (продолжать мучиться сомнениями), т.е. будет известен хоть какой-то результат, пусть даже и отрицательный.
Важна еще мотивация: если самому интересно - вперед, а если нет, то...
ЦитатаAS3856 ()
я пишу понемногу и там и там-
За двумя зайцами....
Хотя, все люди разные... Я - "однозадачный", и никогда не возьмусь за работу, если не уверен, исключения бывают, но только когда самому интересно "чем все это закончится?".
А программирование для меня - просто маленькое хобби, и занимаюсь по вдохновению, никаких обязательств перед кем-либо.. сроков..
ЦитатаAS3856 ()
пока чую слабоват...
ЦитатаPeter ()
Когда-то начинать надо?
- А вам какую операционку поставить - экспи, семерку или висту? - Это ты сейчас о чем? - Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный? - Ну, конечно, надежный! - Вот, значит - экспи, без вопросов! Сейчас сделаем...
(Улицы разбитых фонарей, сезон 10, серия 17)
Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!
При модном втюхе модоподдающимся начинает нравиться
_буду делать по варианту работника серпентария , к тому же нашёл похожие темы у других "Зубров"- все говорят это единственное направление с UTF
Добавлено (15 Апреля 2016, 09:37) ---------------------------------------------
ЦитатаPeter ()
За двумя зайцами....
язык vbs для меня проще (заяц бежит медленнее - вот я за ним и иду)-к тому ж важен результат ,можно ехать на танке- а можно на велосипеде ,и невсегда танкист будет лидером....
Добавлено (15 Апреля 2016, 09:39) --------------------------------------------- -Разные задачи - разные пути их решения..
Добавлено (15 Апреля 2016, 09:46) --------------------------------------------- На данном этапе мне интереснее это сделать на VBS А все мои размышления и опусы - Просто я хотел узнать в том ли направлении "иду за этим зайцем", жаль что никто неможет подсказать , тема кодировок очень узконаправленна... и разбираться с октетам,байтами и битами я начал недавно..
а можно на велосипеде ,и невсегда танкист будет лидером....
Не совсем удачное сравнение. Один из местных форумчан, Toizy, еще давно выразился, на мой взгляд, наиболее точно: программирование на NeoBook, ММВ (как и на всех "конструкторах" и скриптовых языках) и программирование на Delphi, можно сравнить с резьбой по дереву топором и скальпелем! Если перед человеком стоит вполне конкретная задача для решения которой есть простые и "специализированные" средства, то их и надо применять, чего мудрить-то. Просто нормальные языки предоставляют реально неограниченные возможности, они универсальны, и позволяют решить любую задачу максимально эффективно и с точки зрения потребления ресурсов, и скорости работы (приложения), но не по скорости разработки, которая порой может иметь решающее значение. Если в программировании интересует "творчество" и хочется написАть свою "Джаконду", то тут даже без вариантов - С++, Delphi, и т.п., а если надо просто "разукрасить забор" или нашлепать "квадрат Малевича", то... Оба подхода равноправны:
ЦитатаAS3856 ()
Разные задачи - разные пути их решения..
.
ЦитатаAS3856 ()
На данном этапе мне интереснее это сделать на VBS
Это просто потому-что неизвестен толком Delphi. В нем куда интереснее, хотя бы потому-что как правило решение бывает не одно, и надо только найти наиболее эффективное в каждом конкретном случае.
- А вам какую операционку поставить - экспи, семерку или висту? - Это ты сейчас о чем? - Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный? - Ну, конечно, надежный! - Вот, значит - экспи, без вопросов! Сейчас сделаем...
(Улицы разбитых фонарей, сезон 10, серия 17)
Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!
При модном втюхе модоподдающимся начинает нравиться
Зачем тогда тут собрались? давайте откроем форум по делфи. Думаю здесь всё же собрались люди которые не изучали специально языки программирования , и которым хочется всё же что то сделать самому, и которые понемногу( ну может не все) изучают более серьёзные языки. - Ну так надо помочь в решении некоторых задач,Не всем даётся язык - но многим хочется .Вопрос не стоит на чём надо программировать . Мне на необуке вполне комфортно,Не думаю что мне потребуется писать на делфи что то серьёзное - как правило это связано с работоой, и его я изучаю только для себя и собственного развития.VBS мне интересен тем что можно быстро освоить основные приёмы и получать результат
Добавлено (15 Апреля 2016, 12:53) ---------------------------------------------
ЦитатаAS3856 ()
Это просто потому-что неизвестен толком Delphi.
-это действительно так
Добавлено (15 Апреля 2016, 12:55) --------------------------------------------- И всё ж здесь интереснее чем на других форумах а то ж выкладывают студенты проекты- и молчок-вот сделел и всё- ни обсуждения - ни общения
Чтобы обсуждать программу и то, как с ней работать, разумеется. Только вот зачастую (если не сказать "в основном") из программы хотят "выжать" то, на что она не рассчитана, и начинаются поиски "решений", требующих, в подавляющем большинстве случаев, костылей, в то время, когда "на поверхности" лежит готовое решение, но требующее определенных усилий, а как известно, без труда....
ЦитатаAS3856 ()
VBS мне интересен тем что можно быстро освоить основные приёмы и получать результат
Отчасти верно, но только скриптовые языки это быстрый сиюминутный результат, а Delphi или С++ это - "задел на будущее", и по мере их освоения, накопления опыта и знаний, начинаешь щелкать как семечки возможности, например, того же VBS.
Впрочем, каждый имеет полное право двигаться своим путем, я лишь пытаюсь "подсказать", что ли, этот путь, исходя из собственного опыта и "понимания вопроса", но не настаиваю. Просто рассуждения "о перспективах"...
ЦитатаAS3856 ()
а то ж выкладывают студенты проекты- и молчок-вот сделел и всё- ни обсуждения - ни общения
А где ж такое "безрбразие" творится?
- А вам какую операционку поставить - экспи, семерку или висту? - Это ты сейчас о чем? - Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный? - Ну, конечно, надежный! - Вот, значит - экспи, без вопросов! Сейчас сделаем...
(Улицы разбитых фонарей, сезон 10, серия 17)
Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!
При модном втюхе модоподдающимся начинает нравиться
Кажется задача решается проще в начале файла ставится Маркер последовательности байтов (англ. Byte Order Mark (BOM)) его лишь определить - и всё (маркер utf отображается в CP1251 "п»ї" кстати это легко проверить, надо создать в кодировке файл в UTF-8 , можно даже в нём ничего не писать, затем в необуке создать кнопку с командой FileRead -вывести полученные значания(якобы пустого-но на самом деле там записан маркер)в объекте Text и там будет этот самый маркер отображаемый в кодировке Windows-1251 вот так "п»ї" Написал скрипт - маркер определяется легко- всё это проверю до конца- думаю будет функция Одно непонятно- почему на форумах(серпентаристы и php) не идут этим методом ?
Одно непонятно- почему на форумах(серпентаристы и php) не идут этим методом ?
Ну, я так полагаю, надо спросить их напрямую.
- А вам какую операционку поставить - экспи, семерку или висту? - Это ты сейчас о чем? - Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный? - Ну, конечно, надежный! - Вот, значит - экспи, без вопросов! Сейчас сделаем...
(Улицы разбитых фонарей, сезон 10, серия 17)
Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!
При модном втюхе модоподдающимся начинает нравиться
форумы то старые- где ж их щас сыщешь - наверно перековались на другие языки
Добавлено (16 Апреля 2016, 14:51) --------------------------------------------- добил таки задачу- практически полностью завершено, получаю HEX (EF BB BF)для UTF-8 , можно также определять кодировку для UTF-16, UTF-32,UTF-7 - и ещё там какие то другие (одно исключение - некоторые источники пишут что BOM(маркер) не является обязательным для файлов - хотя я такого не встречал) Приведу в порядок функцию - и всё
Но это ты определишь кодировку файла, не текста!!!
Цитатаmishem ()
Ниже сам файл
mishem, возможно я чего-то не догоняю, но какой ответ ты ждешь от функции (по автоопределению кодировки), если часть текста в одной кодировке, а часть в другой? - А вам какую операционку поставить - экспи, семерку или висту? - Это ты сейчас о чем? - Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный? - Ну, конечно, надежный! - Вот, значит - экспи, без вопросов! Сейчас сделаем...
(Улицы разбитых фонарей, сезон 10, серия 17)
Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!
При модном втюхе модоподдающимся начинает нравиться
если часть текста в одной кодировке, а часть в другой?
Дело не в этом. Я просто показал что в файле с одной кодировкой, текст может быть совершенно в другой кодировке. Возможность быть одной части текста в одной кодировке а другой в другой кодировке маловероятна.
Определить кодировку можно все по той же таблице символов. Если открыть тот файл что я дал выше в 16теричном редакторе, то будет видно что у каждого символа свое значение. Не хочешь читать хелп?
Но это ты определишь кодировку файла, не текста!!!
Ты(извини что на ты) же вроде говорил имеено определить кодировку файла ? Или что то я упустил??
Добавлено (16 Апреля 2016, 20:37) --------------------------------------------- Я то шёл на определение кодировки файла.... Придётся дописать и определение кодировки текстта- но здесь немного по другому,латиница то код символов одинаковы..
Добавлено (16 Апреля 2016, 20:38) --------------------------------------------- в конце концов - можно всё засунуть в одну фнкцию
Добавлено (16 Апреля 2016, 20:42) --------------------------------------------- кодировки http://f9r.ru/kodir3a.html
Добавлено (16 Апреля 2016, 20:44) --------------------------------------------- -но только кириллицы - латиница одинакова
Добавлено (16 Апреля 2016, 20:48) --------------------------------------------- mishem - определить другую кодировку можно только в кириллице- латиница одинакова и в ANCII and UTF видимо ты этого ждёёшь ??
Добавлено (16 Апреля 2016, 20:52) ---------------------------------------------
Цитатаmishem ()
Может быть здесь будет более понятно.
я просто несовсем видимо понимаю что ты ждёшьполучить, если определить кодировку страницы сайта - так может пропарсить её и найти META Charset HTML-документа
Добавлено (16 Апреля 2016, 20:55) --------------------------------------------- - ладно- с определением кодировки файла более- менее понятно- попробую с определением кодировки текста- и всё в одну функцию
Добавлено (16 Апреля 2016, 20:56) --------------------------------------------- сумбурно немного пишшу- товариша проводили в посл. путь
Добавлено (16 Апреля 2016, 21:07) --------------------------------------------- если в тексте найдены 2-3 идущие подряд русских буквы (а в utf-8 они представлены 2 байтами. Первый с кодом 208 или 209, а второй с кодом от 128 до 191) то это - текст utf-8. пойду по этому пути
Ладно, не мучайся. Вряд ли это Vbs под силу. Сейчас посидел, подумал... Во первых нужна поддержка юникод, Во вторых все это на много проще делается, но только в плагине. Используя регулярки... Задаешь в регулярке диапазон и из какого диапазона символов больше, в той кодировке текст и находится. А все остальное мне кажется это просто танцы с бубном. Не хочешь читать хелп?
так я про это и говорю - vbs это под силу- просто я задачу не совсем чётко вижу (сейчас) У меня сложилось что ты хочешь определить кодировку файла - теперь же - говоришь коридовку текста - ну это тоже решаемо Допишу всё же кодировку файла- не бросать же..- да и задача практически решена..
Добавлено (16 Апреля 2016, 22:11) --------------------------------------------- пишу в UTF кириллицей- копиррую в файл ANSII - все нормально читается,- наоборот- тоже всё нормально, А а вот если UTF открывать в ANSII тогда кракозябры - что то я путаюсь - что же надо сделлать...
пишу в UTF кириллицей- копиррую в файл ANSII - все нормально читается
В Windows при копировании в буфер обмена текст копируется в юникоде. По этому он будет правильно отображаться не зависимо в какой кодировке ты его копируешь. Хотя это не совсем точная формулировка, там еще зависит от локали системы, выставленного языка и т.д. Но суть думаю ты понял.
Программы которые не понимают юникод, не смогут преобразовать текст, и он будет выглядеть крякозябрами.
ЦитатаAS3856 ()
А а вот если UTF открывать в ANSII тогда кракозябры
А здесь происходит то о чем я говорю. Файл в одной кодировке, текст в другой.
ЦитатаAS3856 ()
может пропарсить её и найти META Charset HTML-документа
А если его нет?
Добавлено (16 Апреля 2016, 22:27) ---------------------------------------------
ЦитатаAS3856 ()
кодировку файла - теперь же - говоришь коридовку текста
mishem - т.е. нужно определить кодировку файла по крайне мере я так понимаю эту фразу
""Предположим есть файлы в кодировке ANCII которые нужно преобразовать в Utf-8, но среди них затесались файлы уже в кодировке UTF-8. Попробуй с помощью плагина zmFunctions перекодировать файл в кодировке UTF-8 в кодировку UTF-8.""
Так значит задача получается решена? определение кодировки файла у меня практически в кармане
Добавлено (16 Апреля 2016, 22:41) --------------------------------------------- в куче файлов определяем файлы с кодировкой UTF , - отбрасываем их , оставшиеся ANSII перекодируем в UTF - и задача на этом этапе завершена Вроде так ?
Нуу... В этой фразе слово файл подразумевалось под словом текст.
В принципе в основном к примеру файлы HTML в кодировке ANCI, имено файлы. А текст может быть уже в любой другой кодировке. Перекодировать файл, подразумевается перекодировать текст. В НБ мы можем получить текст из файла, перекодировать его, и записать обратно в файл. Создать файл в НБ, если не ошибаюсь, мы можем только ANCI.
То есть, если сам файл в кодировке ANCI, а текст в Utf-8, то получая текст из файла в НБ у нас будут крякозябры (пишу предположительно, не проверяю, может быть наоборот). Перекодировав текст, в НБ мы получим читаемый текст, и записав его в файл мы так же в итоге получим читаемый текст.
Если мы определяем файл как ANCI, и считаем что в нем текст тоже ANCI, и нам его надо перекодировать в Utf-8, а там окажется не ANCI а Utf-8, то (взято отсюда)
Так выглядит фраза «Человек сейчас увидит лишь то, что ожидает увидеть.» если она воспринята декодировщиком в кодировке Windows-1251, а не UTF-8: ЧеР"овек сейчас СѓРІРёРґРёС‚ Р"ишь то, что ожидает увидеть.
Фраза «Человек сейчас увидит лишь то, что ожидает увидеть.» при двойном кодировании UTF-8 в UTF-8: ЧеРВ"РѕРІРµРС" СЃРµРв"-час РЎС"РІРёРґРёС‚ Р В"ишь то, что ожидает РЎС"видеть.
Об этом я выше писал предлагая перекодировать текст UTF-8 в UTF-8.
ЦитатаAS3856 ()
и задача на этом этапе завершена
Блин, я сейчас уже точно не помню что именно надо и в какой последовательности. Занят совсем другим... Но к этому вопросу вернусь по любому. :)
Задача: Есть список файлов.... Определяем кодировку файла. Определяем кодировку текста. Скорей всего нужно будет все перекодировать в Utf-8, но... Текст в файле мог быть к примеру (да и скорей всего) в кодировке 1252. Записываться в файл мог в кодировке 1251 (кирилица).
Чтобы более понятно было. Берем HTML файл, текст в нем на английском (но может быть на немецком, французком, китайском...) и постепенно его переводим. В итоге что получается? В какой кодировке текст в файле?
То есть, перед тем как переводить, файл нужно конвертнуть в Utf-8, что бы текст в любой кодировке был читаем. Но чтобы его конвертнуть, нужно определить из чего во что конвертировать. Текст может быть уже в Utf-8, может быть в 1252, может быть уже на русском в 1251 и т.д.
mishem - давай так- я делаю функцию проверки кодировки файла (почти готова) - именно ФАЙЛА -Далее посмотришь - что там куда ещё определитью На данном этапе могу определить UTF или ANSII Будет ещё какая то загвоздка- скажешь. У меня у самого кругом идёт чего куда определить файлы -Текст- строки (Смешались в кучу люди, кони,котлеты ,мухи на балконе..)
В этой фразе слово файл подразумевалось под словом текст.
Муж - жене: - Дорогая, а где у нас сахар? - В банке из под кофе, на которой написано "соль", милый!
Честно говоря, я тоже никак не мог понять что же именно мишему надо, но по логике вещей (коль скоро NB работает с текстами), предполагал что нужна именно кодировка текста, а не файла, но "обсуждение" постоянно вызывало сомнения.
Цитатаmishem ()
Блин, я сейчас уже точно не помню что именно надо и в какой последовательности. Занят совсем другим... Но к этому вопросу вернусь по любому.
mishem, так ЧТО ЖЕ ИМЕННО НАДО-ТО? КАКИЕ КОНКРЕТНО КОДИРОВКИ НУЖНО ОПРЕДЕЛЯТЬ?
ЦитатаAS3856 ()
У меня у самого кругом идёт чего куда определить файлы -Текст- строки (Смешались в кучу люди, кони,котлеты ,мухи на балконе..)
Тут без поллитры не разобраться, точно!
- А вам какую операционку поставить - экспи, семерку или висту? - Это ты сейчас о чем? - Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный? - Ну, конечно, надежный! - Вот, значит - экспи, без вопросов! Сейчас сделаем...
(Улицы разбитых фонарей, сезон 10, серия 17)
Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!
При модном втюхе модоподдающимся начинает нравиться
Блин, я что ли не понятно объясняю, или вы между строк читаете?
ЦитатаPeter ()
Честно говоря, я тоже никак не мог понять что же именно мишему надо, но по логике вещей (коль скоро NB работает с текстами), предполагал что нужна именно кодировка текста, а не файла
Совершенно верно. Даже то где подразумевалось текст а не файл, чуть ниже написано:
Цитатаmishem ()
Попробуй с помощью плагина zmFunctions перекодировать файл в кодировке UTF-8 в кодировку UTF-8. zmConvertString "AnsiToUtf8" "" ""
zmConvertString - конвертировать строку, не файл. Уже здесь должно быть понятно что нужно определить кодировку строки, текста. Кодировка файла здесь вообще никаким боком. Естественно я понимаю что никто даже не попробовал. А раз не пробуете, значит не хотите понять. Толчем воду в ступе...
Получается ищу не то что надо, а то что смогу.
Здесь тоже по моему все доходчиво написано:
Цитатаmishem ()
То есть в принципе определить кодировку файла можно с помощью плагинов в NeoBook два таких я по крайней мере знаю.
А вот кодировку текста как определить, хз. Здесь вот можно почитать о Utf-8
определить кодировку файла можно с помощью плагинов в NeoBook А вот кодировку текста как определить, хз.
Как еще объяснить?
ЦитатаPeter ()
mishem, так ЧТО ЖЕ ИМЕННО НАДО-ТО?
Если плагином, кодировку файла и кодировку текста. Кодировка файла как я уже говорил, по первым байтам заголовка файла определяется. Их там всего штук 5-6, мож чуть больше. Все остальные ANCI.
ЦитатаPeter ()
КАКИЕ КОНКРЕТНО КОДИРОВКИ НУЖНО ОПРЕДЕЛЯТЬ?
ВСЕ! Хотя бы предположительно.
Еще раз говорю, это можно сделать с помощью регулярных выражений. В НБ в чем проблема заключается, в плагине HPW который использует класс TRegExpr отключен Unicode, по этому с его помощью не возможно искать символы регуляркой в юникоде. Но это думаю поправимо, нужно просто Ганса попросить чтобы он включил эту функцию, но может конечно и послать... Пока отложил этот вопрос, занялся написанием справки для hpwTreeView, еще 9 лет назад кто то пообещал, решил исправить это положение.
Например чтобы найти все символы кириллицы, достаточно указать диапазон в регулярке [^0400-04FF], латиницы [^0020-007F], и т.д. Ну это на скорую руку, мож где ошибаюсь. Но смысл думаю понятен. Каких символов больше, та и кодировка.
Не надо было упоминать кодировку файла. На какой хрен она вообще нужна в NeoBook?!!!!
NeoBook реально может работать только с ANSI-строками (текстами) и ФСЕ! Нужно изучить тему от а до я, а не действовать с наскоку и наугад, иначе так и будем ходить кругами. И думаю, что решить эту задачу (если ее вообще можно решить) получится только плагином.
Цитатаmishem ()
Каких символов больше, та и кодировка.
Гм... Такой подход вообще не понимаю. А с остальными-то символами ЧТО станешь делать? А если их поровну, и/или идут "через раз"?
И будет "В?а?с?я?"
Цитатаmishem ()
Все. Устал писать
Надо "кодировку" сменить.
- А вам какую операционку поставить - экспи, семерку или висту? - Это ты сейчас о чем? - Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный? - Ну, конечно, надежный! - Вот, значит - экспи, без вопросов! Сейчас сделаем...
(Улицы разбитых фонарей, сезон 10, серия 17)
Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!
При модном втюхе модоподдающимся начинает нравиться
Предположим есть файлы в кодировке ANCII которые нужно преобразовать в Utf-8, но среди них затесались файлы уже в кодировке UTF-8. Попробуй с помощью плагина zmFunctions перекодировать файл в кодировке UTF-8 в кодировку UTF-8. zmConvertString "AnsiToUtf8" "" ""
Вот для этого и нужно предварительное определение кодировки.
Ну так задача то значит определить кодировку файла ? и И зачем пробовать перекодировать УТФ в УТФ -надо их отбросить-т.е. определить что они в УТФ - откинуть- и перекодировать оставшиеся
ЦитатаPeter ()
Не надо было упоминать кодировку файла. На какой хрен она вообще нужна в NeoBook?!!!!
В необуке то она ненужна- но я так понял mishem делает там что то - и ему надо именно определять кодировку файла- или я вообще никак не пойму да и mishem неговорит определёно что же определять кодировку текста или файла
Создать файл в НБ, если не ошибаюсь, мы можем только ANCI.
Можно заранее создать файл в нужной кодировке - при необходимости извлекать (Далеее возникает интересный вопрос- извлечь текст из HTML-вставить в файл UTF-посмотреть результат )
Теперь прихожу к мысли что mishem хочет определять всё же кодировку текста а не файла (мухи от котлет улетать нехотят) (закончу всё же с файлами - потом уж займусь текстами)
Добавлено (17 Апреля 2016, 13:14) --------------------------------------------- mishem - было бы неплохо если б Вы скинули несколько файлов объяснив что же с ними сделать(думаю задача была бы понятнее- да и тестировать проще)( файлы в нужной кодировке можно легко создавать в notepad и Akelpad - и там же проверить кодировку текста(думаю есть возможность)
Ну, видимо на HTML-уровне это... гм...(по завитушкам) и прокатит, но на мой взгляд "копать" надо намного глубже, и посмотреть на кодировки глазами компьютера. Абсолютно все, сделанное на HTML, JS, VBS, PHP и проч. можно сделать на Delphi или С++ (но не наоборот), и надо только понять КАК это работает, а потому - изучать.
Цитата
много кружков и овалов
ЦитатаAS3856 ()
закончу всё же с файлами - потом уж займусь текстами)
Дай Бог, что б получилось! Иначе придется мишему Delphi изучать. Или на NAB решать задачу, по кружкам и овалам.
ЦитатаAS3856 ()
(мухи от котлет улетать нехотят)
Интересные котлеты.. Наверное, очень вкусные...
Добавлено (17 Апреля 2016, 13:32) --------------------------------------------- Забавно - мы сами пропагандируем здесь принцип "каков вопрос, таков и ответ", и сами же уже не один день не можем разобраться с элементарным "что нужно?". А еще новичкам нравоучения читаем, инструкции пишем... Теперь понятно почему они боятся.
- А вам какую операционку поставить - экспи, семерку или висту? - Это ты сейчас о чем? - Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный? - Ну, конечно, надежный! - Вот, значит - экспи, без вопросов! Сейчас сделаем...
(Улицы разбитых фонарей, сезон 10, серия 17)
Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!
При модном втюхе модоподдающимся начинает нравиться
zmConvertString - конвертировать строку, не файл. Уже здесь должно быть понятно что нужно определить кодировку строки, текста.
Цитатаmishem ()
определить кодировку файла можно с помощью плагинов в NeoBook А вот кодировку текста как определить, хз.
Цитатаmishem ()
Как еще объяснить?
%)
Я просто в тупике...
ОПРЕДЕЛИТЬ КОДИРОВКУ ФАЙЛА МОЖНО СРЕДСТВАМИ NEOBOOK!!! Так понятно? Определить кодировку ФАЙЛА в принципе не проблема.
Знаааачит что нууужно?
ОПРЕДЕЛИТЬ КОДИРОВКУ ТЕКСТА!!!!
ЦитатаAS3856 ()
Теперь прихожу к мысли что mishem хочет определять всё же кодировку текста а не файла
Странно, как это ты догадался? :D
ЦитатаAS3856 ()
И зачем пробовать перекодировать УТФ в УТФ
Ухххх....
Цитатаmishem ()
Попробуй с помощью плагина zmFunctions перекодировать файл в кодировке UTF-8 в кодировку UTF-8. zmConvertString "AnsiToUtf8" "" ""
Если бы попробовал поработать с этой командой, то все давно уже встало бы на свои места.
Капстом не буду писать, но считайте что все что ниже написано- в верхнем регистре!
Если в НБ перекодировать строку из ANCI в UTF8 и записать в файл, текст будет в кодировке UTF8 без BOM. Определяя кодировку такого файла мы получим что это файл ANCI.
Допустим нам нужно чтобы все файлы\текст были в кодировке UTF8. Если ставить условие типа: если файл в кодировке ANCI то перекодировать текст в UTF8. Файл в ANCI, но текст в UTF8! Перекодировав с помощью команды zmConvertString "AnsiToUtf8" текст который находится в кодировке UTF8, мы только усугубим ситуацию.
ЗНАЧИТ: Нам нужно определить не только кодировку файла, но и кодировку текста!
ФАЙЛ МОЖЕТ БЫТЬ БЕЗ ЗАГОЛОВКА, ТО ЕСТЬ ANCI, НО ТЕКСТ МОЖЕТ БЫТЬ UTF-8. ОПРЕДЕЛИТЬ КОДИРОВКУ ФАЙЛА МОЖНО СРЕДСТВАМИ NEOBOOK!!! ОПРЕДЕЛИТЬ КОДИРОВКУ ТЕКСТА СРЕДСТВАМИ NEOBOOK ПОКА НЕЛЬЗЯ!!!!
Добавлено (17 Апреля 2016, 15:00) --------------------------------------------- придётся бросить наработки определения кодировки ФАЙЛА
Добавлено (17 Апреля 2016, 16:12) ---------------------------------------------
Цитатаmishem ()
Если в НБ перекодировать строку из ANCI в UTF8 и записать в файл, текст будет в кодировке UTF8 без BOM. Определяя кодировку такого файла мы получим что это файл ANCI.
1. Так оно и есть , потому что записываем перекодированное в ANSII 2.
Цитатаmishem ()
Если в НБ перекодировать строку из ANCI в UTF8 и записать в файл,
Вопросик- в какой файл ? -( может имеет смысл записывать в файл с ВОМ если уж перекодировал)
Цитатаmishem ()
Определяя кодировку такого файла мы получим что это файл ANCI.
3. Далее определяя кодировку - получим что это UTF Вобщем тут набросок проекта нужен на необуке- и далее отрабатывать кривыми путями после перекодировок подсовывать готовые файлы (пустые) с ВОМ
Сообщение отредактировано AS3856 - Вс, 17 Апреля 2016, 16:58
Смысл не в том как записать, а в том как определить.
ЦитатаAS3856 ()
Вобщем тут набросок проекта нужен
Не нужен никакой набросок. Бери любой файл, txt, xml, html, любую страницу из интернета. И пробуй определить кодировки. Возьми любой текстовый редактор который может перекодировать файлы, сохраняй в разных кодировках какие только в голову не придут, и пробуй... Не хочешь читать хелп?