Войти
NeoBooker.ru
Добро пожаловать к нам в гости!
Наш сайт посвящён программе NeoBook, с помощью которой вы легко сможете создавать собственные мультимедиа-приложения без необходимости изучать сложные языки программирования! Зарегистрируйтесь, чтобы стать членом нашего сообщества.
  • Страница 2 из 4
  • «
  • 1
  • 2
  • 3
  • 4
  • »
Модератор форума: Peter, DEMBEL  
Форум NeoBook » Всё о программе NeoBook » Сценарии и скриптовые языки в Neobook » Функция транслитерации (Транслит русского текста)
Функция транслитерации
PeterДата: Чт, 14 Апреля 2016, 23:46 | Сообщение # 31
Админ NeoBook
Цитата AS3856 ()
то что расписал автор опуса о кодировке
т.е. он то на питоне писал- я ж могу это в vbs

Гм...
Мне легче не станет даже если он распишет еще и на анаконде, а не только на питоне.
:)

Цитата AS3856 ()
Боюсь что я "недорос" до планиностроительства......

Когда-то начинать надо?
;)
Глаза боятся, руки делают.
:)
Я уж миллион раз говорил, что после NeoBook "движением вперед" (с точки зрения развития возможностей и "покорения высот") может быть только изучение нормального языка программирования.
Все остальное (VBS, JS, PHP, и проч) - "движение в бок" и пустая трата времени, если, конечно, не требуется решить какую-нибудь конкретную рАзовую узконаправленную задачу.
Цель определяет "инструмент".


- А вам какую операционку поставить - экспи, семерку или висту?
- Это ты сейчас о чем?
- Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный?
- Ну, конечно, надежный!
- Вот, значит - экспи, без вопросов! Сейчас сделаем...

(Улицы разбитых фонарей, сезон 10, серия 17)

Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!


При модном втюхе модоподдающимся начинает нравиться
 
Сообщение
Цитата AS3856 ()
то что расписал автор опуса о кодировке
т.е. он то на питоне писал- я ж могу это в vbs

Гм...
Мне легче не станет даже если он распишет еще и на анаконде, а не только на питоне.
:)

Цитата AS3856 ()
Боюсь что я "недорос" до планиностроительства......

Когда-то начинать надо?
;)
Глаза боятся, руки делают.
:)
Я уж миллион раз говорил, что после NeoBook "движением вперед" (с точки зрения развития возможностей и "покорения высот") может быть только изучение нормального языка программирования.
Все остальное (VBS, JS, PHP, и проч) - "движение в бок" и пустая трата времени, если, конечно, не требуется решить какую-нибудь конкретную рАзовую узконаправленную задачу.
Цель определяет "инструмент".

Автор - Peter
Дата добавления - 14 Апреля 2016 в 23:46
AS3856Дата: Пт, 15 Апреля 2016, 00:21 | Сообщение # 32
Эксперт форума
Peter подскажите имеет смысл воплотить в код то что расписал автор опуса или нет
всё остальное- типа переходов на другие языки- я пишу понемногу и там и там- но пока чую слабоват...
 
СообщениеPeter подскажите имеет смысл воплотить в код то что расписал автор опуса или нет
всё остальное- типа переходов на другие языки- я пишу понемногу и там и там- но пока чую слабоват...

Автор - AS3856
Дата добавления - 15 Апреля 2016 в 00:21
PeterДата: Пт, 15 Апреля 2016, 01:44 | Сообщение # 33
Админ NeoBook
Цитата AS3856 ()
имеет смысл воплотить в код то что расписал автор опуса или нет

Боюсь, что не смогу вразумительно ответить на этот вопрос, поскольку для этого нужно хоть что-то понимать в теме, а я в ней ни бум-бум, увы...
Единственное, что могу сказать определенно, лучше сделать и пожалеть, чем не сделать, а потом жалеть (продолжать мучиться сомнениями), т.е. будет известен хоть какой-то результат, пусть даже и отрицательный.
;)
Важна еще мотивация: если самому интересно - вперед, а если нет, то...

Цитата AS3856 ()
я пишу понемногу и там и там-

За двумя зайцами....
:)
Хотя, все люди разные...
Я - "однозадачный", и никогда не возьмусь за работу, если не уверен, исключения бывают, но только когда самому интересно "чем все это закончится?".
:)
А программирование для меня - просто маленькое хобби, и занимаюсь по вдохновению, никаких обязательств перед кем-либо.. сроков..

Цитата AS3856 ()
пока чую слабоват...

Цитата Peter ()
Когда-то начинать надо?


- А вам какую операционку поставить - экспи, семерку или висту?
- Это ты сейчас о чем?
- Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный?
- Ну, конечно, надежный!
- Вот, значит - экспи, без вопросов! Сейчас сделаем...

(Улицы разбитых фонарей, сезон 10, серия 17)

Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!


При модном втюхе модоподдающимся начинает нравиться
 
Сообщение
Цитата AS3856 ()
имеет смысл воплотить в код то что расписал автор опуса или нет

Боюсь, что не смогу вразумительно ответить на этот вопрос, поскольку для этого нужно хоть что-то понимать в теме, а я в ней ни бум-бум, увы...
Единственное, что могу сказать определенно, лучше сделать и пожалеть, чем не сделать, а потом жалеть (продолжать мучиться сомнениями), т.е. будет известен хоть какой-то результат, пусть даже и отрицательный.
;)
Важна еще мотивация: если самому интересно - вперед, а если нет, то...

Цитата AS3856 ()
я пишу понемногу и там и там-

За двумя зайцами....
:)
Хотя, все люди разные...
Я - "однозадачный", и никогда не возьмусь за работу, если не уверен, исключения бывают, но только когда самому интересно "чем все это закончится?".
:)
А программирование для меня - просто маленькое хобби, и занимаюсь по вдохновению, никаких обязательств перед кем-либо.. сроков..

Цитата AS3856 ()
пока чую слабоват...

Цитата Peter ()
Когда-то начинать надо?

Автор - Peter
Дата добавления - 15 Апреля 2016 в 01:44
AS3856Дата: Пт, 15 Апреля 2016, 09:46 | Сообщение # 34
Эксперт форума
_буду делать по варианту работника серпентария , к тому же нашёл похожие темы у других "Зубров"- все говорят это единственное направление с UTF

Добавлено (15 Апреля 2016, 09:37)
---------------------------------------------

Цитата Peter ()
За двумя зайцами....

язык vbs для меня проще (заяц бежит медленнее - вот я за ним и иду)-к тому ж важен результат ,можно ехать на танке- а можно на велосипеде ,и невсегда танкист будет лидером....

Добавлено (15 Апреля 2016, 09:39)
---------------------------------------------
-Разные задачи - разные пути их решения..

Добавлено (15 Апреля 2016, 09:46)
---------------------------------------------
На данном этапе мне интереснее это сделать на VBS
А все мои размышления и опусы - Просто я хотел узнать в том ли направлении "иду за этим зайцем",
жаль что никто неможет подсказать , тема кодировок очень узконаправленна... и разбираться с октетам,байтами и битами я начал недавно..

 
Сообщение_буду делать по варианту работника серпентария , к тому же нашёл похожие темы у других "Зубров"- все говорят это единственное направление с UTF

Добавлено (15 Апреля 2016, 09:37)
---------------------------------------------

Цитата Peter ()
За двумя зайцами....

язык vbs для меня проще (заяц бежит медленнее - вот я за ним и иду)-к тому ж важен результат ,можно ехать на танке- а можно на велосипеде ,и невсегда танкист будет лидером....

Добавлено (15 Апреля 2016, 09:39)
---------------------------------------------
-Разные задачи - разные пути их решения..

Добавлено (15 Апреля 2016, 09:46)
---------------------------------------------
На данном этапе мне интереснее это сделать на VBS
А все мои размышления и опусы - Просто я хотел узнать в том ли направлении "иду за этим зайцем",
жаль что никто неможет подсказать , тема кодировок очень узконаправленна... и разбираться с октетам,байтами и битами я начал недавно..


Автор - AS3856
Дата добавления - 15 Апреля 2016 в 09:46
PeterДата: Пт, 15 Апреля 2016, 12:13 | Сообщение # 35
Админ NeoBook


- А вам какую операционку поставить - экспи, семерку или висту?
- Это ты сейчас о чем?
- Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный?
- Ну, конечно, надежный!
- Вот, значит - экспи, без вопросов! Сейчас сделаем...

(Улицы разбитых фонарей, сезон 10, серия 17)

Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!


При модном втюхе модоподдающимся начинает нравиться
 
Сообщение

Автор - Peter
Дата добавления - 15 Апреля 2016 в 12:13
AS3856Дата: Пт, 15 Апреля 2016, 12:55 | Сообщение # 36
Эксперт форума
Зачем тогда тут собрались? давайте откроем форум по делфи. Думаю здесь всё же собрались люди которые не изучали специально языки программирования , и которым хочется всё же что то сделать самому, и которые понемногу( ну может не все) изучают более серьёзные языки. - Ну так надо помочь в решении некоторых задач,Не всем даётся язык - но многим хочется .Вопрос не стоит на чём надо программировать . Мне на необуке вполне комфортно,Не думаю что мне потребуется писать на делфи что то серьёзное - как правило это связано с работоой, и его я изучаю только для себя и собственного развития.VBS мне интересен тем что можно быстро освоить основные приёмы и получать результат

Добавлено (15 Апреля 2016, 12:53)
---------------------------------------------

Цитата AS3856 ()
Это просто потому-что неизвестен толком Delphi.

-это действительно так

Добавлено (15 Апреля 2016, 12:55)
---------------------------------------------
И всё ж здесь интереснее чем на других форумах
а то ж выкладывают студенты проекты- и молчок-вот сделел и всё- ни обсуждения - ни общения

 
СообщениеЗачем тогда тут собрались? давайте откроем форум по делфи. Думаю здесь всё же собрались люди которые не изучали специально языки программирования , и которым хочется всё же что то сделать самому, и которые понемногу( ну может не все) изучают более серьёзные языки. - Ну так надо помочь в решении некоторых задач,Не всем даётся язык - но многим хочется .Вопрос не стоит на чём надо программировать . Мне на необуке вполне комфортно,Не думаю что мне потребуется писать на делфи что то серьёзное - как правило это связано с работоой, и его я изучаю только для себя и собственного развития.VBS мне интересен тем что можно быстро освоить основные приёмы и получать результат

Добавлено (15 Апреля 2016, 12:53)
---------------------------------------------

Цитата AS3856 ()
Это просто потому-что неизвестен толком Delphi.

-это действительно так

Добавлено (15 Апреля 2016, 12:55)
---------------------------------------------
И всё ж здесь интереснее чем на других форумах
а то ж выкладывают студенты проекты- и молчок-вот сделел и всё- ни обсуждения - ни общения


Автор - AS3856
Дата добавления - 15 Апреля 2016 в 12:55
PeterДата: Пт, 15 Апреля 2016, 23:00 | Сообщение # 37
Админ NeoBook


- А вам какую операционку поставить - экспи, семерку или висту?
- Это ты сейчас о чем?
- Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный?
- Ну, конечно, надежный!
- Вот, значит - экспи, без вопросов! Сейчас сделаем...

(Улицы разбитых фонарей, сезон 10, серия 17)

Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!


При модном втюхе модоподдающимся начинает нравиться
 
Сообщение

Автор - Peter
Дата добавления - 15 Апреля 2016 в 23:00
AS3856Дата: Пт, 15 Апреля 2016, 23:00 | Сообщение # 38
Эксперт форума
Кажется задача решается проще в начале файла ставится Маркер последовательности байтов (англ. Byte Order Mark (BOM)) его лишь определить - и всё (маркер utf отображается в CP1251 "п»ї"
кстати это легко проверить, надо создать в кодировке файл в UTF-8 , можно даже в нём ничего не писать,
затем в необуке создать кнопку с командой FileRead -вывести полученные значания(якобы пустого-но на самом деле там записан маркер)в объекте Text и там будет этот самый маркер отображаемый в кодировке Windows-1251 вот так "п»ї"
Написал скрипт - маркер определяется легко- всё это проверю до конца- думаю будет функция
Одно непонятно- почему на форумах(серпентаристы и php) не идут этим методом ?
 
СообщениеКажется задача решается проще в начале файла ставится Маркер последовательности байтов (англ. Byte Order Mark (BOM)) его лишь определить - и всё (маркер utf отображается в CP1251 "п»ї"
кстати это легко проверить, надо создать в кодировке файл в UTF-8 , можно даже в нём ничего не писать,
затем в необуке создать кнопку с командой FileRead -вывести полученные значания(якобы пустого-но на самом деле там записан маркер)в объекте Text и там будет этот самый маркер отображаемый в кодировке Windows-1251 вот так "п»ї"
Написал скрипт - маркер определяется легко- всё это проверю до конца- думаю будет функция
Одно непонятно- почему на форумах(серпентаристы и php) не идут этим методом ?

Автор - AS3856
Дата добавления - 15 Апреля 2016 в 23:00
PeterДата: Пт, 15 Апреля 2016, 23:09 | Сообщение # 39
Админ NeoBook
Цитата AS3856 ()
Одно непонятно- почему на форумах(серпентаристы и php) не идут этим методом ?

Ну, я так полагаю, надо спросить их напрямую.
:)


- А вам какую операционку поставить - экспи, семерку или висту?
- Это ты сейчас о чем?
- Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный?
- Ну, конечно, надежный!
- Вот, значит - экспи, без вопросов! Сейчас сделаем...

(Улицы разбитых фонарей, сезон 10, серия 17)

Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!


При модном втюхе модоподдающимся начинает нравиться
 
Сообщение
Цитата AS3856 ()
Одно непонятно- почему на форумах(серпентаристы и php) не идут этим методом ?

Ну, я так полагаю, надо спросить их напрямую.
:)

Автор - Peter
Дата добавления - 15 Апреля 2016 в 23:09
AS3856Дата: Сб, 16 Апреля 2016, 14:51 | Сообщение # 40
Эксперт форума
форумы то старые- где ж их щас сыщешь - наверно перековались на другие языки

Добавлено (16 Апреля 2016, 14:51)
---------------------------------------------
добил таки задачу- практически полностью завершено, получаю HEX (EF BB BF)для UTF-8 , можно также определять кодировку для UTF-16, UTF-32,UTF-7 - и ещё там какие то другие
(одно исключение - некоторые источники пишут что BOM(маркер) не является обязательным для файлов - хотя я такого не встречал)
Приведу в порядок функцию - и всё

 
Сообщениефорумы то старые- где ж их щас сыщешь - наверно перековались на другие языки

Добавлено (16 Апреля 2016, 14:51)
---------------------------------------------
добил таки задачу- практически полностью завершено, получаю HEX (EF BB BF)для UTF-8 , можно также определять кодировку для UTF-16, UTF-32,UTF-7 - и ещё там какие то другие
(одно исключение - некоторые источники пишут что BOM(маркер) не является обязательным для файлов - хотя я такого не встречал)
Приведу в порядок функцию - и всё


Автор - AS3856
Дата добавления - 16 Апреля 2016 в 14:51
mishemДата: Сб, 16 Апреля 2016, 15:24 | Сообщение # 41
Эксперт форума
Но это ты определишь кодировку файла, не текста!!!

Не хочешь читать хелп?

Если хелп и форум не помогли, тогда все ответы здесь



Если вы думаете, что сможете — вы сможете, если думаете, что нет — вы правы.
 
СообщениеНо это ты определишь кодировку файла, не текста!!!

Автор - mishem
Дата добавления - 16 Апреля 2016 в 15:24
mishemДата: Сб, 16 Апреля 2016, 15:35 | Сообщение # 42
Эксперт форума


Ниже сам файл
Прикрепления: 5842797.png (2.5 Kb) · 7961602.zip (0.2 Kb)


Не хочешь читать хелп?

Если хелп и форум не помогли, тогда все ответы здесь



Если вы думаете, что сможете — вы сможете, если думаете, что нет — вы правы.
 
Сообщение

Ниже сам файл

Автор - mishem
Дата добавления - 16 Апреля 2016 в 15:35
PeterДата: Сб, 16 Апреля 2016, 16:32 | Сообщение # 43
Админ NeoBook
Цитата mishem ()
Но это ты определишь кодировку файла, не текста!!!

Цитата mishem ()
Ниже сам файл

%)
mishem, возможно я чего-то не догоняю, но какой ответ ты ждешь от функции (по автоопределению кодировки), если часть текста в одной кодировке, а часть в другой?


- А вам какую операционку поставить - экспи, семерку или висту?
- Это ты сейчас о чем?
- Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный?
- Ну, конечно, надежный!
- Вот, значит - экспи, без вопросов! Сейчас сделаем...

(Улицы разбитых фонарей, сезон 10, серия 17)

Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!


При модном втюхе модоподдающимся начинает нравиться
 
Сообщение
Цитата mishem ()
Но это ты определишь кодировку файла, не текста!!!

Цитата mishem ()
Ниже сам файл

%)
mishem, возможно я чего-то не догоняю, но какой ответ ты ждешь от функции (по автоопределению кодировки), если часть текста в одной кодировке, а часть в другой?

Автор - Peter
Дата добавления - 16 Апреля 2016 в 16:32
mishemДата: Сб, 16 Апреля 2016, 17:16 | Сообщение # 44
Эксперт форума
Сам файл может быть в кодировке ANSII, а текст в Utf-8. Или еще в какой другой. Например 1252...

Вспомни, тебя зачем просили сделать первую перекодировку текста? И какая она была? Utf-8>ANSII?
НБ создает файл только в ANSII.

Может быть здесь будет более понятно.

Цитата Peter ()
если часть текста в одной кодировке, а часть в другой?

Дело не в этом. Я просто показал что в файле с одной кодировкой, текст может быть совершенно в другой кодировке. Возможность быть одной части текста в одной кодировке а другой в другой кодировке маловероятна.

Определить кодировку можно все по той же таблице символов. Если открыть тот файл что я дал выше в 16теричном редакторе, то будет видно что у каждого символа свое значение.


Не хочешь читать хелп?

Если хелп и форум не помогли, тогда все ответы здесь



Если вы думаете, что сможете — вы сможете, если думаете, что нет — вы правы.
 
СообщениеСам файл может быть в кодировке ANSII, а текст в Utf-8. Или еще в какой другой. Например 1252...

Вспомни, тебя зачем просили сделать первую перекодировку текста? И какая она была? Utf-8>ANSII?
НБ создает файл только в ANSII.

Может быть здесь будет более понятно.

Цитата Peter ()
если часть текста в одной кодировке, а часть в другой?

Дело не в этом. Я просто показал что в файле с одной кодировкой, текст может быть совершенно в другой кодировке. Возможность быть одной части текста в одной кодировке а другой в другой кодировке маловероятна.

Определить кодировку можно все по той же таблице символов. Если открыть тот файл что я дал выше в 16теричном редакторе, то будет видно что у каждого символа свое значение.

Автор - mishem
Дата добавления - 16 Апреля 2016 в 17:16
AS3856Дата: Сб, 16 Апреля 2016, 21:07 | Сообщение # 45
Эксперт форума
Цитата mishem ()
Но это ты определишь кодировку файла, не текста!!!

Ты(извини что на ты) же вроде говорил имеено определить кодировку файла ?
Или что то я упустил??

Добавлено (16 Апреля 2016, 20:37)
---------------------------------------------
Я то шёл на определение кодировки файла....
Придётся дописать и определение кодировки текстта- но здесь немного по другому,латиница то код символов одинаковы..

Добавлено (16 Апреля 2016, 20:38)
---------------------------------------------
в конце концов - можно всё засунуть в одну фнкцию

Добавлено (16 Апреля 2016, 20:42)
---------------------------------------------
кодировки
http://f9r.ru/kodir3a.html

Добавлено (16 Апреля 2016, 20:44)
---------------------------------------------
-но только кириллицы - латиница одинакова

Добавлено (16 Апреля 2016, 20:48)
---------------------------------------------
mishem - определить другую кодировку можно только в кириллице- латиница одинакова и в ANCII and UTF
видимо ты этого ждёёшь ??

Добавлено (16 Апреля 2016, 20:52)
---------------------------------------------

Цитата mishem ()
Может быть здесь будет более понятно.

я просто несовсем видимо понимаю что ты ждёшьполучить, если определить кодировку страницы сайта - так может пропарсить её и найти META Charset HTML-документа

Добавлено (16 Апреля 2016, 20:55)
---------------------------------------------
- ладно- с определением кодировки файла более- менее понятно- попробую с определением кодировки текста- и всё в одну функцию

Добавлено (16 Апреля 2016, 20:56)
---------------------------------------------
сумбурно немного пишшу- товариша проводили в посл. путь

Добавлено (16 Апреля 2016, 21:07)
---------------------------------------------
если в тексте найдены 2-3 идущие подряд русских буквы (а в utf-8 они представлены 2 байтами. Первый с кодом 208 или 209, а второй с кодом от 128 до 191) то это - текст utf-8.
пойду по этому пути

 
Сообщение
Цитата mishem ()
Но это ты определишь кодировку файла, не текста!!!

Ты(извини что на ты) же вроде говорил имеено определить кодировку файла ?
Или что то я упустил??

Добавлено (16 Апреля 2016, 20:37)
---------------------------------------------
Я то шёл на определение кодировки файла....
Придётся дописать и определение кодировки текстта- но здесь немного по другому,латиница то код символов одинаковы..

Добавлено (16 Апреля 2016, 20:38)
---------------------------------------------
в конце концов - можно всё засунуть в одну фнкцию

Добавлено (16 Апреля 2016, 20:42)
---------------------------------------------
кодировки
http://f9r.ru/kodir3a.html

Добавлено (16 Апреля 2016, 20:44)
---------------------------------------------
-но только кириллицы - латиница одинакова

Добавлено (16 Апреля 2016, 20:48)
---------------------------------------------
mishem - определить другую кодировку можно только в кириллице- латиница одинакова и в ANCII and UTF
видимо ты этого ждёёшь ??

Добавлено (16 Апреля 2016, 20:52)
---------------------------------------------

Цитата mishem ()
Может быть здесь будет более понятно.

я просто несовсем видимо понимаю что ты ждёшьполучить, если определить кодировку страницы сайта - так может пропарсить её и найти META Charset HTML-документа

Добавлено (16 Апреля 2016, 20:55)
---------------------------------------------
- ладно- с определением кодировки файла более- менее понятно- попробую с определением кодировки текста- и всё в одну функцию

Добавлено (16 Апреля 2016, 20:56)
---------------------------------------------
сумбурно немного пишшу- товариша проводили в посл. путь

Добавлено (16 Апреля 2016, 21:07)
---------------------------------------------
если в тексте найдены 2-3 идущие подряд русских буквы (а в utf-8 они представлены 2 байтами. Первый с кодом 208 или 209, а второй с кодом от 128 до 191) то это - текст utf-8.
пойду по этому пути


Автор - AS3856
Дата добавления - 16 Апреля 2016 в 21:07
mishemДата: Сб, 16 Апреля 2016, 21:31 | Сообщение # 46
Эксперт форума
Ладно, не мучайся. Вряд ли это Vbs под силу. Сейчас посидел, подумал... Во первых нужна поддержка юникод,
Во вторых все это на много проще делается, но только в плагине. Используя регулярки... Задаешь в регулярке диапазон и из какого диапазона символов больше, в той кодировке текст и находится. А все остальное мне кажется это просто танцы с бубном.


Не хочешь читать хелп?

Если хелп и форум не помогли, тогда все ответы здесь



Если вы думаете, что сможете — вы сможете, если думаете, что нет — вы правы.
 
СообщениеЛадно, не мучайся. Вряд ли это Vbs под силу. Сейчас посидел, подумал... Во первых нужна поддержка юникод,
Во вторых все это на много проще делается, но только в плагине. Используя регулярки... Задаешь в регулярке диапазон и из какого диапазона символов больше, в той кодировке текст и находится. А все остальное мне кажется это просто танцы с бубном.

Автор - mishem
Дата добавления - 16 Апреля 2016 в 21:31
AS3856Дата: Сб, 16 Апреля 2016, 22:11 | Сообщение # 47
Эксперт форума
так я про это и говорю
- vbs это под силу- просто я задачу не совсем чётко вижу (сейчас) У меня сложилось что ты хочешь определить кодировку файла - теперь же - говоришь коридовку текста - ну это тоже решаемо
Допишу всё же кодировку файла- не бросать же..- да и задача практически решена..

Добавлено (16 Апреля 2016, 22:11)
---------------------------------------------
пишу в UTF кириллицей- копиррую в файл ANSII - все нормально читается,- наоборот- тоже всё нормально,
А а вот если UTF открывать в ANSII тогда кракозябры - что то я путаюсь - что же надо сделлать...

 
Сообщениетак я про это и говорю
- vbs это под силу- просто я задачу не совсем чётко вижу (сейчас) У меня сложилось что ты хочешь определить кодировку файла - теперь же - говоришь коридовку текста - ну это тоже решаемо
Допишу всё же кодировку файла- не бросать же..- да и задача практически решена..

Добавлено (16 Апреля 2016, 22:11)
---------------------------------------------
пишу в UTF кириллицей- копиррую в файл ANSII - все нормально читается,- наоборот- тоже всё нормально,
А а вот если UTF открывать в ANSII тогда кракозябры - что то я путаюсь - что же надо сделлать...


Автор - AS3856
Дата добавления - 16 Апреля 2016 в 22:11
mishemДата: Сб, 16 Апреля 2016, 22:27 | Сообщение # 48
Эксперт форума
Цитата AS3856 ()
пишу в UTF кириллицей- копиррую в файл ANSII - все нормально читается

В Windows при копировании в буфер обмена текст копируется в юникоде. По этому он будет правильно отображаться не зависимо в какой кодировке ты его копируешь. Хотя это не совсем точная формулировка, там еще зависит от локали системы, выставленного языка и т.д. Но суть думаю ты понял.

Программы которые не понимают юникод, не смогут преобразовать текст, и он будет выглядеть крякозябрами.

Цитата AS3856 ()
А а вот если UTF открывать в ANSII тогда кракозябры

А здесь происходит то о чем я говорю. Файл в одной кодировке, текст в другой.

Цитата AS3856 ()
может пропарсить её и найти META Charset HTML-документа

А если его нет? ;)

Добавлено (16 Апреля 2016, 22:27)
---------------------------------------------

Цитата AS3856 ()
кодировку файла - теперь же - говоришь коридовку текста

У тебя вопрос был что нужно, перекодировку текста, или узнать кодировку текста. Я ответил нужно узнать...


Не хочешь читать хелп?

Если хелп и форум не помогли, тогда все ответы здесь



Если вы думаете, что сможете — вы сможете, если думаете, что нет — вы правы.
 
Сообщение
Цитата AS3856 ()
пишу в UTF кириллицей- копиррую в файл ANSII - все нормально читается

В Windows при копировании в буфер обмена текст копируется в юникоде. По этому он будет правильно отображаться не зависимо в какой кодировке ты его копируешь. Хотя это не совсем точная формулировка, там еще зависит от локали системы, выставленного языка и т.д. Но суть думаю ты понял.

Программы которые не понимают юникод, не смогут преобразовать текст, и он будет выглядеть крякозябрами.

Цитата AS3856 ()
А а вот если UTF открывать в ANSII тогда кракозябры

А здесь происходит то о чем я говорю. Файл в одной кодировке, текст в другой.

Цитата AS3856 ()
может пропарсить её и найти META Charset HTML-документа

А если его нет? ;)

Добавлено (16 Апреля 2016, 22:27)
---------------------------------------------

Цитата AS3856 ()
кодировку файла - теперь же - говоришь коридовку текста

У тебя вопрос был что нужно, перекодировку текста, или узнать кодировку текста. Я ответил нужно узнать...

Автор - mishem
Дата добавления - 16 Апреля 2016 в 22:27
AS3856Дата: Сб, 16 Апреля 2016, 22:41 | Сообщение # 49
Эксперт форума
mishem - т.е. нужно определить кодировку файла по крайне мере я так понимаю эту фразу

""Предположим есть файлы в кодировке ANCII которые нужно преобразовать в Utf-8, но среди них затесались файлы уже в кодировке UTF-8. Попробуй с помощью плагина zmFunctions перекодировать файл в кодировке UTF-8 в кодировку UTF-8.""

Так значит задача получается решена?
определение кодировки файла у меня практически в кармане

Добавлено (16 Апреля 2016, 22:41)
---------------------------------------------
в куче файлов определяем файлы с кодировкой UTF , - отбрасываем их , оставшиеся ANSII перекодируем в UTF -
и задача на этом этапе завершена
Вроде так ?

 
Сообщениеmishem - т.е. нужно определить кодировку файла по крайне мере я так понимаю эту фразу

""Предположим есть файлы в кодировке ANCII которые нужно преобразовать в Utf-8, но среди них затесались файлы уже в кодировке UTF-8. Попробуй с помощью плагина zmFunctions перекодировать файл в кодировке UTF-8 в кодировку UTF-8.""

Так значит задача получается решена?
определение кодировки файла у меня практически в кармане

Добавлено (16 Апреля 2016, 22:41)
---------------------------------------------
в куче файлов определяем файлы с кодировкой UTF , - отбрасываем их , оставшиеся ANSII перекодируем в UTF -
и задача на этом этапе завершена
Вроде так ?


Автор - AS3856
Дата добавления - 16 Апреля 2016 в 22:41
mishemДата: Вс, 17 Апреля 2016, 00:07 | Сообщение # 50
Эксперт форума
Цитата AS3856 ()
по крайне мере я так понимаю эту фразу

Нуу... В этой фразе слово файл подразумевалось под словом текст. :)

В принципе в основном к примеру файлы HTML в кодировке ANCI, имено файлы. А текст может быть уже в любой другой кодировке. Перекодировать файл, подразумевается перекодировать текст. В НБ мы можем получить текст из файла, перекодировать его, и записать обратно в файл. Создать файл в НБ, если не ошибаюсь, мы можем только ANCI.

То есть, если сам файл в кодировке ANCI, а текст в Utf-8, то получая текст из файла в НБ у нас будут крякозябры (пишу предположительно, не проверяю, может быть наоборот). Перекодировав текст, в НБ мы получим читаемый текст, и записав его в файл мы так же в итоге получим читаемый текст.

Если мы определяем файл как ANCI, и считаем что в нем текст тоже ANCI, и нам его надо перекодировать в Utf-8, а там окажется не ANCI а Utf-8, то (взято отсюда)

Так выглядит фраза «Человек сейчас увидит лишь то, что ожидает увидеть.» если она воспринята декодировщиком в кодировке Windows-1251, а не UTF-8:
ЧеР"овек сейчас СѓРІРёРґРёС‚ Р"ишь то, что ожидает увидеть.

Фраза «Человек сейчас увидит лишь то, что ожидает увидеть.» при двойном кодировании UTF-8 в UTF-8:
ЧеРВ"РѕРІРµРС" СЃРµРв"-час РЎС"РІРёРґРёС‚ Р В"ишь то, что ожидает РЎС"видеть.

Об этом я выше писал предлагая перекодировать текст UTF-8 в UTF-8.

Цитата AS3856 ()
и задача на этом этапе завершена

Блин, я сейчас уже точно не помню что именно надо и в какой последовательности. Занят совсем другим... Но к этому вопросу вернусь по любому. :)

Задача:
Есть список файлов....
Определяем кодировку файла.
Определяем кодировку текста.
Скорей всего нужно будет все перекодировать в Utf-8, но... Текст в файле мог быть к примеру (да и скорей всего) в кодировке 1252. Записываться в файл мог в кодировке 1251 (кирилица).

Чтобы более понятно было. Берем HTML файл, текст в нем на английском (но может быть на немецком, французком, китайском...) и постепенно его переводим. В итоге что получается? В какой кодировке текст в файле? :D

То есть, перед тем как переводить, файл нужно конвертнуть в Utf-8, что бы текст в любой кодировке был читаем. Но чтобы его конвертнуть, нужно определить из чего во что конвертировать. Текст может быть уже в Utf-8, может быть в 1252, может быть уже на русском в 1251 и т.д.

У меня уже голова кругом пошла. :D


Не хочешь читать хелп?

Если хелп и форум не помогли, тогда все ответы здесь



Если вы думаете, что сможете — вы сможете, если думаете, что нет — вы правы.
 
Сообщение
Цитата AS3856 ()
по крайне мере я так понимаю эту фразу

Нуу... В этой фразе слово файл подразумевалось под словом текст. :)

В принципе в основном к примеру файлы HTML в кодировке ANCI, имено файлы. А текст может быть уже в любой другой кодировке. Перекодировать файл, подразумевается перекодировать текст. В НБ мы можем получить текст из файла, перекодировать его, и записать обратно в файл. Создать файл в НБ, если не ошибаюсь, мы можем только ANCI.

То есть, если сам файл в кодировке ANCI, а текст в Utf-8, то получая текст из файла в НБ у нас будут крякозябры (пишу предположительно, не проверяю, может быть наоборот). Перекодировав текст, в НБ мы получим читаемый текст, и записав его в файл мы так же в итоге получим читаемый текст.

Если мы определяем файл как ANCI, и считаем что в нем текст тоже ANCI, и нам его надо перекодировать в Utf-8, а там окажется не ANCI а Utf-8, то (взято отсюда)

Так выглядит фраза «Человек сейчас увидит лишь то, что ожидает увидеть.» если она воспринята декодировщиком в кодировке Windows-1251, а не UTF-8:
ЧеР"овек сейчас СѓРІРёРґРёС‚ Р"ишь то, что ожидает увидеть.

Фраза «Человек сейчас увидит лишь то, что ожидает увидеть.» при двойном кодировании UTF-8 в UTF-8:
ЧеРВ"РѕРІРµРС" СЃРµРв"-час РЎС"РІРёРґРёС‚ Р В"ишь то, что ожидает РЎС"видеть.

Об этом я выше писал предлагая перекодировать текст UTF-8 в UTF-8.

Цитата AS3856 ()
и задача на этом этапе завершена

Блин, я сейчас уже точно не помню что именно надо и в какой последовательности. Занят совсем другим... Но к этому вопросу вернусь по любому. :)

Задача:
Есть список файлов....
Определяем кодировку файла.
Определяем кодировку текста.
Скорей всего нужно будет все перекодировать в Utf-8, но... Текст в файле мог быть к примеру (да и скорей всего) в кодировке 1252. Записываться в файл мог в кодировке 1251 (кирилица).

Чтобы более понятно было. Берем HTML файл, текст в нем на английском (но может быть на немецком, французком, китайском...) и постепенно его переводим. В итоге что получается? В какой кодировке текст в файле? :D

То есть, перед тем как переводить, файл нужно конвертнуть в Utf-8, что бы текст в любой кодировке был читаем. Но чтобы его конвертнуть, нужно определить из чего во что конвертировать. Текст может быть уже в Utf-8, может быть в 1252, может быть уже на русском в 1251 и т.д.

У меня уже голова кругом пошла. :D

Автор - mishem
Дата добавления - 17 Апреля 2016 в 00:07
AS3856Дата: Вс, 17 Апреля 2016, 00:24 | Сообщение # 51
Эксперт форума
mishem - давай так- я делаю функцию проверки кодировки файла (почти готова) - именно ФАЙЛА -Далее посмотришь - что там куда ещё определитью На данном этапе могу определить UTF или ANSII
Будет ещё какая то загвоздка- скажешь. У меня у самого кругом идёт чего куда определить файлы -Текст- строки
(Смешались в кучу люди, кони,котлеты ,мухи на балконе..)
 
Сообщениеmishem - давай так- я делаю функцию проверки кодировки файла (почти готова) - именно ФАЙЛА -Далее посмотришь - что там куда ещё определитью На данном этапе могу определить UTF или ANSII
Будет ещё какая то загвоздка- скажешь. У меня у самого кругом идёт чего куда определить файлы -Текст- строки
(Смешались в кучу люди, кони,котлеты ,мухи на балконе..)

Автор - AS3856
Дата добавления - 17 Апреля 2016 в 00:24
PeterДата: Вс, 17 Апреля 2016, 01:00 | Сообщение # 52
Админ NeoBook


- А вам какую операционку поставить - экспи, семерку или висту?
- Это ты сейчас о чем?
- Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный?
- Ну, конечно, надежный!
- Вот, значит - экспи, без вопросов! Сейчас сделаем...

(Улицы разбитых фонарей, сезон 10, серия 17)

Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!


При модном втюхе модоподдающимся начинает нравиться
 
Сообщение

Автор - Peter
Дата добавления - 17 Апреля 2016 в 01:00
mishemДата: Вс, 17 Апреля 2016, 01:50 | Сообщение # 53
Эксперт форума
Блин, я что ли не понятно объясняю, или вы между строк читаете? :)

Цитата Peter ()
Честно говоря, я тоже никак не мог понять что же именно мишему надо, но по логике вещей (коль скоро NB работает с текстами), предполагал что нужна именно кодировка текста, а не файла


Совершенно верно. Даже то где подразумевалось текст а не файл, чуть ниже написано:
Цитата mishem ()
Попробуй с помощью плагина zmFunctions перекодировать файл в кодировке UTF-8 в кодировку UTF-8.
zmConvertString "AnsiToUtf8" "" ""

zmConvertString - конвертировать строку, не файл. Уже здесь должно быть понятно что нужно определить кодировку строки, текста. Кодировка файла здесь вообще никаким боком. Естественно я понимаю что никто даже не попробовал. А раз не пробуете, значит не хотите понять. Толчем воду в ступе...

Получается ищу не то что надо, а то что смогу.

Здесь тоже по моему все доходчиво написано:
Цитата mishem ()
То есть в принципе определить кодировку файла можно с помощью плагинов в NeoBook два таких я по крайней мере знаю.

А вот кодировку текста как определить, хз. Здесь вот можно почитать о Utf-8


определить кодировку файла можно с помощью плагинов в NeoBook
А вот кодировку текста как определить, хз.

Как еще объяснить? %)

Цитата Peter ()
mishem, так ЧТО ЖЕ ИМЕННО НАДО-ТО?

Если плагином, кодировку файла и кодировку текста.
Кодировка файла как я уже говорил, по первым байтам заголовка файла определяется. Их там всего штук 5-6, мож чуть больше. Все остальные ANCI.

Цитата Peter ()
КАКИЕ КОНКРЕТНО КОДИРОВКИ НУЖНО ОПРЕДЕЛЯТЬ?

ВСЕ! Хотя бы предположительно.

Еще раз говорю, это можно сделать с помощью регулярных выражений. В НБ в чем проблема заключается, в плагине HPW который использует класс TRegExpr отключен Unicode, по этому с его помощью не возможно искать символы регуляркой в юникоде. Но это думаю поправимо, нужно просто Ганса попросить чтобы он включил эту функцию, но может конечно и послать... :) Пока отложил этот вопрос, занялся написанием справки для hpwTreeView, еще 9 лет назад кто то пообещал, решил исправить это положение.

Например чтобы найти все символы кириллицы, достаточно указать диапазон в регулярке [^0400-04FF], латиницы [^0020-007F], и т.д. Ну это на скорую руку, мож где ошибаюсь. Но смысл думаю понятен. Каких символов больше, та и кодировка.

Все. Устал писать. :)


Не хочешь читать хелп?

Если хелп и форум не помогли, тогда все ответы здесь



Если вы думаете, что сможете — вы сможете, если думаете, что нет — вы правы.
 
СообщениеБлин, я что ли не понятно объясняю, или вы между строк читаете? :)

Цитата Peter ()
Честно говоря, я тоже никак не мог понять что же именно мишему надо, но по логике вещей (коль скоро NB работает с текстами), предполагал что нужна именно кодировка текста, а не файла


Совершенно верно. Даже то где подразумевалось текст а не файл, чуть ниже написано:
Цитата mishem ()
Попробуй с помощью плагина zmFunctions перекодировать файл в кодировке UTF-8 в кодировку UTF-8.
zmConvertString "AnsiToUtf8" "" ""

zmConvertString - конвертировать строку, не файл. Уже здесь должно быть понятно что нужно определить кодировку строки, текста. Кодировка файла здесь вообще никаким боком. Естественно я понимаю что никто даже не попробовал. А раз не пробуете, значит не хотите понять. Толчем воду в ступе...

Получается ищу не то что надо, а то что смогу.

Здесь тоже по моему все доходчиво написано:
Цитата mishem ()
То есть в принципе определить кодировку файла можно с помощью плагинов в NeoBook два таких я по крайней мере знаю.

А вот кодировку текста как определить, хз. Здесь вот можно почитать о Utf-8


определить кодировку файла можно с помощью плагинов в NeoBook
А вот кодировку текста как определить, хз.

Как еще объяснить? %)

Цитата Peter ()
mishem, так ЧТО ЖЕ ИМЕННО НАДО-ТО?

Если плагином, кодировку файла и кодировку текста.
Кодировка файла как я уже говорил, по первым байтам заголовка файла определяется. Их там всего штук 5-6, мож чуть больше. Все остальные ANCI.

Цитата Peter ()
КАКИЕ КОНКРЕТНО КОДИРОВКИ НУЖНО ОПРЕДЕЛЯТЬ?

ВСЕ! Хотя бы предположительно.

Еще раз говорю, это можно сделать с помощью регулярных выражений. В НБ в чем проблема заключается, в плагине HPW который использует класс TRegExpr отключен Unicode, по этому с его помощью не возможно искать символы регуляркой в юникоде. Но это думаю поправимо, нужно просто Ганса попросить чтобы он включил эту функцию, но может конечно и послать... :) Пока отложил этот вопрос, занялся написанием справки для hpwTreeView, еще 9 лет назад кто то пообещал, решил исправить это положение.

Например чтобы найти все символы кириллицы, достаточно указать диапазон в регулярке [^0400-04FF], латиницы [^0020-007F], и т.д. Ну это на скорую руку, мож где ошибаюсь. Но смысл думаю понятен. Каких символов больше, та и кодировка.

Все. Устал писать. :)

Автор - mishem
Дата добавления - 17 Апреля 2016 в 01:50
PeterДата: Вс, 17 Апреля 2016, 03:04 | Сообщение # 54
Админ NeoBook
Цитата mishem ()
Как еще объяснить?

Не надо было упоминать кодировку файла.
На какой хрен она вообще нужна в NeoBook?!!!!
%)
NeoBook реально может работать только с ANSI-строками (текстами) и ФСЕ!
Нужно изучить тему от а до я, а не действовать с наскоку и наугад, иначе так и будем ходить кругами.
И думаю, что решить эту задачу (если ее вообще можно решить) получится только плагином.
Цитата mishem ()
Каких символов больше, та и кодировка.

%)
Гм...
Такой подход вообще не понимаю.
А с остальными-то символами ЧТО станешь делать?
А если их поровну, и/или идут "через раз"?
;)
И будет "В?а?с?я?"

Цитата mishem ()
Все. Устал писать

Надо "кодировку" сменить.
:)


- А вам какую операционку поставить - экспи, семерку или висту?
- Это ты сейчас о чем?
- Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный?
- Ну, конечно, надежный!
- Вот, значит - экспи, без вопросов! Сейчас сделаем...

(Улицы разбитых фонарей, сезон 10, серия 17)

Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!


При модном втюхе модоподдающимся начинает нравиться
 
Сообщение
Цитата mishem ()
Как еще объяснить?

Не надо было упоминать кодировку файла.
На какой хрен она вообще нужна в NeoBook?!!!!
%)
NeoBook реально может работать только с ANSI-строками (текстами) и ФСЕ!
Нужно изучить тему от а до я, а не действовать с наскоку и наугад, иначе так и будем ходить кругами.
И думаю, что решить эту задачу (если ее вообще можно решить) получится только плагином.
Цитата mishem ()
Каких символов больше, та и кодировка.

%)
Гм...
Такой подход вообще не понимаю.
А с остальными-то символами ЧТО станешь делать?
А если их поровну, и/или идут "через раз"?
;)
И будет "В?а?с?я?"

Цитата mishem ()
Все. Устал писать

Надо "кодировку" сменить.
:)

Автор - Peter
Дата добавления - 17 Апреля 2016 в 03:04
mishemДата: Вс, 17 Апреля 2016, 06:29 | Сообщение # 55
Эксперт форума
Цитата Peter ()
Не надо было упоминать кодировку файла.

http://neobooker.ru/forum/38-3470-74820-16-1460392072

Цитата Peter ()
Нужно изучить тему от а до я

https://habrahabr.ru/post/147838/
https://habrahabr.ru/post/147843/
http://is.gd/5okKTZ
и т.д.
:)


Не хочешь читать хелп?

Если хелп и форум не помогли, тогда все ответы здесь



Если вы думаете, что сможете — вы сможете, если думаете, что нет — вы правы.
 
Сообщение
Цитата Peter ()
Не надо было упоминать кодировку файла.

http://neobooker.ru/forum/38-3470-74820-16-1460392072

Цитата Peter ()
Нужно изучить тему от а до я

https://habrahabr.ru/post/147838/
https://habrahabr.ru/post/147843/
http://is.gd/5okKTZ
и т.д.
:)

Автор - mishem
Дата добавления - 17 Апреля 2016 в 06:29
AS3856Дата: Вс, 17 Апреля 2016, 13:14 | Сообщение # 56
Эксперт форума
mishem - Вы ж говорили
Цитата mishem ()
Предположим есть файлы в кодировке ANCII которые нужно преобразовать в Utf-8, но среди них затесались файлы уже в кодировке UTF-8. Попробуй с помощью плагина zmFunctions перекодировать файл в кодировке UTF-8 в кодировку UTF-8.
zmConvertString "AnsiToUtf8" "" ""

Вот для этого и нужно предварительное определение кодировки.

Ну так задача то значит определить кодировку файла ?
и И зачем пробовать перекодировать УТФ в УТФ -надо их отбросить-т.е. определить что они в УТФ - откинуть- и перекодировать оставшиеся
Цитата Peter ()
Не надо было упоминать кодировку файла.
На какой хрен она вообще нужна в NeoBook?!!!!


В необуке то она ненужна- но я так понял mishem делает там что то - и ему надо именно определять кодировку файла- или я вообще никак не пойму
да и mishem неговорит определёно что же определять кодировку текста или файла

Кстати- https://habrahabr.ru/post/147838/ только картинка с табличками мелкими- а сырец посмотреть или скачать невозможно

Цитата mishem ()
Создать файл в НБ, если не ошибаюсь, мы можем только ANCI.


Можно заранее создать файл в нужной кодировке - при необходимости извлекать
(Далеее возникает интересный вопрос- извлечь текст из HTML-вставить в файл UTF-посмотреть результат )

Теперь прихожу к мысли что mishem хочет определять всё же кодировку текста а не файла
(мухи от котлет улетать нехотят)
(закончу всё же с файлами - потом уж займусь текстами)

Добавлено (17 Апреля 2016, 13:14)
---------------------------------------------
mishem - было бы неплохо если б Вы скинули несколько файлов объяснив что же с ними сделать(думаю задача была бы понятнее- да и тестировать проще)( файлы в нужной кодировке можно легко создавать в notepad и
Akelpad - и там же проверить кодировку текста(думаю есть возможность)

 
Сообщениеmishem - Вы ж говорили
Цитата mishem ()
Предположим есть файлы в кодировке ANCII которые нужно преобразовать в Utf-8, но среди них затесались файлы уже в кодировке UTF-8. Попробуй с помощью плагина zmFunctions перекодировать файл в кодировке UTF-8 в кодировку UTF-8.
zmConvertString "AnsiToUtf8" "" ""

Вот для этого и нужно предварительное определение кодировки.

Ну так задача то значит определить кодировку файла ?
и И зачем пробовать перекодировать УТФ в УТФ -надо их отбросить-т.е. определить что они в УТФ - откинуть- и перекодировать оставшиеся
Цитата Peter ()
Не надо было упоминать кодировку файла.
На какой хрен она вообще нужна в NeoBook?!!!!


В необуке то она ненужна- но я так понял mishem делает там что то - и ему надо именно определять кодировку файла- или я вообще никак не пойму
да и mishem неговорит определёно что же определять кодировку текста или файла

Кстати- https://habrahabr.ru/post/147838/ только картинка с табличками мелкими- а сырец посмотреть или скачать невозможно

Цитата mishem ()
Создать файл в НБ, если не ошибаюсь, мы можем только ANCI.


Можно заранее создать файл в нужной кодировке - при необходимости извлекать
(Далеее возникает интересный вопрос- извлечь текст из HTML-вставить в файл UTF-посмотреть результат )

Теперь прихожу к мысли что mishem хочет определять всё же кодировку текста а не файла
(мухи от котлет улетать нехотят)
(закончу всё же с файлами - потом уж займусь текстами)

Добавлено (17 Апреля 2016, 13:14)
---------------------------------------------
mishem - было бы неплохо если б Вы скинули несколько файлов объяснив что же с ними сделать(думаю задача была бы понятнее- да и тестировать проще)( файлы в нужной кодировке можно легко создавать в notepad и
Akelpad - и там же проверить кодировку текста(думаю есть возможность)


Автор - AS3856
Дата добавления - 17 Апреля 2016 в 13:14
PeterДата: Вс, 17 Апреля 2016, 13:32 | Сообщение # 57
Админ NeoBook
Цитата AS3856 ()
да и mishem неговорит определёно что же определять кодировку текста или файла

В том-то все и дело!
И фраза из:

только как-раз запутывает ситуацию, а не проясняет.
Цитата mishem ()
https://habrahabr.ru/post/147838/
https://habrahabr.ru/post/147843/

Ну, видимо на HTML-уровне это... гм...(по завитушкам) и прокатит, но на мой взгляд "копать" надо намного глубже, и посмотреть на кодировки глазами компьютера.
Абсолютно все, сделанное на HTML, JS, VBS, PHP и проч. можно сделать на Delphi или С++ (но не наоборот), и надо только понять КАК это работает, а потому - изучать.

Цитата
много кружков и овалов

thumbs_up

Цитата AS3856 ()
закончу всё же с файлами - потом уж займусь текстами)

Дай Бог, что б получилось!
Иначе придется мишему Delphi изучать.
Или на NAB решать задачу, по кружкам и овалам.
:)

Цитата AS3856 ()
(мухи от котлет улетать нехотят)

Интересные котлеты..
Наверное, очень вкусные...

Добавлено (17 Апреля 2016, 13:32)
---------------------------------------------
Забавно - мы сами пропагандируем здесь принцип "каков вопрос, таков и ответ", и сами же уже не один день не можем разобраться с элементарным "что нужно?".
А еще новичкам нравоучения читаем, инструкции пишем...
Теперь понятно почему они боятся.
:D


- А вам какую операционку поставить - экспи, семерку или висту?
- Это ты сейчас о чем?
- Олег Георгиевич, вам какой компьютер хотелось бы - молодежный или надежный?
- Ну, конечно, надежный!
- Вот, значит - экспи, без вопросов! Сейчас сделаем...

(Улицы разбитых фонарей, сезон 10, серия 17)

Единственная инновация Windows 8 это - Metro, чтобы дебилы по иконкам не промахивались!


При модном втюхе модоподдающимся начинает нравиться
 
Сообщение
Цитата AS3856 ()
да и mishem неговорит определёно что же определять кодировку текста или файла

В том-то все и дело!
И фраза из:

только как-раз запутывает ситуацию, а не проясняет.
Цитата mishem ()
https://habrahabr.ru/post/147838/
https://habrahabr.ru/post/147843/

Ну, видимо на HTML-уровне это... гм...(по завитушкам) и прокатит, но на мой взгляд "копать" надо намного глубже, и посмотреть на кодировки глазами компьютера.
Абсолютно все, сделанное на HTML, JS, VBS, PHP и проч. можно сделать на Delphi или С++ (но не наоборот), и надо только понять КАК это работает, а потому - изучать.

Цитата
много кружков и овалов

thumbs_up

Цитата AS3856 ()
закончу всё же с файлами - потом уж займусь текстами)

Дай Бог, что б получилось!
Иначе придется мишему Delphi изучать.
Или на NAB решать задачу, по кружкам и овалам.
:)

Цитата AS3856 ()
(мухи от котлет улетать нехотят)

Интересные котлеты..
Наверное, очень вкусные...

Добавлено (17 Апреля 2016, 13:32)
---------------------------------------------
Забавно - мы сами пропагандируем здесь принцип "каков вопрос, таков и ответ", и сами же уже не один день не можем разобраться с элементарным "что нужно?".
А еще новичкам нравоучения читаем, инструкции пишем...
Теперь понятно почему они боятся.
:D

Автор - Peter
Дата добавления - 17 Апреля 2016 в 13:32
mishemДата: Вс, 17 Апреля 2016, 14:31 | Сообщение # 58
Эксперт форума
Да вы что, смеетесь или издеваетесь?
:D

Цитата mishem ()
zmConvertString - конвертировать строку, не файл. Уже здесь должно быть понятно что нужно определить кодировку строки, текста.

Цитата mishem ()
определить кодировку файла можно с помощью плагинов в NeoBook
А вот кодировку текста как определить, хз.

Цитата mishem ()
Как еще объяснить?


%)

Я просто в тупике...

ОПРЕДЕЛИТЬ КОДИРОВКУ ФАЙЛА МОЖНО СРЕДСТВАМИ NEOBOOK!!!
Так понятно? Определить кодировку ФАЙЛА в принципе не проблема.

Знаааачит что нууужно?

ОПРЕДЕЛИТЬ КОДИРОВКУ ТЕКСТА!!!!

Цитата AS3856 ()
Теперь прихожу к мысли что mishem хочет определять всё же кодировку текста а не файла

Странно, как это ты догадался?
:D

Цитата AS3856 ()
И зачем пробовать перекодировать УТФ в УТФ

Ухххх....

Цитата mishem ()
Попробуй с помощью плагина zmFunctions перекодировать файл в кодировке UTF-8 в кодировку UTF-8.
zmConvertString "AnsiToUtf8" "" ""


Если бы попробовал поработать с этой командой, то все давно уже встало бы на свои места.

Капстом не буду писать, но считайте что все что ниже написано- в верхнем регистре!

Если в НБ перекодировать строку из ANCI в UTF8 и записать в файл, текст будет в кодировке UTF8 без BOM.
Определяя кодировку такого файла мы получим что это файл ANCI.

Допустим нам нужно чтобы все файлы\текст были в кодировке UTF8. Если ставить условие типа: если файл в кодировке ANCI то перекодировать текст в UTF8. Файл в ANCI, но текст в UTF8! Перекодировав с помощью команды zmConvertString "AnsiToUtf8" текст который находится в кодировке UTF8, мы только усугубим ситуацию.

ЗНАЧИТ:
Нам нужно определить не только кодировку файла, но и кодировку текста!

ФАЙЛ МОЖЕТ БЫТЬ БЕЗ ЗАГОЛОВКА, ТО ЕСТЬ ANCI, НО ТЕКСТ МОЖЕТ БЫТЬ UTF-8.
ОПРЕДЕЛИТЬ КОДИРОВКУ ФАЙЛА МОЖНО СРЕДСТВАМИ NEOBOOK!!!
ОПРЕДЕЛИТЬ КОДИРОВКУ ТЕКСТА СРЕДСТВАМИ NEOBOOK ПОКА НЕЛЬЗЯ!!!!

Понятно? Нет? Или еще раз попробовать?
:D


Не хочешь читать хелп?

Если хелп и форум не помогли, тогда все ответы здесь



Если вы думаете, что сможете — вы сможете, если думаете, что нет — вы правы.


Сообщение отредактировано
mishem - Вс, 17 Апреля 2016, 14:38
 
СообщениеДа вы что, смеетесь или издеваетесь?
:D

Цитата mishem ()
zmConvertString - конвертировать строку, не файл. Уже здесь должно быть понятно что нужно определить кодировку строки, текста.

Цитата mishem ()
определить кодировку файла можно с помощью плагинов в NeoBook
А вот кодировку текста как определить, хз.

Цитата mishem ()
Как еще объяснить?


%)

Я просто в тупике...

ОПРЕДЕЛИТЬ КОДИРОВКУ ФАЙЛА МОЖНО СРЕДСТВАМИ NEOBOOK!!!
Так понятно? Определить кодировку ФАЙЛА в принципе не проблема.

Знаааачит что нууужно?

ОПРЕДЕЛИТЬ КОДИРОВКУ ТЕКСТА!!!!

Цитата AS3856 ()
Теперь прихожу к мысли что mishem хочет определять всё же кодировку текста а не файла

Странно, как это ты догадался?
:D

Цитата AS3856 ()
И зачем пробовать перекодировать УТФ в УТФ

Ухххх....

Цитата mishem ()
Попробуй с помощью плагина zmFunctions перекодировать файл в кодировке UTF-8 в кодировку UTF-8.
zmConvertString "AnsiToUtf8" "" ""


Если бы попробовал поработать с этой командой, то все давно уже встало бы на свои места.

Капстом не буду писать, но считайте что все что ниже написано- в верхнем регистре!

Если в НБ перекодировать строку из ANCI в UTF8 и записать в файл, текст будет в кодировке UTF8 без BOM.
Определяя кодировку такого файла мы получим что это файл ANCI.

Допустим нам нужно чтобы все файлы\текст были в кодировке UTF8. Если ставить условие типа: если файл в кодировке ANCI то перекодировать текст в UTF8. Файл в ANCI, но текст в UTF8! Перекодировав с помощью команды zmConvertString "AnsiToUtf8" текст который находится в кодировке UTF8, мы только усугубим ситуацию.

ЗНАЧИТ:
Нам нужно определить не только кодировку файла, но и кодировку текста!

ФАЙЛ МОЖЕТ БЫТЬ БЕЗ ЗАГОЛОВКА, ТО ЕСТЬ ANCI, НО ТЕКСТ МОЖЕТ БЫТЬ UTF-8.
ОПРЕДЕЛИТЬ КОДИРОВКУ ФАЙЛА МОЖНО СРЕДСТВАМИ NEOBOOK!!!
ОПРЕДЕЛИТЬ КОДИРОВКУ ТЕКСТА СРЕДСТВАМИ NEOBOOK ПОКА НЕЛЬЗЯ!!!!

Понятно? Нет? Или еще раз попробовать?
:D

Автор - mishem
Дата добавления - 17 Апреля 2016 в 14:31
AS3856Дата: Вс, 17 Апреля 2016, 16:12 | Сообщение # 59
Эксперт форума
чё шуметь то - так бы сразу и сказал :D

Добавлено (17 Апреля 2016, 15:00)
---------------------------------------------
придётся бросить наработки определения кодировки ФАЙЛА

Добавлено (17 Апреля 2016, 16:12)
---------------------------------------------
Цитата mishem ()
Если в НБ перекодировать строку из ANCI в UTF8 и записать в файл, текст будет в кодировке UTF8 без BOM.
Определяя кодировку такого файла мы получим что это файл ANCI.

1. Так оно и есть , потому что записываем перекодированное в ANSII
2.
Цитата mishem ()
Если в НБ перекодировать строку из ANCI в UTF8 и записать в файл,

Вопросик- в какой файл ? -( может имеет смысл записывать в файл с ВОМ если уж перекодировал)
Цитата mishem ()
Определяя кодировку такого файла мы получим что это файл ANCI.

3. Далее определяя кодировку - получим что это UTF
Вобщем тут набросок проекта нужен на необуке- и далее отрабатывать кривыми путями после перекодировок подсовывать готовые файлы (пустые) с ВОМ


Сообщение отредактировано
AS3856 - Вс, 17 Апреля 2016, 16:58
 
Сообщениечё шуметь то - так бы сразу и сказал :D

Добавлено (17 Апреля 2016, 15:00)
---------------------------------------------
придётся бросить наработки определения кодировки ФАЙЛА

Добавлено (17 Апреля 2016, 16:12)
---------------------------------------------
Цитата mishem ()
Если в НБ перекодировать строку из ANCI в UTF8 и записать в файл, текст будет в кодировке UTF8 без BOM.
Определяя кодировку такого файла мы получим что это файл ANCI.

1. Так оно и есть , потому что записываем перекодированное в ANSII
2.
Цитата mishem ()
Если в НБ перекодировать строку из ANCI в UTF8 и записать в файл,

Вопросик- в какой файл ? -( может имеет смысл записывать в файл с ВОМ если уж перекодировал)
Цитата mishem ()
Определяя кодировку такого файла мы получим что это файл ANCI.

3. Далее определяя кодировку - получим что это UTF
Вобщем тут набросок проекта нужен на необуке- и далее отрабатывать кривыми путями после перекодировок подсовывать готовые файлы (пустые) с ВОМ

Автор - AS3856
Дата добавления - 17 Апреля 2016 в 16:12
mishemДата: Вс, 17 Апреля 2016, 17:51 | Сообщение # 60
Эксперт форума
Цитата AS3856 ()
Далее определяя кодировку - получим что это UTF

Смысл не в том как записать, а в том как определить.

Цитата AS3856 ()
Вобщем тут набросок проекта нужен

Не нужен никакой набросок. Бери любой файл, txt, xml, html, любую страницу из интернета. И пробуй определить кодировки. Возьми любой текстовый редактор который может перекодировать файлы, сохраняй в разных кодировках какие только в голову не придут, и пробуй...


Не хочешь читать хелп?

Если хелп и форум не помогли, тогда все ответы здесь



Если вы думаете, что сможете — вы сможете, если думаете, что нет — вы правы.
 
Сообщение
Цитата AS3856 ()
Далее определяя кодировку - получим что это UTF

Смысл не в том как записать, а в том как определить.

Цитата AS3856 ()
Вобщем тут набросок проекта нужен

Не нужен никакой набросок. Бери любой файл, txt, xml, html, любую страницу из интернета. И пробуй определить кодировки. Возьми любой текстовый редактор который может перекодировать файлы, сохраняй в разных кодировках какие только в голову не придут, и пробуй...

Автор - mishem
Дата добавления - 17 Апреля 2016 в 17:51
Форум NeoBook » Всё о программе NeoBook » Сценарии и скриптовые языки в Neobook » Функция транслитерации (Транслит русского текста)
  • Страница 2 из 4
  • «
  • 1
  • 2
  • 3
  • 4
  • »
Поиск: