FineReader 12 Professional

Аватар пользователя Антонина82
Forums: 

ABBYY по электронке известил, что вышла версия FineReader 12 Professional. Что нового - здесь,цена - 4490. Я уже с 11 сроднилась. Всяких обновлений побаиваюсь. Кто здесь самый смелый - сообщите, стоит менять шило на мыло?

Аватар пользователя AllexOld

По сравнению с 11-ым добавлены 2 новых языка: рýсский с ударéниями, арабский
и четыре словаря: рýсский с ударéниями, арабский, русский (старая орфография), азербайджанский (латиница)

Аватар пользователя Ser9ey

AllexOld написал:
По сравнению с 11-ым добавлены 2 новых языка: рýсский с ударéниями, арабский
и четыре словаря: рýсский с ударéниями, арабский, русский (старая орфография), азербайджанский (латиница)

Да вроде ж было.

Ser9ey написал:
AllexOld написал:
По сравнению с 11-ым добавлены 2 новых языка: рýсский с ударéниями, арабский
и четыре словаря: рýсский с ударéниями, арабский, русский (старая орфография), азербайджанский (латиница)

Да вроде ж было.

Было, было. И распознавалось на нормальном скане очень даже хорошо.
Аватар пользователя Ser9ey

J_Blood написал:
Ser9ey написал:
AllexOld написал:
По сравнению с 11-ым добавлены 2 новых языка: рýсский с ударéниями, арабский
и четыре словаря: рýсский с ударéниями, арабский, русский (старая орфография), азербайджанский (латиница)

Да вроде ж было.

Было, было. И распознавалось на нормальном скане очень даже хорошо.

То то ж и оно, что все дорев пдф делались видать на основе старых фотослайдов и качство в аснавном мерзнйшее.
Аватар пользователя golma1

Ser9ey написал:
AllexOld написал:
По сравнению с 11-ым добавлены 2 новых языка: рýсский с ударéниями, арабский
и четыре словаря: рýсский с ударéниями, арабский, русский (старая орфография), азербайджанский (латиница)

Да вроде ж было.

С ударениями не было. Это может быть интересно.
Аватар пользователя geksel

Тут важна старая русская орфография. Это хорошо. А вот как у него с распознаванием?

Аватар пользователя Ser9ey

geksel написал:
Тут важна старая русская орфография. Это хорошо. А вот как у него с распознаванием?

Им нет дела до нашей старой русской орфографии и особенно ее распознавании. Кажную книгу нада зверски править, инохда легче вааще с нуля перепечатать.

Да всё также. Без ИИ (см. фильм "Her") не справиться...

а (ежли чо) прикрутить их к 11й можно?

Аватар пользователя izekbis

Морфологию, добавляемых в словари слов, так и не вернули.

Аватар пользователя golma1

izekbis написал:
Морфологию, добавляемых в словари слов, так и не вернули.

А вот это - плохо. Я надеялась, что только в последней версии "выпала" эта опция. :(

IMHO, если не нужны ударения, то не сто́ит.

Аватар пользователя Антонина82

Zadd написал:
IMHO, если не нужны ударения, то не сто́ит.

Иной раз с ударениями так намаешься, расставляя их вручную. Особенно если попадется книжка где бесконечные папа и мама. Захотелось попробовать, как это получится.
И там еще невнятная запись
Цитата:
До 10% повышена точность определения структуры бизнес-документов и книг.
Что это означает ? Неужели научили правильно определять часть текста, выделенную * * *?
Аватар пользователя golma1

Антонина82 написал:

И там еще невнятная запись
Цитата:
До 10% повышена точность определения структуры бизнес-документов и книг.
Что это означает ? Неужели научили правильно определять часть текста, выделенную * * *?

... и не распознавать часть диалога как "оглавление"?
Аватар пользователя mazay

Zadd написал:
IMHO, если не нужны ударения, то не сто́ит.

А ударения в латинице есть?
Вот книжка, которую хотелось бы перевести в фб2: Цыбульник Ю. Крылатые латинские выражения. 2003.djvu
Аватар пользователя alexej36

С Руборда:

Цитата:
Скачал пробную версию FR12. Решил сделать небольшой тест в сравнении с FR11 http://rghost.ru/52369226
Аватар пользователя golma1

alexej36 написал:
С Руборда:
Цитата:
Скачал пробную версию FR12. Решил сделать небольшой тест в сравнении с FR11 http://rghost.ru/52369226

Ну, очень специфичный пример. ;)

За исключением разбивки на блоки, ФР11 справился лучше ФР12, на мой взгляд.

Аватар пользователя izekbis

alexej36 написал:
С Руборда:
Цитата:
Скачал пробную версию FR12. Решил сделать небольшой тест в сравнении с FR11 http://rghost.ru/52369226

Выложите словари рýсский с ударéниями, русский (старая орфография), если они совместимы с 11.
Аватар пользователя Belomor.canal

Интересно в FR12 можно самому назначать область сносок? Авто определение сносок было и есть кошмаром FR11 - особенно при работе с дневниками и прочими книгами

Аватар пользователя alexej36

Можно скачать триальную версию и посмотреть.
http://fr7.abbyy.com/fr12/ABBYY_FineReader_12_Professional.exe

Аватар пользователя Belomor.canal

alexej36 написал:
Можно скачать триальную версию и посмотреть.
http://fr7.abbyy.com/fr12/ABBYY_FineReader_12_Professional.exe

А она не конфликтует с имеющейся?
В описании сказано
Возможность отключения определения элементов структуры (сноски, колонтитулы, оглавление и тп.)
и что это значит?
Я бы документацию скачал а не exe
Аватар пользователя sd

Belomor.canal написал:
Я бы документацию скачал а не exe

Страница с руководствами (нужную ссылку лучше сразу отправлять в Загрузки или вставить в даунладер)
Аватар пользователя golma1

sd написал:
Belomor.canal написал:
Я бы документацию скачал а не exe

Страница с руководствами (нужную ссылку лучше сразу отправлять в Загрузки или вставить в даунладер)

Нет, там общие слова. Но даётся ссылка на более подробную справку: http://help.abbyy.com/FineReader/FineReader12/Russian/ImproveResults/ImproveResults.htm

Про определение элементов:
http://help.abbyy.com/FineReader/FineReader12/Russian/Recognition/RecOptions.htm#StructElements

Что-то я не вижу fb2-формата: http://help.abbyy.com/FineReader/FineReader12/Russian/SavingResults/SaveToEdit.htm
upd:
отбой: http://help.abbyy.com/FineReader/FineReader12/Russian/SavingResults/SaveEBook.htm

Аватар пользователя Belomor.canal

golma1 написал:

Про определение элементов:
http://help.abbyy.com/FineReader/FineReader12/Russian/Recognition/RecOptions.htm#StructElements

Именно - максимально учли пожелания - сделать галку "не распознавать сноски"
Ну а далее подручным струментом сноски растаскивать.
У меня знакомый из за отсутствия такой галки до сих пор на Фр7 - для научной литературы ФР11 иногда не укрутим в своей фантазии что бы нам такое сделать сносками

Аватар пользователя Belomor.canal

golma1 написал:

Что-то я не вижу fb2-формата: http://help.abbyy.com/FineReader/FineReader12/Russian/SavingResults/SaveToEdit.htm

Есть как же! Только это всё малоуправляемо, как и сохранение в ePub. Лучше проверенной тропой в DOC. Вокруг Doc с бубном и готово :-)))

Belomor.canal написал:
Вокруг Doc с бубном и готово :-)))
Лучше в ODT, а потом OOoFBTools и готово! :)))
Аватар пользователя sd


Не вижу как заполнять метаданные, т.е. FB2 и EPUB в любом случае придется отправлять в дополнительный редактор.
Аватар пользователя Belomor.canal

sd написал:

Не вижу как заполнять метаданные, т.е. FB2 и EPUB в любом случае придется отправлять в дополнительный редактор.

Интересно, а что FR12 делает со сносками, которые не знает куда девать, при сохранение в fb2?
FR11 их смело "глотал" - т.е. найти следы проглоченного текста, можно было тщательным сличением исходника и результата. Из за этого пользоваться такимс сохранением было не возможно или очень накладно!
Аватар пользователя sd

В руководстве:

Цитата:
В продукте появилась возможность отключать генерацию таких элементов структуры, как колонтитулы, сноски, содержание, нумерованные списки. Возможность воспроизводить их как обычный текст позволит избежать проблем при обработке некоторых элементов сторонними продуктами (например, системами перевода или конверторами в e–book).

А так, да: DOC to FBE or RTF/DOCX to calibre to FBE
Аватар пользователя golma1

sd написал:

Не вижу как заполнять метаданные, т.е. FB2 и EPUB в любом случае придется отправлять в дополнительный редактор.

Ну так это само собой. Я и не рассчитывала, что из ФР можно получить приличный фб2.
Просто импорт сразу из ФР делает ненужным промежуточный конвертер.

Аватар пользователя sd

Да, стормозил я. Пропустил и эту тему, и эту
Из-за того, что использую ФР редко, оказалось проще, чем переучиваться, использовать посредников (раньше - ВордПад, сейчас - Калибри), но другим - не советую. Лучше переучиться.

Аватар пользователя izekbis

sd написал:
Belomor.canal написал:
Я бы документацию скачал а не exe

Страница с руководствами (нужную ссылку лучше сразу отправлять в Загрузки или вставить в даунладер)

ABBYY FineReader 12 Руководство по эксплуатации в формате doc http://yadi.sk/d/Z2zAJj-mHq3FY
Аватар пользователя izekbis

Belomor.canal написал:
Интересно в FR12 можно самому назначать область сносок? Авто определение сносок было и есть кошмаром FR11 - особенно при работе с дневниками и прочими книгами

Надо заставлять ФР определять сноски стилем «Сноска». Если ФР определил сноски стилем «Сноска» он связывает текст сносок с их индексом в тексте. При этом, при передаче в другие приложения Ворд , FBE, сноски там определятся стилем «Сноска». Вставлять сноски будет не нужно. Если, сноска распознана любым другим стилем, она к индексу не привязывается, и сноски там не определятся стилем «Сноска». ФР, обычно не может определить стиль «Сноска», когда не может привязать ее к индексу. Обычно это бывает, при плохом качестве изображения индекса в тексте сноски или тексте книги.
Если, ФР не распознал сноски стилем «Сноска», я выделяю сноски, назначаю стилем «Основной текст» (чтобы ФР не принял их за колонтитул ) и даю перераспознать страницу. Обычно, при нормальном качестве изображения, ФР распознает их стилем «Сноска».
Аватар пользователя Belomor.canal

izekbis написал:

Если, ФР не распознал сноски стилем «Сноска», я выделяю сноски, назначаю стилем «Основной текст» (чтобы ФР не принял их за колонтитул ) и даю перераспознать страницу. Обычно, при нормальном качестве изображения, ФР распознает их стилем «Сноска».

У каждого свои фирменные средства, мне нравятся те что предложила в своё время Golma
Поищите - есть целая тема.
Аватар пользователя izekbis

Belomor.canal написал:
izekbis написал:

Если, ФР не распознал сноски стилем «Сноска», я выделяю сноски, назначаю стилем «Основной текст» (чтобы ФР не принял их за колонтитул ) и даю перераспознать страницу. Обычно, при нормальном качестве изображения, ФР распознает их стилем «Сноска».

У каждого свои фирменные средства, мне нравятся те что предложила в своё время Golma
Поищите - есть целая тема.

Этим способом я сделал десятки книг, не вставляя сносок. Все сноски вставлялись автоматиче-ски. Комментарии я вставляю с помощь скрипта Обрамить верхние индексы скобками {}.
Последняя версия моего руководства по FBE лежит здесь: http://yadi.sk/d/R8k1J4cRFmYHZ
Аватар пользователя alexej36

Если текст предназначен для fb2, то сноски, оглавление и списки стоит убрать, а колонтитулы оставить.

Аватар пользователя Belomor.canal

alexej36 написал:
Если текст предназначен для fb2, то сноски, оглавление и списки стоит убрать, а колонтитулы оставить.

И если их на кажой странице 10 штук то и застрелится :-)))
Если серьёзно -
1 "то убрать списки" - это однозначно при любом назначении выходного текста! FR11 часто пускается в некое буйство создание нумераторов
2 выключение "сносок - очевидно они просто попадут в текст, как элемент текста. М.б. не плохо. в FR11 иногда приходиться сохранять в режиме "Простой текст", но в этом случае терялось оформление жирный, курсив.
Именно за "галку" не распознавать сноски на форумах выступало максимум пользователей Fr11
Спасибо
Аватар пользователя XtraVert

Цитата:
Что-то я не вижу fb2-формата:

Чуть дальше: Сохранение электронных книг
http://help.abbyy.com/FineReader/FineReader12/Russian/SavingResults/SaveEBook.htm
Аватар пользователя geksel

Попробовал. Работает быстрее, хорошо, что есть автоматический режим. Качество распознавания выше, чем в 11. Заметно лучше обрабатывает изображения.
Покупаю!

Аватар пользователя Антонина82

Купила. Сработал алгоритм -продажа с 50% скидкой, как постоянному покупателю.
Вчера опробовала. Сволочи эти разработчики. Добавили к прежним ошибкам новую. Смотрите сами. Сразу скажу -книга новая, шрифт хороший
Рис. 1

Объединила не с того, ни с сего два примечания в одно. Хотя в конце книги - всё верно

И вот такая фигня в fb2 перенеслась

И таких ошибок очень много. Даже не знаю, что делать. Наверное отключить область примечаний

Аватар пользователя Belomor.canal

Антонина82 написал:
Купила. Сработал алгоритм -продажа с 50% скидкой, как постоянному покупателю.
Вчера опробовала. Сволочи эти разработчики. Добавили к прежним ошибкам новую. Смотрите сами. Сразу скажу -книга новая, шрифт хороший
И таких ошибок очень много. Даже не знаю, что делать. Наверное отключить область примечаний

Выражаю сочувствие!
Вообще со сносками у них тихий кошмар и лучше, судя по вашему примеру не стало! Так что чего ради покупать новый?
Теперь в ФР 12 есть супер галка "отключить распознание сносок" и рукам разносить или какой ни будь тулзой
Уважаемая Антонина82. Вопрос в по правой кнопке мыши в области распознания "Назначение текста" появился пункт "сноска"?
Аватар пользователя Антонина82

В данном случае, я ничего не меняла - стоит "автоопределение". Если заменить область на "сноска" - тогда распознается нормально, если вдруг не появляется около слова такого значка '. Тут уж ничего не помогло. Сноска осталась в fb2 в основном тексте. Я просто надеялась, что в новой версии не надо будет на каждом листе, где есть сноски, делать вручную корректировку. Мои надежды не оправдались.
Причем сразу и не поймешь - зрительно сноски на листе у ФР12 расположены правильно. А если убрать единичку (как на 1 рисунке), то первая сноска вообще исчезает и в fb2 не переносится. Помогает только - в данной книжке - не знаю как в других, где сноски могут обозначаться *, только замена вручную - области. "Автоопределение" не справилось с работой.

Аватар пользователя Belomor.canal

Антонина82 написал:
В данном случае, я ничего не меняла - стоит "автоопределение". Если заменить область на "сноска" - тогда распознается нормально, если вдруг не появляется около слова такого значка '. Тут уж ничего не помогло. Сноска осталась в fb2 в основном тексте. Я просто надеялась, что в новой версии не надо будет на каждом листе, где есть сноски, делать вручную корректировку. Мои надежды не оправдались.
Причем сразу и не поймешь - зрительно сноски на листе у ФР12 расположены правильно. А если убрать единичку (как на 1 рисунке), то первая сноска вообще исчезает и в fb2 не переносится. Помогает только - в данной книжке - не знаю как в других, где сноски могут обозначаться *, только замена вручную - области. "Автоопределение" не справилось с работой.

Спасибо! Я имел ввиду не появился ли пункт "Сноски" в этом меняю?
Аватар пользователя izekbis

Belomor.canal написал:
Антонина82 написал:
Купила. Сработал алгоритм -продажа с 50% скидкой, как постоянному покупателю.
Вчера опробовала. Сволочи эти разработчики. Добавили к прежним ошибкам новую. Смотрите сами. Сразу скажу -книга новая, шрифт хороший
И таких ошибок очень много. Даже не знаю, что делать. Наверное отключить область примечаний

Выражаю сочувствие!
Вообще со сносками у них тихий кошмар и лучше, судя по вашему примеру не стало! Так что чего ради покупать новый?
Теперь в ФР 12 есть супер галка "отключить распознание сносок" и рукам разносить или какой ни будь тулзой
Уважаемая Антонина82. Вопрос в по правой кнопке мыши в области распознания "Назначение текста" появился пункт "сноска"?

ФР определит стиль «Сноска» только если он привяжет ее к индексу в тесте. Если нет, то ничего с ним не сделаешь.
Аватар пользователя Belomor.canal

izekbis написал:
ФР определит стиль «Сноска» только если он привяжет ее к индексу в тесте. Если нет, то ничего с ним не сделаешь.

Откуда такое мнение? Я ничего подобного не замечал! При работе на "Дневниками" Шварца стандартно было следующее - если самый нижний абзац имеет дату и текст (сносок на странице нет!!!) С вероятностью 30% Этот абзац становится сноской!!! Помог только алгоритм Golmы
Аватар пользователя izekbis

Belomor.canal написал:
izekbis написал:
ФР определит стиль «Сноска» только если он привяжет ее к индексу в тесте. Если нет, то ничего с ним не сделаешь.

Откуда такое мнение? Я ничего подобного не замечал! При работе на "Дневниками" Шварца стандартно было следующее - если самый нижний абзац имеет дату и текст (сносок на странице нет!!!) С вероятностью 30% Этот абзац становится сноской!!! Помог только алгоритм Golmы

Значит он ее к чему-то привязал. К какому-нибудь мусору. Без привязки не может быть сноски. Там просто надо поставить стиль «Основной текст» и все будет в порядке. Хуже если он привязку к сноске никак не хочет определять. Даже после нескольких распознаний и изменения областей.
Аватар пользователя Антонина82

Заметила очень полезную новинку. Хотя может она и раньше была, но я ею не пользовалась. Теперь можно области пронумеровывать. Конкретный пример
Вот как выглядит страница первоначально. Видно, что нарушился порядок расположения текста

Затем нажимаем на кнопку -слева, я около нее галочку поставила, и мышкой щелкнула по области книги в нужной последовательности. Все расположилось очень хорошо. Только видите - ложку дегтя (фиолетовый кружок) - никак не хотел распознавать как колонтитул. Приходилось вручную убирать. Снизу и сверху - в другой книжке. колонтитул определялся очень хорошо, и в книжку не лез.

Аватар пользователя golma1

Антонина82 написал:
Заметила очень полезную новинку. Хотя может она и раньше была, но я ею не пользовалась.

Нет, это не новинка. Области и раньше нумеровались, и их можно было перенумеровывать.

alexej36 написал:
В последних билдах FR11 отвалилоcь сохранение изображений при конвертации в FB2.

Как это?! Никогда не встречала.

Проследите, чтобы при сохранении в fb2 в "Опциях" было отмечено "сохранять картинки".

Аватар пользователя Belomor.canal

golma1 написал:

Нет, это не новинка. Области и раньше нумеровались, и их можно было перенумеровывать.

При сложном макете постоянно этим пользовался что бы правильно расставить порядок. в котором они потом перейдут в текст. Иначе могла получится полная каша!!!
Аватар пользователя golma1

Belomor.canal написал:
golma1 написал:

Нет, это не новинка. Области и раньше нумеровались, и их можно было перенумеровывать.

При сложном макете постоянно этим пользовался что бы правильно расставить порядок. в котором они потом перейдут в текст. Иначе могла получится полная каша!!!

Более того, в особо сложных случаях (несколько колонок + иллюстрации) я сама разбиваю на отдельные области и нумерую их так, чтобы текст и картинки при экспорте располагались взаимно правильно.

Страницы

X