Подбор литературы |
Здравствуйте, гость ( Вход | Регистрация )
Подбор литературы |
11.2.2011, 8:49
Сообщение
#241
|
|
Активный участник Группа: Пользователи Сообщений: 1249 Регистрация: 23.10.2010 Из: Краснодарский край Пользователь №: 2091 |
И еще у меня такой вопрос: каким образом и когда задача из "сделать сканы книг" преобразовалась в задачу "сделать сканы книг в вордовском формате"? В чью светлую голову пришла эта замечательная идея, возиться именно с вордовским форматом, когда повсюду книги выкладываются в pdf или в djvu? Неужели на компы перестали предустанавливать адобе ридер, что возникла насущная необходимость переводить сканы именно в .doc? Не мне. Кому-то из ваших. Потрудитесь прочитать всю тему с самого начала. Файлы в .pdf я предлагала не раз, с ними у меня нет и не было никаких проблем. Вам нужен был именно Ворд, о чем не раз было здесь заявлено. Удачи! |
|
|
11.2.2011, 10:09
Сообщение
#242
|
|
Активный участник Группа: Пользователи Сообщений: 72 Регистрация: 7.12.2010 Пользователь №: 2276 |
В СССР творчество Л.Н.Толстого изучали в 9 классе. В 10 классе изучалась советская литература, представителем которой Л.Н.Толстой никак не является. А 11 класса в советской средней школе не было и в помине. Так что развивались мы несколько раньше современных детей. Эх, тяжело наверное СЕ с такими адептами /смайлик с большими круглыми глазами/ Как заканчивали среднюю школу при советской власти в 16-17 лет, так и заканчивают теперь в те же 16-17 лет. Как изучали творчество Толстого в предпоследнем 9-м классе, так и сейчас изучают в предпоследнем 10-м классе. Но я ведь совсем не о том. Я еще раз говорю, что для того что бы что-то менять - нужно внимательно изучить то что есть, так сказать базис проблемы, как любит сложно выражаться СЕ. Именно для этого я постил ссылки с сайта минобразования. ЗЫ Уважаемый, не советую мне тыкать для начала. Вы немного не в той компании находитесь, где бы это позволялось в общении с незнакомыми вам лично людьми. Вообще-то в интернетах принято общаться на "ты" и это таки правильно, потому как с какой стати "выкать" анонимусам? /очень культурный смайлик/ ))))))))))) -------------------- скайп:
zheleznyak_76 |
|
|
11.2.2011, 10:32
Сообщение
#243
|
|
Активный участник Группа: Актив Сообщений: 1560 Регистрация: 12.4.2010 Пользователь №: 1766 |
Цитата Дана, прошу больше не беспокоится на мой счет. У меня к вам вопросов больше нет и не будет. Надеюсь, в ЭТЦ не все такие, как вы. Цитата Цитата И еще у меня такой вопрос: каким образом и когда задача из "сделать сканы книг" преобразовалась в задачу "сделать сканы книг в вордовском формате"? В чью светлую голову пришла эта замечательная идея, возиться именно с вордовским форматом, когда повсюду книги выкладываются в pdf или в djvu? Неужели на компы перестали предустанавливать адобе ридер, что возникла насущная необходимость переводить сканы именно в .doc? Не мне. Кому-то из ваших. Потрудитесь прочитать всю тему с самого начала.Файлы в .pdf я предлагала не раз, с ними у меня нет и не было никаких проблем. Вам нужен был именно Ворд, о чем не раз было здесь заявлено. Но по сути. Конечно, всяких ссор не хотелось бы (ни между «нашими» и «вашими», ни между кем еще). Потому как тогда возникают проблемы с продвижением дела… Дискуссия при этом не отменяется, а наоборот к ней предъявляются требования высокой содерждательности и ответственности за проектное начинание, за результативность и сам процесс общ. деятельности. Господину Железняку было указано, что излишний сарказм и скепсис стороннего наблюдателя сто́ит держать при себе. А дискуссия, критика, обсуждение – более чем приветствуются. Я думаю, что выкладывать в формате Word оно и впрямь не совсем эффективно (и не важно, кто это предлагал – скорее всего предлагали для простых документов, где это более чем понятно), т.к. сильно деформируется форматирование (а оно в правильно организованном учебнике всегда существенно), происходят сдвиги страниц (это не критично, но всеже), сложно опять-таки сохранить структуру (рекомендательные законы дружественности структуры представления информации в интернет-программировании никто не отменял) и т.д. Выйгрыш только по весу файла. Выйгрыш значимый, но не перекрывающий др. проигрыши. Форматы pdf и djwu являются для сканирования общепринятыми. И как я понимаю в т.ч. и по причине того, что они позволяют частично сохранять структуру и формат исходника и сами файлы не легко изменить. Я кое-с-чем сталкивался и скажу, что для математических текстов (где масса формул, рисунков и т.д.) формат «дежа-вю» очень удобен. Word эффективен лишь для текстов с простой структурой и форматированием и небольшим количеством фотографий, рисунков, схем, формул и т.д. Поэтому вполне приемлимо (и более чем обоснованно) использование нами именно pdf и «дежа-вю». Ну и необходима их компрессия (сжатие): во первых с помощью управления качеством графического материала (разрешение рисунков и т.д.), во-вторых с помощью WinRar (иногда это эффективно). Вообще рисунки (те же jpg-шки) вполне можно сжимать в специальных программах. Просто за счет (очень часто некритического) снижения разрешения понижать вес файла. Штучно такое можно проделывать в каких-то программах. Массово для сканирования, наверное, тоже можно. Иначе как это умудряются сжать математические книги до приемлимых форматов. Сейчас посмотрел – в качестве примеров: В.И. Арнольд. Теория катастроф (djwu) – 1,4 Мb В.И. Арнольд Теория бифуркаций (djwu) – 2 Mb (200 с лишком стр. мат. текста, сделанного достаточно качественно) Корн Г. и Т. Справочник по математике для научных работников и инженеров – 11,3 Mb (830 cтр. мат. текста – качество файла не «ахти», но вполне приемлемое) (djwu) Г.М. Фихтенгольц. Курс дифференциального и интегрального исчисления (в 3-х т.) – 18,4 Mb. (djwu). Т.е. кажый том в среднем весит 18,4 / 3 = 6,1(3) Mb. Мат. статистика, уч. пособие (pdf) – 2 Mb. И т.д. Больших мат. книг в Word-cком формате я у себя не нашел (мат. статьи и то достаточно простые тесть и тянут на 500 kb). Поэтому: 1. совсем необязательно ориентироваться на Word, особенно в сложно организованных документах; 2. какие-то приемлимые (не критические для качества) возможности компрессии рисунков, изображений формата jpg и итогового файла найти вполне можно и это нужно сделать. Тут, похоже не обойтись без программистов (не важно – сторонних, внутрифорумных или еще каких). С уважением ко всем участникам проекта и проектной работы. |
|
|
11.2.2011, 10:50
Сообщение
#244
|
|
Активный участник Группа: Актив Сообщений: 1560 Регистрация: 12.4.2010 Пользователь №: 1766 |
Господину Железняку (на слово "гогсподин" обижаться не стоит - в интернете и так принято)...
Цитата Эх, тяжело наверное СЕ с такими адептами Цитата Вообще-то в интернетах принято общаться на "ты" и это таки правильно, потому как с какой стати "выкать" анонимусам? Ну и валил бы ты отседова по добру да по здорову. А то адепты-анонимусы наваляют. Кому потом претензии предъявлять станешь – Кургиняну или просто в ментуру заявление пойдешщь напишешь. Сцуко... Устраивавет такой стиль интернетной полемики? В интернете-то многое принято - матюки, писание русских слов на латинице, порнореклама наконец на кажной странице... Мало ли что в Интернете принято. Это «принято» поддерживается такими вот Железняками, из которых культура так и прет. Культура поползла… в Интернет. Уже вся туда переползла. Либо принимайте посильное участие в работе, проводите анализ нынешней шк. программы по литературе, что в вас проснулося (в связи с проблемами незнания тангенса на 4 курсе), - либо не мешайте людям заниматься делом, "интернетный" Вы мой. Сообщение отредактировал Dok - 11.2.2011, 10:54 |
|
|
11.2.2011, 11:07
Сообщение
#245
|
|
Активный участник Группа: Пользователи Сообщений: 1249 Регистрация: 23.10.2010 Из: Краснодарский край Пользователь №: 2091 |
Но я ведь совсем не о том. Я еще раз говорю, что для того что бы что-то менять - нужно внимательно изучить то что есть, так сказать базис проблемы, как любит сложно выражаться СЕ. Именно для этого я постил ссылки с сайта минобразования. Вы знаете, мы как-то сами догадались об этом, и почему-то без вас, еще на первых страницах темы, которые вы так и не удосужились прочитать. Извините, но прочитывание всей темы ДО того, как возникло желание написать в ней тост, это такая же обязательная вещь в интернет-общении. Это элементраное уважение к свои собеседникам. А в остальном, я полностью согласна с Dok: Цитата Либо принимайте посильное участие в работе, проводите анализ нынешней шк. программы по литературе, что в вас проснулося (в связи с проблемами незнания тангенса на 4 курсе), - либо не мешайте людям заниматься делом, "интернетный" Вы мой
|
|
|
11.2.2011, 11:23
Сообщение
#246
|
|
Активный участник Группа: Пользователи Сообщений: 1249 Регистрация: 23.10.2010 Из: Краснодарский край Пользователь №: 2091 |
Насколько я владею ситуацией на форуме, насколько я ее знаю, Dana29 – не сотрудник ЭТЦ. Может, мои данные устарели, но тогда это совершенно др. вопрос. Вроде сотрудник. Она об этом где-то в другой теме, кажется, говорила. Но дело не в этом. Дело в том, что если требуется помощь, то принимай ее, когда предлагают. Но при этом нормально разъясняй что и как нужно сделать. Вот по поводу стенографирования людям было разъяснено хорошо, потому и работа пошла. А по учебникам и сканированию - стопорнулась. Хотя тут несколько человек говорили о своей готовности помочь. Сколько бы все уже за это время сделали для Совшколы, если бы тот, кто принимает нашу работу, все-таки, определился и нашел возможность нам разъяснить как и что нужно делать. Переделывать-то потом совсем не хочется! А работа предстоит немалая, да к тому же рутинная. И людей уважать надо, которые потратят на нее свои силы и свое время. Вообщем, думаю так. Для образовательного проекта Совшколы требуется специальный человек, который бы руководил там всеми работами. Который бы четко знал что нужно, и как нужно. А без этого дело с мертвой точки не сдвинется, даже если будет куча помощников. Следовательно, ждем-с появления такого человека (если проект Совшкола ЭТЦ вообще нужен). |
|
|
11.2.2011, 12:12
Сообщение
#247
|
|
Активный участник Группа: Актив Сообщений: 2722 Регистрация: 4.1.2011 Из: Тверские леса Пользователь №: 2391 |
Я думаю, что выкладывать в формате Word оно и впрямь не совсем эффективно Вы привели для примера несколько книг. Указали их объем. Вполне приемлимый. Но, судя по объему, это уже тексты, которые подверглись процессу распознования. А после подобного преобразования, что в адобридере, что в ворде - разница небольшая, практически отсутствующая. Без распознования же текста, книга страниц триста, будет весить не одну сотню мегабайт и в заархивированном виде. А это - неприемлимо. Не, если у кого хороший инернет, современный компьютер то ..., но для многих жителей России - это недоступно. Качать книгу неделю, потом читать её, когда она полчаса грузиться, а страницы листаются со скоростью пяти минут страница - сложновато. -------------------- |
|
|
11.2.2011, 13:56
Сообщение
#248
|
|
Активный участник Группа: Пользователи Сообщений: 348 Регистрация: 18.5.2010 Пользователь №: 1810 |
Но, судя по объему, это уже тексты, которые подверглись процессу распознования. Нет, эти файлы содержат графическое изображение книг и, возможно, дополнительно распознанный текст. Маленький объем достигается за счет перехода на черно-белое изображение и уменьшения разрешения. Что касается форматов, то техническую литературу лучше сохранять как есть в графическом виде (pdf, djvu), книги по литературе в распознанном текстовом виде в doc, pdf и т.д. |
|
|
11.2.2011, 19:08
Сообщение
#249
|
|
Активный участник Группа: Актив Сообщений: 2722 Регистрация: 4.1.2011 Из: Тверские леса Пользователь №: 2391 |
Нет, эти файлы содержат графическое изображение книг и, возможно, дополнительно распознанный текст. Маленький объем достигается за счет перехода на черно-белое изображение и уменьшения разрешения. Что касается форматов, то техническую литературу лучше сохранять как есть в графическом виде (pdf, djvu), книги по литературе в распознанном текстовом виде в doc, pdf и т.д. Файлы pdf и djvu могут быть чиста картинками отсканированными, тогда, не смотря на ч\б цвет и разрешение - объем велик, что бы Вы не говорили. А могут быть и не чиста картинками, т.е. если же текст распознан, то объем уменьшен. Ну, графика, конечно, остается графикой. Распознан текст или нет, проверить просто - если текст распознан, то операция копипаста осуществима, а если нет, то это чиста нераспознанный скан. Кстати, иметь возможность копипаста - это дополнительный и существенный бонус, к сравнительно небольшому объему. И, как правило, в Сети в начале всегда появляется вариант в виде скана, а потом уже фб2, ртф, док и т.д. Безусловно, для учебы и изучения, в любом случае текст должен быть распознан. -------------------- |
|
|
11.2.2011, 20:44
Сообщение
#250
|
|
Активный участник Группа: Пользователи Сообщений: 348 Регистрация: 18.5.2010 Пользователь №: 1810 |
|
|
|
11.2.2011, 23:35
Сообщение
#251
|
|
Активный участник Группа: Актив Сообщений: 2722 Регистрация: 4.1.2011 Из: Тверские леса Пользователь №: 2391 |
"Объем велик" - в данном случае это будет несколько мегабайт. Не так уж и много. Ну раз дело такое - можно ссылку на конкретный пример книги страниц на триста, что бы в несколько мегабайт? -------------------- |
|
|
11.2.2011, 23:52
Сообщение
#252
|
|
Активный участник Группа: Пользователи Сообщений: 348 Регистрация: 18.5.2010 Пользователь №: 1810 |
Ну раз дело такое - можно ссылку на конкретный пример книги страниц на триста, что бы в несколько мегабайт? Dok уже приводил выше: Цитата В.И. Арнольд. Теория катастроф (djwu) – 1,4 Мb
В.И. Арнольд Теория бифуркаций (djwu) – 2 Mb (200 с лишком стр. мат. текста, сделанного достаточно качественно) Корн Г. и Т. Справочник по математике для научных работников и инженеров – 11,3 Mb (830 cтр. мат. текста – качество файла не «ахти», но вполне приемлемое) (djwu) Г.М. Фихтенгольц. Курс дифференциального и интегрального исчисления (в 3-х т.) – 18,4 Mb. (djwu). Т.е. кажый том в среднем весит 18,4 / 3 = 6,1(3) Mb. Мат. статистика, уч. пособие (pdf) – 2 Mb. |
|
|
12.2.2011, 0:19
Сообщение
#253
|
|
Активный участник Группа: Актив Сообщений: 2722 Регистрация: 4.1.2011 Из: Тверские леса Пользователь №: 2391 |
Dok уже приводил выше: Да, Вы были правы, а я нет. Скачал "В.И. Арнольд. Теория катастроф (djwu) – 1,4 Мb" 128 страниц за 15 минут. Но минусы - в виде некоторой размытости, а значит, неудобочитаемости и отсутствия копипаста - остались. Сама программа djwu - не дает много возможностей для подстройки чтения под себя. Ну и как быть с возможностью чтения на мобильных устройствах? Я просто не в курсе - для них разве есть соответствующий софт? -------------------- |
|
|
12.2.2011, 7:15
Сообщение
#254
|
|
Активный участник Группа: Актив Сообщений: 1560 Регистрация: 12.4.2010 Пользователь №: 1766 |
Цитата В.И. Арнольд. Теория катастроф (djwu) – 1,4 Мb Насколько я понял, некоторые из приведенных мной файлов - распознанные (допускающие копипасту), некоторые - нет, как, к примеру, "Теория катастроф" Арнольда или справочник Корнов.
В.И. Арнольд Теория бифуркаций (djwu) – 2 Mb (200 с лишком стр. мат. текста, сделанного достаточно качественно) Корн Г. и Т. Справочник по математике для научных работников и инженеров – 11,3 Mb (830 cтр. мат. текста – качество файла не «ахти», но вполне приемлемое) (djwu) Г.М. Фихтенгольц. Курс дифференциального и интегрального исчисления (в 3-х т.) – 18,4 Mb. (djwu). Т.е. кажый том в среднем весит 18,4 / 3 = 6,1(3) Mb. Мат. статистика, уч. пособие (pdf) – 2 Mb. И т.д. |
|
|
12.2.2011, 12:16
Сообщение
#255
|
|
Активный участник Группа: Актив Сообщений: 2759 Регистрация: 16.3.2010 Из: Москва Пользователь №: 1719 |
Да, Вы были правы, а я нет. Скачал "В.И. Арнольд. Теория катастроф (djwu) – 1,4 Мb" 128 страниц за 15 минут. Но минусы - в виде некоторой размытости, а значит, неудобочитаемости и отсутствия копипаста - остались. Сама программа djwu - не дает много возможностей для подстройки чтения под себя. Ну и как быть с возможностью чтения на мобильных устройствах? Я просто не в курсе - для них разве есть соответствующий софт? Да есть-то он есть, но только читать дежавю на КПК неудобно - либо здоровенная картинка, которую надо двигать по экрану, либо шибко маленькая. В основном такие файлы используют, конечно, для распечатки, а не для чтения на КПК. Если шибко надо читать на КПК есть такой вариант: загнать в ФайнРидер и сохранить в итоге в вордовском формате. То, что в итоге получится, исключительно для собственного пользования, на люди это показывать нельзя, но прочесть таки можно. Другой вариант: купить читалку для электронных книг - у нее экран большой. Ну и вот ссылка, где есть некоторые сведения по дежавю и как с ним бороться: http://www.inf.tsu.ru/Webdesign/news.nsf/news/10062005451 А это софтина для чтения дежавю на кпк, можно побаловаться: http://myppc.ru/2007/09/29/pocket_djvu_0951.html Если же вы имели в виду чтение дежавю на мобильном телефоне, то это - садомазо. Сообщение отредактировал Dana29 - 12.2.2011, 12:23 |
|
|
12.2.2011, 13:18
Сообщение
#256
|
|
Активный участник Группа: Актив Сообщений: 3084 Регистрация: 26.9.2007 Пользователь №: 1269 |
И еще у меня такой вопрос: каким образом и когда задача из "сделать сканы книг" преобразовалась в задачу "сделать сканы книг в вордовском формате"? В чью светлую голову пришла эта замечательная идея, возиться именно с вордовским форматом, когда повсюду книги выкладываются в pdf или в djvu? Неужели на компы перестали предустанавливать адобе ридер, что возникла насущная необходимость переводить сканы именно в .doc? Мало ли где и как они выкладываются. На совшколе они будут лежать не в виде файлов, а как страницы сайта (плюс скачка). Поэтому удобнее иметь текст. А в каком формате - ворд или опенофис - всё равно, главное, чтобы текст и картинки. НО! Если это долго и трудоёмко, для начала можно обойтись и картинками, постепенно переводя их в текстовый формат (при этом учебник на сайте уже будет присутствовать). -------------------- |
|
|
12.2.2011, 13:19
Сообщение
#257
|
|
Активный участник Группа: Актив Сообщений: 3084 Регистрация: 26.9.2007 Пользователь №: 1269 |
Вроде сотрудник. Она об этом где-то в другой теме, кажется, говорила. И где же она это говорила? Вот ведь умение прочитать и понять не то, что написано. -------------------- |
|
|
12.2.2011, 14:28
Сообщение
#258
|
|
Активный участник Группа: Пользователи Сообщений: 348 Регистрация: 18.5.2010 Пользователь №: 1810 |
Но минусы - в виде некоторой размытости, а значит, неудобочитаемости и отсутствия копипаста - остались. Технические тексты лучше оставлять в графическом формате, в частности, djvu, но можно добавлять туда распознанный текст в качестве OCR-слоя. Тогда его можно будет копировать. Но в него попадет не все, проблема в спецсимволах. Цитата Ну и как быть с возможностью чтения на мобильных устройствах? Я просто не в курсе - для них разве есть соответствующий софт? Pdf-формат, как правило, на мобильных читается. Djvu - или читать с компьютера, или распечатывать. |
|
|
12.2.2011, 14:32
Сообщение
#259
|
|
Активный участник Группа: Пользователи Сообщений: 1249 Регистрация: 23.10.2010 Из: Краснодарский край Пользователь №: 2091 |
И где же она это говорила? Вот ведь умение прочитать и понять не то, что написано. Слова "вроде" и "кажется" употребляются обычно, когда нет в полной уверенности в том, что говорится. Что я и сделала. Между прочим, поведение обсуждаемого участника вполне позволяет думать, что у него есть какие-то особые права на этом форуме. ------- Вы что-нибудь надумали? А то работа стоит. Сообщение отредактировал Соло - 12.2.2011, 14:33 |
|
|
12.2.2011, 15:39
Сообщение
#260
|
|
Активный участник Группа: Актив Сообщений: 3084 Регистрация: 26.9.2007 Пользователь №: 1269 |
Вы что-нибудь надумали? А то работа стоит. Я ж вам давно в личке ответил и сегодня на форуме косвенно (отвечал Дане) сказал - если с распознаванием большие сложности, можно для ускорения процесса оставлять пока в виде картинок. Учебник уже будет на совшколе, а потом постепенно заменять картинки на распознанный текст и изображения, если они есть на странице. -------------------- |
|
|
Текстовая версия | Сейчас: 23.12.2024, 0:18 |