Перейти к контенту

Рекомендуемые сообщения

Поскольку потихоньку участники проекта разбирают номера журнала в обработку, есть смысл в этой теме обмениваться мнениями и обсуждать перспективы и целесообразность обработки имеющихся в нем данных по военнослужащим, участникам Первой мировой войны.
Надо оптимизировать под него таблицы для набивки - и желательно, чтобы находились желающие предлагать, как лучше это сделать, с учетом заложенной в выпусках журнала информации.
Выпуски с 1914 по 1917 годы у нас в полном объеме - искать никому ничего не надо.
Василий Иванович по ходу прогнал 1914, 15 и 17 годы через редактор распознавания текста.
Ну, и ждем новых участников в проект - пишите о своем желании участвовать в проекте, мы Вас ждем!

Поделиться этим сообщением


Ссылка на сообщение
Поделиться на других сайтах

При знакомстве с газетой встретил несколько различных видов информации: Списки убитых и раненых; Сведения о награждениях и Награды георгиевским кавалерам, а также Сведения о перемещениях назначениях и присвоениях званий.
Списки убитых и раненых содержат инф. о звании, сословии, ФИО, причине выбытия и дате (только в первых номерах, в остальных можно только ориентировочно указать год).
Сведения о награждениях - звание, сословие, ФИО, награда, подразделение в некоторых сведениях, а также в наградах Георгиевским кавалерам присутствует большой текстовый абзац с описанием подвига.
Сведения о перемещениях и др. - звание, сословие, ФИО, старое и новое место службы, новое звание.
Возможно встретятся и другие виды, я просматривал бегло.
Я предлагаю следующий вариант: каждому номеру газеты отдельный файл; каждому виду информации отдельную страницу; количество колонок и их наименование делать исходя из содержания конкретных списков.
Также обязательная колонка номер страницы, а текстовую информацию (описание подвига и другое) заносить в дополнительные сведения.
Какие мнения у "набойщиков" и "техников"?

Поделиться этим сообщением


Ссылка на сообщение
Поделиться на других сайтах

Описание подвига можно стараться изложить тезисно, по возможности, конечно же.
Под сведения о наградах и георгиевским кавалерам целесообразнее ввести графу "описание подвига, за который представлен к награде".
Но можно пока и в графе "дополнительная информация" - по мере подготовки сведений к размещению можно потом, с учетом накопленного опыта, графы по информации по наградам переименовать так, как определимся окончательно.
Работа кропотливая - журнал содержит массу полезной информации.
В принципе делать лучше неспешно, но кропотливо.

Поделиться этим сообщением


Ссылка на сообщение
Поделиться на других сайтах

Предлагаю переименовать графу "Причина выбытия" в "Событие" - в таком случае в этом столбце корректно будут смотреться как записи типа "убит", "контужен" так и "переведён", награждён", "отличился в бою". Так же, в случае переименования графы "причина выбытия", следует дополнить графы "место" и "дата" словом "событие".
Описание подвига вносить в графу "Дополнительные сведения".
Награждение и собственно причину награждения вносить разными строками, со ссылкой из строки награждения на дату отличия в бою в графе дополнительно.
В случае со ссылкой журнала "Разведчик" на "Русский инвалид" в качестве даты события указывать дату и № выпуска "Инвалида", а дату и № "Разведчика" вносить в графу дополнительно.

Поделиться этим сообщением


Ссылка на сообщение
Поделиться на других сайтах

Спасибо за предложения - все будем учитывать.
Чтобы было понятно, в каком направлении мы должны двигаться при заполнении БД информацией,
напоминаю о концепции самого проекта, его основополагающих принципах:

1.Проект должен охватывать периоды всей жизни участника Первой мировой войны, то есть нас должна интересовать его судьба:
- до войны,
- во время войны,
- после войны, если он выжил.
2.Проект должен охватить участников войны, подданных Российской империи.
В таком виде, конечно же, закладывается локальность проекта, ограниченная конкретным подданством, но нам изначально было интересно российское воинство.
Были в начале проекта разговоры о других странах, но в контексте союзников России в ПМВ, но они так и не нашли особой поддержки и не получили дальнейшего развития, кроме заголовка:
"Общий список
областей и губерний
Российской империи
и иных государств
и территорий".
3.Проект должен базироваться на любых источниках информации, которые можно разделить условно на 2 категории:
- любого типа документальные источники (официальные документы, публикации и т.д.), с обязательной ссылкой на источник такой информации,
- свидетельские показания (к примеру внучка пишет, что дедушка....), с обязательной ссылкой на этого человека, несущего ответственность за достоверность его сведений (ФИО, электронный адрес, регистрация при вводе информации - тогда будет есть с кого спросить при обнаружении фикции)
4.Проект должен пополняться информацией любым, желающим этого, пользователем. Волонтер должен стать вторичным в проекте и востребованным только для массовой разовой акции по наполнению проекта сведениями.
5.Проект должен таким образом работать и пропагандироваться, чтобы при проекте всегда была команда единомышленников, согласная работать на принципах работы общественных организаций. Такие люди изначально должны понимать: то, что они делают, дает только моральное удовлетворение и , в лучшем случае при очевидном успехе, некую популярность, известность, и не более того. Кстати, вторая составляющая принципов общественной деятельности, иногда приводит к востребованности на других направлениях, уже не связанных с общественными организациями, что в конечном итоге может повлечь выгоду и материальную.
6.Итоги проекта должны быть таким образом оформлены, чтобы они были доступны пользователю до тех пор, пока туда за информацией будет приходить даже один человек один раз в один год, что позволяло бы придать ему некую автономность, и исключить зависимость работоспособности итогов проекта в конкретные завершенные периоды от создателей программ: в таком виде программист будет востребован только для действий, модернизирующих программу под обнаруженные новые требования к ней или для расширения ее возможностей в случае возникшей необходимости.
7. В оформленных итогах проекта должны быть заложены механизмы способности к развитию, в случае обнаружения новых задач или при их возникновении, чтобы радикально не изменять то, что уже функционирует.
8. В самой системе БД должны быть заложены механизмы функционирования, которые бы позволяли разнородные куски информации об одном и том же человеке объединять, формируя при этом так называемую персональную карточку учета военнослужащего.

Поделиться этим сообщением


Ссылка на сообщение
Поделиться на других сайтах

Что бы всё было красиво, единообразно и покрашено зелёной краской, желаю уточнить правила и рекомендации заполнения списков по журналу «Разведчик».
Хочу увидеть ответы от коллег по «набивке», а так же от программистов и нашей тяжелой артиллерии, в лице Николая Чернухина.

 

1 – звание – заполняем в сокращенном виде (прпрщ.) или полном (прапорщик)?
2 – ФИО – если есть два варианта написания (пример - Коцуб или Кочюб) – как вносить – использовать «или» -Коцуб или Кочюб; использовать «слэш» Коцуб / Кочюб; использовать «скобки» Коцуб (Кочюб)?
3 – вероисповедание – вносить так, как указано в существующей базе – православное?
4 – губерния – Тверская? Тверской? приписывать ли «губерния» или «губ.»?
5 – уезд, волость/населенный пункт – вопросы аналогичные – в каком падеже писать, писать ли полностью «город», «деревня» или использовать сокращения «г.», «д.»?
6.1 – дата – так же как при заполнении «царскосельских списков» - год - 1914, месяц и год - .08.1914, число - 01.08.1914, период - 01.08.-02.08.1914
6.2 - дата – «Разведчик» 1917 года выпуска ссылается на «Русского инвалида» 1915 года – ставим 1917 или 1915?
7 – источник - в качестве источника информации указывать «Русского инвалида» или «Разведчика»?

 

Предлагаю обсудить быстро, большинством голосов выбрать ответы, что бы уже завтра было меньше неясностей. :rolleyes:

Поделиться этим сообщением


Ссылка на сообщение
Поделиться на других сайтах
Что бы всё было красиво, единообразно и покрашено зелёной краской, желаю уточнить правила и рекомендации заполнения списков по журналу «Разведчик».
Хочу увидеть ответы от коллег по «набивке», а так же от программистов и нашей тяжелой артиллерии, в лице Николая Чернухина.

 

1 – звание – заполняем в сокращенном виде (прпрщ.) или полном (прапорщик)?
2 – ФИО – если есть два варианта написания (пример - Коцуб или Кочюб) – как вносить – использовать «или» -Коцуб или Кочюб; использовать «слэш» Коцуб / Кочюб; использовать «скобки» Коцуб (Кочюб)?
3 – вероисповедание – вносить так, как указано в существующей базе – православное?
4 – губерния – Тверская? Тверской? приписывать ли «губерния» или «губ.»?
5 – уезд, волость/населенный пункт – вопросы аналогичные – в каком падеже писать, писать ли полностью «город», «деревня» или использовать сокращения «г.», «д.»?
6.1 – дата – так же как при заполнении «царскосельских списков» - год - 1914, месяц и год - .08.1914, число - 01.08.1914, период - 01.08.-02.08.1914
6.2 - дата – «Разведчик» 1917 года выпуска ссылается на «Русского инвалида» 1915 года – ставим 1917 или 1915?
7 – источник - в качестве источника информации указывать «Русского инвалида» или «Разведчика»?

 

Предлагаю обсудить быстро, большинством голосов выбрать ответы, что бы уже завтра было меньше неясностей. :rolleyes:


Рекомендации:
1) Звание и т.п. поля заполняем с заглавной буквы. данные лучше писать в полном виде, если вы абсолютно уверены, что расшифровка верная. Если есть хоть малейшая тень сомнения, лучше оставить исходную форму слова — после разберёмся…

 

2) В именах лучше использовать скобки для вариантов написания, которые второстепенные;

 

3) Аналогично, как со званием — см. п.1;

 

4) Губернию пишем в именительном падеже («Тверская»). Слова «губерния», «область» и т.п. пишем единообразно. Форма записи особого значения не имеет. Хотя от себя предлагаю для краткости всегда писать «губ.» и «обл.».

 

5) Аналогично, как с губернией — см. п. 4. Для краткости предлагаю писать «у.», «вол.», «г.», «с.», «д.» и т.п. Уезд выносим в отдельную графу таблицы. Волость оставляем в общей куче. В графы «Губерния» и «Уезд» пишем только(!) название губерний и уездов. Все иные данные ( в том числе уездные и волостные города) выносим «в общую кучу».

 

6.1) Рекомендуемые варианты записи дат: год — «1914», месяц — «авг.1914» или «август 1914», число — «01 авг.1914» или «01 августа 1914», период — «01–02 авг.1914» или «01 авг.–12 сен.1914» и т.п. (или с полными названиями месяцев), список — «09, 10, 12 авг.1914» и т.п.
Главное, чтобы всё было единообразно. Месяцы намеренно пишем текстом, дабы не было шансов перепутать номера дня и месяца.

 

6.2) Дата выпуска пишется та, что указана для текущего документа. Т.е. 1917-й год в случае с примером.

 

7) Аналогично, как с п.6.2 — источником является текущий документ — т.е. «Разведчик» в случае с примером.

 

8) Нечитаемые символы: одиночные заменяем знаком вопроса каждый «Ков??ев», если нечитается неизвестно сколько символов, заменяем их звёздочкой: «Ков*».

 

9) Если в поле нечего писать, лучше вместо этого написать «(не указано)» — это пригодится для контроля на предмет пропусков в оцифровке.

Поделиться этим сообщением


Ссылка на сообщение
Поделиться на других сайтах
....

Андрей ответил на все вопросы - добавить нечего, согласен.

Поделиться этим сообщением


Ссылка на сообщение
Поделиться на других сайтах
....

Александр (правильно?), рекомендации Андрея носят приоритетный характер, поскольку ему, как разработчику программы, видны нюансы с точки зрения внесения обработанных данных в систему.

Поделиться этим сообщением


Ссылка на сообщение
Поделиться на других сайтах

С учетом всех поступивших рекомендаций и замечаний, в том числе взаимоисключающих друг друга, по набивке текста, инструкция теперь выглядит следующим образом
(если вновь кто имеет и к этой инструкции дополнения и замечания - пишите здесь):

ИНСТРУКЦИЯ (РЕКОМЕНДАЦИИ ПО НАБИВКЕ).
1. Текст набивается с применением современной орфографии - с заменой старорусских букв на современные.
2. Звание – заполняем в сокращенном виде (прпрщ.) или полном (прапорщик)? - если расшифровка известна: записывать без сокращений, если нет вариантов расшифровки - записывать, как в оригинале.
3. Отдельное поле для фамилии.
4. Фамилия – если есть два варианта написания (пример - Коцуб или Кочюб) – использовать «скобки» Коцуб (Кочюб).
5. Отдельное поле для имени-отчества - записываются вместе в одной графе.
6. Вероисповедание – вносить так, как указано в существующей базе – православное? - см.пункт2 (известно - полностью, нет вариантов расшифровки - строго по оригиналу).
7. Губернию/область пишем в именительном падеже. Слова «губерния», «область» и т.п. пишем единообразно. Форма записи особого значения не имеет. Можно для краткости всегда писать «губ.» и «обл.».
8. Уезд, волость/населенный пункт –аналогично - см. п.7. Для краткости можно писать «у.», «вол.», «г.», «с.», «д.» и т.п.
9. В графы «Губерния/Область» пишем только(!) название губерний/Областей.
10. По графе "Уезд" - вносим только название уездов.
11. По графе "Волость/населенный пункт": сюда вносить все названия волостей и любых населенных пунктов, в т.ч. Губернских, уездных и волостных городов.
12. Рекомендуемые варианты записи дат: год — «1914», месяц — «авг.1914» или «август 1914», число — «01 авг.1914» или «01 августа 1914», период — «01–02 авг.1914» или «01 авг.–12 сен.1914» и т.п. (или с полными названиями месяцев), список — «09, 10, 12 авг.1914» и т.п. Главное, чтобы всё было единообразно. Месяцы намеренно пишем текстом, дабы не было шансов перепутать номера дня и месяца.
13. ВОПРОС: дата – «Разведчик» 1917 года выпуска ссылается на «Русского инвалида» 1915 года – ставим 1917 или 1915? ОТВЕТ: Дата выпуска пишется та, что указана для текущего документа ("Разведчик"). Т.е. 1917-й год в случае с примером.
14. ВОПРОС: источник - в качестве источника информации указывать «Русского инвалида» или «Разведчика»? ОТВЕТ: Источником является текущий документ — т.е. «Разведчик» в случае с данной набивкой.
15. Если сведения дублируются или дополняются "Инвалидом" - вносить выпуск "Инвалида" и номер страницы в графу "Дополнительные сведения"
16. Нечитаемые символы: одиночные заменяем знаком вопроса каждый «Ков??ев», если нечитается неизвестно сколько символов, заменяем их звёздочкой: «Ков*».
17. Если в поле нечего писать, лучше вместо этого написать «(не указано)» — это пригодится для контроля на предмет пропусков в оцифровке.
18. Если в графах запись повторяется - никакими кавычками ее не обозачать - запись должна присутствовать в полном объеме.
19. Если в журнале содержится информация о награждениях воинов - вносить описание подвига в графу "Дополнительные сведения"
20. Награждение и собственно причину награждения вносить разными строками, со ссылкой из строки награждения на дату отличия в бою в графе дополнительно.
21. Графа "Причина выбытия" расширена значением "Причина события": в таком случае в этом столбце корректно будут смотреться как записи типа "убит", "контужен" так и "переведён", награждён", "отличился в бою".
22. Каких либо сортировок при завершении набивки списов не производить!!! - записи должны идти подряд - от номера к номеру, от страницы к странице источника.
23. Присланный Вам скан предварительно обработан в РЕДАКТОРЕ РАСПОЗНАВАНИЯ ТЕКСТА - если Вам это удобно, копируете запись, вставляете ее в лист для набивки и только корректируете ошибки - таким образом Вам не надо набивать весь текст, а только после его копирования - корректировать, вставляя предварительно его в соответствующие графы.

Поделиться этим сообщением


Ссылка на сообщение
Поделиться на других сайтах
....

Александр (правильно?), рекомендации Андрея носят приоритетный характер, поскольку ему, как разработчику программы, видны нюансы с точки зрения внесения обработанных данных в систему.

Верно Николай :)
Считаю необходимым дополнить инструкцию по набивке следующей рекомендацией Андрея - Звание и т.п. поля заполняем с заглавной буквы. данные лучше писать в полном виде, если вы абсолютно уверены, что расшифровка верная. Если есть хоть малейшая тень сомнения, лучше оставить исходную форму слова — после разберёмся…

Поделиться этим сообщением


Ссылка на сообщение
Поделиться на других сайтах
...
Считаю необходимым дополнить инструкцию по набивке следующей рекомендацией Андрея - Звание и т.п. поля заполняем с заглавной буквы. данные лучше писать в полном виде, если вы абсолютно уверены, что расшифровка верная. Если есть хоть малейшая тень сомнения, лучше оставить исходную форму слова — после разберёмся…

Принимается - добавил в инструкцию.

Поделиться этим сообщением


Ссылка на сообщение
Поделиться на других сайтах
2 – ФИО – если есть два варианта написания (пример - Коцуб или Кочюб) – как вносить – использовать «или» -Коцуб или Кочюб; использовать «слэш» Коцуб / Кочюб; использовать «скобки» Коцуб (Кочюб)?

А можно посмотреть пример, как обычно выглядит в источнике ситуация с двумя вариантами написания фамилии?

Поделиться этим сообщением


Ссылка на сообщение
Поделиться на других сайтах
2 – ФИО – если есть два варианта написания (пример - Коцуб или Кочюб) – как вносить – использовать «или» -Коцуб или Кочюб; использовать «слэш» Коцуб / Кочюб; использовать «скобки» Коцуб (Кочюб)?

А можно посмотреть пример, как обычно выглядит в источнике ситуация с двумя вариантами написания фамилии?

Третья строка об убитых:
0b0f63c0ca3bf1511d6637633b24af92.jpg
пдпрч. Коцюба (онъ же Кочуба)

Поделиться этим сообщением


Ссылка на сообщение
Поделиться на других сайтах

Дополнение к п.2 правил заполнения:

4. Фамилия – если есть два варианта написания (пример - Коцуб или Кочюб) – использовать «скобки» Коцуб (Кочюб).

При этом слова типа «он же», «по метрике» и т.п. — опускаем. Первой пишем основную версию фамилии. Остальные версии пишем в скобках через запятые. Пример: фразу в документе «Иванов он же Петров по метрике Сидоров» записываем как «Иванов (Петров, Сидоров)».

Поделиться этим сообщением


Ссылка на сообщение
Поделиться на других сайтах

Принято.
Внес дополнением в инструкцию по набивке.

Поделиться этим сообщением


Ссылка на сообщение
Поделиться на других сайтах

Не понимаю. Журнал этот еще не обрабатывается, только согласуется форма для обработки? Готова поучаствовать в обработке, когда это будет возможно.

Поделиться этим сообщением


Ссылка на сообщение
Поделиться на других сайтах

Галина Фёдоровна, журнал уже обрабатывается.
Практически вчера закончен 1917 год.
В обработке 1914-й год, обрабатываются некоторые номера 1915 и 1916 годов.
Если Вы не против, вышлю Вам один из номеров 1916 года с самим файлом для набивки - в нем же и инструкция.
Мы просто коллективно совершенствуем инструкцию по набивке, но уже набитые номера не трогаем, а переделываем под требования новой инструкции.
В каждом номере присутствуют сведения от 115 до 250 человек, а в приложениях - может доходить и до 1000 человек.

Поделиться этим сообщением


Ссылка на сообщение
Поделиться на других сайтах

Николай, жду. Присылайте. Недеюсь, сумею разобраться, что и как делать.

Поделиться этим сообщением


Ссылка на сообщение
Поделиться на других сайтах

Понял, сейчас вышлю один номер на пробу.

Поделиться этим сообщением


Ссылка на сообщение
Поделиться на других сайтах

Ещё один вопрос по написанию дворянских фамилий: в источнике - фон-Редигер - в файл писать фон-Редигер, фон Редигер или Редигер фон?

Поделиться этим сообщением


Ссылка на сообщение
Поделиться на других сайтах

В подобных случаях писать как в источнике.

 

Поисковая система уже умеет сама разбирать сложные фамилии «на винтики». В итоге эту запись можно будет найти и по запросу «фон-Ридигер», и по «Ридигер», и по просто «фон».

Поделиться этим сообщением


Ссылка на сообщение
Поделиться на других сайтах

Что означает сокращение: пдпрч? Догадалась: подпоручик?

Поделиться этим сообщением


Ссылка на сообщение
Поделиться на других сайтах

В графе "Фамилия" должна быть только фамилия.
Если у военнослужащего указано два события, допустим: "Ранен" и "Остался в строю" - рекомендуется первое (на указанном примере: "Ранен") записать в графе "Причина выбытия/события", а второе (на примере: "Остался в строю") в графе "Дополнительные сведения". Но более правильно указывать оба этих события в одной графе "Причина выбытия/события" через дробь, на приведенном примере, это: "Ранен/остался в строю".

Поделиться этим сообщением


Ссылка на сообщение
Поделиться на других сайтах

Создайте аккаунт или авторизуйтесь, чтобы оставить комментарий

Комментарии могут оставлять только зарегистрированные пользователи

Создать аккаунт

Зарегистрировать новый аккаунт в нашем сообществе. Это несложно!

Зарегистрировать новый аккаунт

Войти

Есть аккаунт? Войти.

Войти

  • Недавно просматривали   0 пользователей

    Ни один зарегистрированный пользователь не просматривает эту страницу.

×

Важная информация

Пожалуйста, прочитайте Условия использования