Перейти к публикации

Рекомендованные сообщения

Поскольку потихоньку участники проекта разбирают номера журнала в обработку, есть смысл в этой теме обмениваться мнениями и обсуждать перспективы и целесообразность обработки имеющихся в нем данных по военнослужащим, участникам Первой мировой войны.
Надо оптимизировать под него таблицы для набивки - и желательно, чтобы находились желающие предлагать, как лучше это сделать, с учетом заложенной в выпусках журнала информации.
Выпуски с 1914 по 1917 годы у нас в полном объеме - искать никому ничего не надо.
Василий Иванович по ходу прогнал 1914, 15 и 17 годы через редактор распознавания текста.
Ну, и ждем новых участников в проект - пишите о своем желании участвовать в проекте, мы Вас ждем!

Ссылка на комментарий
Поделиться на других сайтах

При знакомстве с газетой встретил несколько различных видов информации: Списки убитых и раненых; Сведения о награждениях и Награды георгиевским кавалерам, а также Сведения о перемещениях назначениях и присвоениях званий.
Списки убитых и раненых содержат инф. о звании, сословии, ФИО, причине выбытия и дате (только в первых номерах, в остальных можно только ориентировочно указать год).
Сведения о награждениях - звание, сословие, ФИО, награда, подразделение в некоторых сведениях, а также в наградах Георгиевским кавалерам присутствует большой текстовый абзац с описанием подвига.
Сведения о перемещениях и др. - звание, сословие, ФИО, старое и новое место службы, новое звание.
Возможно встретятся и другие виды, я просматривал бегло.
Я предлагаю следующий вариант: каждому номеру газеты отдельный файл; каждому виду информации отдельную страницу; количество колонок и их наименование делать исходя из содержания конкретных списков.
Также обязательная колонка номер страницы, а текстовую информацию (описание подвига и другое) заносить в дополнительные сведения.
Какие мнения у "набойщиков" и "техников"?

Ссылка на комментарий
Поделиться на других сайтах

Описание подвига можно стараться изложить тезисно, по возможности, конечно же.
Под сведения о наградах и георгиевским кавалерам целесообразнее ввести графу "описание подвига, за который представлен к награде".
Но можно пока и в графе "дополнительная информация" - по мере подготовки сведений к размещению можно потом, с учетом накопленного опыта, графы по информации по наградам переименовать так, как определимся окончательно.
Работа кропотливая - журнал содержит массу полезной информации.
В принципе делать лучше неспешно, но кропотливо.

Ссылка на комментарий
Поделиться на других сайтах

Предлагаю переименовать графу "Причина выбытия" в "Событие" - в таком случае в этом столбце корректно будут смотреться как записи типа "убит", "контужен" так и "переведён", награждён", "отличился в бою". Так же, в случае переименования графы "причина выбытия", следует дополнить графы "место" и "дата" словом "событие".
Описание подвига вносить в графу "Дополнительные сведения".
Награждение и собственно причину награждения вносить разными строками, со ссылкой из строки награждения на дату отличия в бою в графе дополнительно.
В случае со ссылкой журнала "Разведчик" на "Русский инвалид" в качестве даты события указывать дату и № выпуска "Инвалида", а дату и № "Разведчика" вносить в графу дополнительно.

Ссылка на комментарий
Поделиться на других сайтах

Спасибо за предложения - все будем учитывать.
Чтобы было понятно, в каком направлении мы должны двигаться при заполнении БД информацией,
напоминаю о концепции самого проекта, его основополагающих принципах:

1.Проект должен охватывать периоды всей жизни участника Первой мировой войны, то есть нас должна интересовать его судьба:
- до войны,
- во время войны,
- после войны, если он выжил.
2.Проект должен охватить участников войны, подданных Российской империи.
В таком виде, конечно же, закладывается локальность проекта, ограниченная конкретным подданством, но нам изначально было интересно российское воинство.
Были в начале проекта разговоры о других странах, но в контексте союзников России в ПМВ, но они так и не нашли особой поддержки и не получили дальнейшего развития, кроме заголовка:
"Общий список
областей и губерний
Российской империи
и иных государств
и территорий".
3.Проект должен базироваться на любых источниках информации, которые можно разделить условно на 2 категории:
- любого типа документальные источники (официальные документы, публикации и т.д.), с обязательной ссылкой на источник такой информации,
- свидетельские показания (к примеру внучка пишет, что дедушка....), с обязательной ссылкой на этого человека, несущего ответственность за достоверность его сведений (ФИО, электронный адрес, регистрация при вводе информации - тогда будет есть с кого спросить при обнаружении фикции)
4.Проект должен пополняться информацией любым, желающим этого, пользователем. Волонтер должен стать вторичным в проекте и востребованным только для массовой разовой акции по наполнению проекта сведениями.
5.Проект должен таким образом работать и пропагандироваться, чтобы при проекте всегда была команда единомышленников, согласная работать на принципах работы общественных организаций. Такие люди изначально должны понимать: то, что они делают, дает только моральное удовлетворение и , в лучшем случае при очевидном успехе, некую популярность, известность, и не более того. Кстати, вторая составляющая принципов общественной деятельности, иногда приводит к востребованности на других направлениях, уже не связанных с общественными организациями, что в конечном итоге может повлечь выгоду и материальную.
6.Итоги проекта должны быть таким образом оформлены, чтобы они были доступны пользователю до тех пор, пока туда за информацией будет приходить даже один человек один раз в один год, что позволяло бы придать ему некую автономность, и исключить зависимость работоспособности итогов проекта в конкретные завершенные периоды от создателей программ: в таком виде программист будет востребован только для действий, модернизирующих программу под обнаруженные новые требования к ней или для расширения ее возможностей в случае возникшей необходимости.
7. В оформленных итогах проекта должны быть заложены механизмы способности к развитию, в случае обнаружения новых задач или при их возникновении, чтобы радикально не изменять то, что уже функционирует.
8. В самой системе БД должны быть заложены механизмы функционирования, которые бы позволяли разнородные куски информации об одном и том же человеке объединять, формируя при этом так называемую персональную карточку учета военнослужащего.
Ссылка на комментарий
Поделиться на других сайтах

Что бы всё было красиво, единообразно и покрашено зелёной краской, желаю уточнить правила и рекомендации заполнения списков по журналу «Разведчик».
Хочу увидеть ответы от коллег по «набивке», а так же от программистов и нашей тяжелой артиллерии, в лице Николая Чернухина.

 

1 – звание – заполняем в сокращенном виде (прпрщ.) или полном (прапорщик)?
2 – ФИО – если есть два варианта написания (пример - Коцуб или Кочюб) – как вносить – использовать «или» -Коцуб или Кочюб; использовать «слэш» Коцуб / Кочюб; использовать «скобки» Коцуб (Кочюб)?
3 – вероисповедание – вносить так, как указано в существующей базе – православное?
4 – губерния – Тверская? Тверской? приписывать ли «губерния» или «губ.»?
5 – уезд, волость/населенный пункт – вопросы аналогичные – в каком падеже писать, писать ли полностью «город», «деревня» или использовать сокращения «г.», «д.»?
6.1 – дата – так же как при заполнении «царскосельских списков» - год - 1914, месяц и год - .08.1914, число - 01.08.1914, период - 01.08.-02.08.1914
6.2 - дата – «Разведчик» 1917 года выпуска ссылается на «Русского инвалида» 1915 года – ставим 1917 или 1915?
7 – источник - в качестве источника информации указывать «Русского инвалида» или «Разведчика»?

 

Предлагаю обсудить быстро, большинством голосов выбрать ответы, что бы уже завтра было меньше неясностей. :rolleyes:

Ссылка на комментарий
Поделиться на других сайтах

Что бы всё было красиво, единообразно и покрашено зелёной краской, желаю уточнить правила и рекомендации заполнения списков по журналу «Разведчик».
Хочу увидеть ответы от коллег по «набивке», а так же от программистов и нашей тяжелой артиллерии, в лице Николая Чернухина.

 

1 – звание – заполняем в сокращенном виде (прпрщ.) или полном (прапорщик)?
2 – ФИО – если есть два варианта написания (пример - Коцуб или Кочюб) – как вносить – использовать «или» -Коцуб или Кочюб; использовать «слэш» Коцуб / Кочюб; использовать «скобки» Коцуб (Кочюб)?
3 – вероисповедание – вносить так, как указано в существующей базе – православное?
4 – губерния – Тверская? Тверской? приписывать ли «губерния» или «губ.»?
5 – уезд, волость/населенный пункт – вопросы аналогичные – в каком падеже писать, писать ли полностью «город», «деревня» или использовать сокращения «г.», «д.»?
6.1 – дата – так же как при заполнении «царскосельских списков» - год - 1914, месяц и год - .08.1914, число - 01.08.1914, период - 01.08.-02.08.1914
6.2 - дата – «Разведчик» 1917 года выпуска ссылается на «Русского инвалида» 1915 года – ставим 1917 или 1915?
7 – источник - в качестве источника информации указывать «Русского инвалида» или «Разведчика»?

 

Предлагаю обсудить быстро, большинством голосов выбрать ответы, что бы уже завтра было меньше неясностей. :rolleyes:


Рекомендации:
1) Звание и т.п. поля заполняем с заглавной буквы. данные лучше писать в полном виде, если вы абсолютно уверены, что расшифровка верная. Если есть хоть малейшая тень сомнения, лучше оставить исходную форму слова — после разберёмся…

 

2) В именах лучше использовать скобки для вариантов написания, которые второстепенные;

 

3) Аналогично, как со званием — см. п.1;

 

4) Губернию пишем в именительном падеже («Тверская»). Слова «губерния», «область» и т.п. пишем единообразно. Форма записи особого значения не имеет. Хотя от себя предлагаю для краткости всегда писать «губ.» и «обл.».

 

5) Аналогично, как с губернией — см. п. 4. Для краткости предлагаю писать «у.», «вол.», «г.», «с.», «д.» и т.п. Уезд выносим в отдельную графу таблицы. Волость оставляем в общей куче. В графы «Губерния» и «Уезд» пишем только(!) название губерний и уездов. Все иные данные ( в том числе уездные и волостные города) выносим «в общую кучу».

 

6.1) Рекомендуемые варианты записи дат: год — «1914», месяц — «авг.1914» или «август 1914», число — «01 авг.1914» или «01 августа 1914», период — «01–02 авг.1914» или «01 авг.–12 сен.1914» и т.п. (или с полными названиями месяцев), список — «09, 10, 12 авг.1914» и т.п.
Главное, чтобы всё было единообразно. Месяцы намеренно пишем текстом, дабы не было шансов перепутать номера дня и месяца.

 

6.2) Дата выпуска пишется та, что указана для текущего документа. Т.е. 1917-й год в случае с примером.

 

7) Аналогично, как с п.6.2 — источником является текущий документ — т.е. «Разведчик» в случае с примером.

 

8) Нечитаемые символы: одиночные заменяем знаком вопроса каждый «Ков??ев», если нечитается неизвестно сколько символов, заменяем их звёздочкой: «Ков*».

 

9) Если в поле нечего писать, лучше вместо этого написать «(не указано)» — это пригодится для контроля на предмет пропусков в оцифровке.

Ссылка на комментарий
Поделиться на других сайтах

....

Андрей ответил на все вопросы - добавить нечего, согласен.
Ссылка на комментарий
Поделиться на других сайтах

....

Александр (правильно?), рекомендации Андрея носят приоритетный характер, поскольку ему, как разработчику программы, видны нюансы с точки зрения внесения обработанных данных в систему.
Ссылка на комментарий
Поделиться на других сайтах

С учетом всех поступивших рекомендаций и замечаний, в том числе взаимоисключающих друг друга, по набивке текста, инструкция теперь выглядит следующим образом
(если вновь кто имеет и к этой инструкции дополнения и замечания - пишите здесь):

ИНСТРУКЦИЯ (РЕКОМЕНДАЦИИ ПО НАБИВКЕ).
1. Текст набивается с применением современной орфографии - с заменой старорусских букв на современные.
2. Звание – заполняем в сокращенном виде (прпрщ.) или полном (прапорщик)? - если расшифровка известна: записывать без сокращений, если нет вариантов расшифровки - записывать, как в оригинале.
3. Отдельное поле для фамилии.
4. Фамилия – если есть два варианта написания (пример - Коцуб или Кочюб) – использовать «скобки» Коцуб (Кочюб).
5. Отдельное поле для имени-отчества - записываются вместе в одной графе.
6. Вероисповедание – вносить так, как указано в существующей базе – православное? - см.пункт2 (известно - полностью, нет вариантов расшифровки - строго по оригиналу).
7. Губернию/область пишем в именительном падеже. Слова «губерния», «область» и т.п. пишем единообразно. Форма записи особого значения не имеет. Можно для краткости всегда писать «губ.» и «обл.».
8. Уезд, волость/населенный пункт –аналогично - см. п.7. Для краткости можно писать «у.», «вол.», «г.», «с.», «д.» и т.п.
9. В графы «Губерния/Область» пишем только(!) название губерний/Областей.
10. По графе "Уезд" - вносим только название уездов.
11. По графе "Волость/населенный пункт": сюда вносить все названия волостей и любых населенных пунктов, в т.ч. Губернских, уездных и волостных городов.
12. Рекомендуемые варианты записи дат: год — «1914», месяц — «авг.1914» или «август 1914», число — «01 авг.1914» или «01 августа 1914», период — «01–02 авг.1914» или «01 авг.–12 сен.1914» и т.п. (или с полными названиями месяцев), список — «09, 10, 12 авг.1914» и т.п. Главное, чтобы всё было единообразно. Месяцы намеренно пишем текстом, дабы не было шансов перепутать номера дня и месяца.
13. ВОПРОС: дата – «Разведчик» 1917 года выпуска ссылается на «Русского инвалида» 1915 года – ставим 1917 или 1915? ОТВЕТ: Дата выпуска пишется та, что указана для текущего документа ("Разведчик"). Т.е. 1917-й год в случае с примером.
14. ВОПРОС: источник - в качестве источника информации указывать «Русского инвалида» или «Разведчика»? ОТВЕТ: Источником является текущий документ — т.е. «Разведчик» в случае с данной набивкой.
15. Если сведения дублируются или дополняются "Инвалидом" - вносить выпуск "Инвалида" и номер страницы в графу "Дополнительные сведения"
16. Нечитаемые символы: одиночные заменяем знаком вопроса каждый «Ков??ев», если нечитается неизвестно сколько символов, заменяем их звёздочкой: «Ков*».
17. Если в поле нечего писать, лучше вместо этого написать «(не указано)» — это пригодится для контроля на предмет пропусков в оцифровке.
18. Если в графах запись повторяется - никакими кавычками ее не обозачать - запись должна присутствовать в полном объеме.
19. Если в журнале содержится информация о награждениях воинов - вносить описание подвига в графу "Дополнительные сведения"
20. Награждение и собственно причину награждения вносить разными строками, со ссылкой из строки награждения на дату отличия в бою в графе дополнительно.
21. Графа "Причина выбытия" расширена значением "Причина события": в таком случае в этом столбце корректно будут смотреться как записи типа "убит", "контужен" так и "переведён", награждён", "отличился в бою".
22. Каких либо сортировок при завершении набивки списов не производить!!! - записи должны идти подряд - от номера к номеру, от страницы к странице источника.
23. Присланный Вам скан предварительно обработан в РЕДАКТОРЕ РАСПОЗНАВАНИЯ ТЕКСТА - если Вам это удобно, копируете запись, вставляете ее в лист для набивки и только корректируете ошибки - таким образом Вам не надо набивать весь текст, а только после его копирования - корректировать, вставляя предварительно его в соответствующие графы.
Ссылка на комментарий
Поделиться на других сайтах

....

Александр (правильно?), рекомендации Андрея носят приоритетный характер, поскольку ему, как разработчику программы, видны нюансы с точки зрения внесения обработанных данных в систему.

Верно Николай :)
Считаю необходимым дополнить инструкцию по набивке следующей рекомендацией Андрея - Звание и т.п. поля заполняем с заглавной буквы. данные лучше писать в полном виде, если вы абсолютно уверены, что расшифровка верная. Если есть хоть малейшая тень сомнения, лучше оставить исходную форму слова — после разберёмся…
Ссылка на комментарий
Поделиться на других сайтах

...
Считаю необходимым дополнить инструкцию по набивке следующей рекомендацией Андрея - Звание и т.п. поля заполняем с заглавной буквы. данные лучше писать в полном виде, если вы абсолютно уверены, что расшифровка верная. Если есть хоть малейшая тень сомнения, лучше оставить исходную форму слова — после разберёмся…

Принимается - добавил в инструкцию.
Ссылка на комментарий
Поделиться на других сайтах

2 – ФИО – если есть два варианта написания (пример - Коцуб или Кочюб) – как вносить – использовать «или» -Коцуб или Кочюб; использовать «слэш» Коцуб / Кочюб; использовать «скобки» Коцуб (Кочюб)?

А можно посмотреть пример, как обычно выглядит в источнике ситуация с двумя вариантами написания фамилии?
Ссылка на комментарий
Поделиться на других сайтах

2 – ФИО – если есть два варианта написания (пример - Коцуб или Кочюб) – как вносить – использовать «или» -Коцуб или Кочюб; использовать «слэш» Коцуб / Кочюб; использовать «скобки» Коцуб (Кочюб)?

А можно посмотреть пример, как обычно выглядит в источнике ситуация с двумя вариантами написания фамилии?

Третья строка об убитых:
0b0f63c0ca3bf1511d6637633b24af92.jpg
пдпрч. Коцюба (онъ же Кочуба)
Ссылка на комментарий
Поделиться на других сайтах

Дополнение к п.2 правил заполнения:

4. Фамилия – если есть два варианта написания (пример - Коцуб или Кочюб) – использовать «скобки» Коцуб (Кочюб).

При этом слова типа «он же», «по метрике» и т.п. — опускаем. Первой пишем основную версию фамилии. Остальные версии пишем в скобках через запятые. Пример: фразу в документе «Иванов он же Петров по метрике Сидоров» записываем как «Иванов (Петров, Сидоров)».
Ссылка на комментарий
Поделиться на других сайтах

Принято.
Внес дополнением в инструкцию по набивке.

Ссылка на комментарий
Поделиться на других сайтах

Не понимаю. Журнал этот еще не обрабатывается, только согласуется форма для обработки? Готова поучаствовать в обработке, когда это будет возможно.

Ссылка на комментарий
Поделиться на других сайтах

Галина Фёдоровна, журнал уже обрабатывается.
Практически вчера закончен 1917 год.
В обработке 1914-й год, обрабатываются некоторые номера 1915 и 1916 годов.
Если Вы не против, вышлю Вам один из номеров 1916 года с самим файлом для набивки - в нем же и инструкция.
Мы просто коллективно совершенствуем инструкцию по набивке, но уже набитые номера не трогаем, а переделываем под требования новой инструкции.
В каждом номере присутствуют сведения от 115 до 250 человек, а в приложениях - может доходить и до 1000 человек.

Ссылка на комментарий
Поделиться на других сайтах

Понял, сейчас вышлю один номер на пробу.

Ссылка на комментарий
Поделиться на других сайтах

Ещё один вопрос по написанию дворянских фамилий: в источнике - фон-Редигер - в файл писать фон-Редигер, фон Редигер или Редигер фон?

Ссылка на комментарий
Поделиться на других сайтах

В подобных случаях писать как в источнике.

 

Поисковая система уже умеет сама разбирать сложные фамилии «на винтики». В итоге эту запись можно будет найти и по запросу «фон-Ридигер», и по «Ридигер», и по просто «фон».

Ссылка на комментарий
Поделиться на других сайтах

В графе "Фамилия" должна быть только фамилия.
Если у военнослужащего указано два события, допустим: "Ранен" и "Остался в строю" - рекомендуется первое (на указанном примере: "Ранен") записать в графе "Причина выбытия/события", а второе (на примере: "Остался в строю") в графе "Дополнительные сведения". Но более правильно указывать оба этих события в одной графе "Причина выбытия/события" через дробь, на приведенном примере, это: "Ранен/остался в строю".

Ссылка на комментарий
Поделиться на других сайтах

Присоединяйтесь к обсуждению

Вы можете опубликовать сообщение сейчас, а зарегистрироваться позже. Если у вас есть аккаунт, войдите в него для написания от своего имени.

Гость
Ответить в теме...

×   Вставлено в виде отформатированного текста.   Вставить в виде обычного текста

  Разрешено не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.

 Поделиться

  • Сейчас на странице   0 пользователей

    • Нет пользователей, просматривающих эту страницу.
×
×
  • Создать...

Важная информация

Пожалуйста, прочитайте Условия использования