Перейти к публикации

Беседка


Рекомендованные сообщения

Мои дорогие участники проекта - кто готов заняться выборкой потерь нижних чинов из
"Томскія губернскія вѣдомости", 1914-1917гг.?
Если есть желающие - как вседа, пишите мне на мой майл - вышлю все номера для выборки.

Надо бы формат файла обсудить... Подумать, чтобы и волонтёрам работу не усложнять и чтобы в дальнейшем в базу данных легко было закачивать...

 

Эх, программиста не хватает - Андрей сейчас по уши базой занят. А так, можно было бы подумать про онлайн ввод сразу в спец. таблицу базы - без промежуточных экселевских файлов... С поддержкой типичных данных из выпадающих списков и т.п. :rolleyes:

Ссылка на комментарий
Поделиться на других сайтах

Надо бы формат файла обсудить... Подумать, чтобы и волонтёрам работу не усложнять и чтобы в дальнейшем в базу данных легко было закачивать...

 

Эх, программиста не хватает - Андрей сейчас по уши базой занят. А так, можно было бы подумать про онлайн ввод сразу в спец. таблицу базы - без промежуточных экселевских файлов... С поддержкой типичных данных из выпадающих списков и т.п. :rolleyes:


Обсуждение только приветствуется!
При набивке, с учетом замечаний Андрея и пожеланий Дениса:
-должны быть отдельные графы : фамилия-имя-отчество, а не вместе, как сейчас.
- вместо номера списка - будет номер ведомостей
- вместо страницы списка - страница газеты
- плюс все звания и даты надо давать в максимально расшифрованном виде, и не только их, но и по остальным графам.
- все записи делать с заглавной буквы
- все слова - в именительном падеже.
----
Если есть другие или альтернативные варианты - готов выслушать.
Ссылка на комментарий
Поделиться на других сайтах

Сокращения не приветствуются - а только там, где неясно, как правильно расшифровать.
По идее приветствоваться должна современная орфография и написание букв, но если есть желание запись делать оригинальными буквами - можно обсудить.
Так что проект продолжается и в части наполнения новыми списками.
Главное, не надо Андрею и Денису думать об их срочной заливке в систему - с новыми списками это можно сделать позже и неспешно, после того, как система заработает по уже размещенным РГБ-шным спискам.

Ссылка на комментарий
Поделиться на других сайтах

- плюс все звания и даты надо давать в максимально расшифрованном виде, и не только их, но и по остальным графам.
- все записи делать с заглавной буквы
- все слова - в именительном падеже.
Вот эти три пункта капитально противоречат сохранению вида записи максимально приближённом к первоисточнику. Особенно первый.
Хоть это и добавляет некоторые сложности с размещением, но я бы оставлял и сокращения и падежи и маленькие буквы. Единственное исключение - даты.

 

Кстати, под них надо два столбца: в первом - конкретная дата или дата начала периода, во втором - пусто или дата окончания периода (правда, ещё есть вариант со списком дат...)

Ссылка на комментарий
Поделиться на других сайтах

Николай, меня интересует Томская губерния. Мои предки в то время проживали там.
Присылай источники.

Ссылка на комментарий
Поделиться на других сайтах

Надо бы формат файла обсудить... Подумать, чтобы и волонтёрам работу не усложнять и чтобы в дальнейшем в базу данных легко было закачивать...

 

Эх, программиста не хватает - Андрей сейчас по уши базой занят. А так, можно было бы подумать про онлайн ввод сразу в спец. таблицу базы - без промежуточных экселевских файлов... С поддержкой типичных данных из выпадающих списков и т.п. :rolleyes:


Обсуждение только приветствуется!
При набивке, с учетом замечаний Андрея и пожеланий Дениса:
-должны быть отдельные графы : фамилия-имя-отчество, а не вместе, как сейчас.
- вместо номера списка - будет номер ведомостей
- вместо страницы списка - страница газеты
- плюс все звания и даты надо давать в максимально расшифрованном виде, и не только их, но и по остальным графам.
- все записи делать с заглавной буквы
- все слова - в именительном падеже.
----
Если есть другие или альтернативные варианты - готов выслушать.

Нет, нет и нет!

 

1) Весь текст стараемся забивать максимально в том виде, как он в оригинале (с ятями и т.п. анахронизмами). В том числе звания и даты.
2) Отдельное поле для фамилии. Имя-отчество, имхо, разумнее хранить слитно, дабы не заморачиваться где что для нерусских имён.

 

Всё. Больше требований нет.

 

Сейчас формализатор прекрасно справляется со всеми формами указания дат, что были в списках. Он сам может поставить «год по умолчанию», сам расшифрует периоды и т.п.

Ссылка на комментарий
Поделиться на других сайтах

Всё принимаю к сведению.
Елена, пришлю.
Не факт, что там можно найти сразу эти списки - иногда может быть просто заметка о воине и не более, так что надо тщательно, номер за номером, страницу за страницей просматривать.
Сделал маленькую хронику войны в картинках - сканах из "Ведомостей":
1. От начала войны до отречения от Престола:
b14968ec15a5594a5494085142a38aa1.jpg
Манифест о начале войны.
aed8e4cf2387a603e7c7ff6501327d3c.jpg
Отречение Николая 2.

 

2. Призыв и розыск:
d1a1dc970d60fecc3d6b47cfde95b79d.jpg
Люди увольняются в связи с призывом на войну. Фельдшера идут на войну спасать раненых и больных.
6f68dd9a0353f5c51e6d62a00647b8cc.jpg
И разыскиваются, чтобы быть призванными.

 

3. Именные списки - везде по разному
(От Красного Креста до Генштаба):
c305ac38358941f5aacc857ede7609fe.jpg
75634e6ccae2bdec305f75ceb3f0f060.jpg

 

4. На дворе уже разгорается гражданская война, а списки только за 1914 год таки появились:
a875fbbd8ad28d6aaa7cf82bfcb5980a.jpg

Ссылка на комментарий
Поделиться на других сайтах

Андрей и Денис!
С учетом Ваших замечаний сделайте, плиз, консолидированную методичку о правилах набивки списков из "Ведомостей",
с указанием:
- как правильно набивать текст, отталкиваясь от оригинала, и какие графы в файле для набивки должны присутствовать.
И разместите здесь, а я тогда методичку включу в шаблоны для набивки тем, кто будет брать "Ведомости" в обработку.

Ссылка на комментарий
Поделиться на других сайтах

Андрей и Денис!
С учетом Ваших замечаний сделайте, плиз, консолидированную методичку о правилах набивки списков из "Ведомостей",
с указанием:
- как правильно набивать текст, отталкиваясь от оригинала, и какие графы в файле для набивки должны присутствовать.
И разместите здесь, а я тогда методичку включу в шаблоны для набивки тем, кто будет брать "Ведомости" в обработку.

Денис,
Просьба взять это на себя, а я позже подправлю.
Для ввода старо-русских символов рекомендую устанавливать типографскую раскладку Ильи Бирмана: http://ilyabirman.ru/projects/typography-layout/
Ссылка на комментарий
Поделиться на других сайтах

Елена Кравцова взяла на себя "Томские губернские ведомости",
Василий Иванович Богатырёв - журнал "Разведчик".
По журналу - в помощь Василию Ивановичу нужны еще желающие - объемы большие, одному тяжело.
Александр Молчанов занимается списками по захоронениям военнопленных,
я занялся - потерями среди некоторых полков.
Еще Олонецкие и Иркутские губернские ведомости остались неразобранными - есть желающие по ним?
Если есть - пишите: вышлю.

Ссылка на комментарий
Поделиться на других сайтах

На сайт в свободный доступ размещен очередной дополнительный список по потерям в ПМВ:
Список 8. Казаки 3-го воен.отдела Сибирского казачьего войска

Ссылка на комментарий
Поделиться на других сайтах

Сделал шаблон под известный список столбцов, но постарался учесть недостатки предыдущего.
Готов к обсуждению.
Очень хочется услышать мнение наших основных волонтёров-трудоголиков, что можно сделать (в пределах возможного), чтобы облегчить им труд!

 

Внимание! Шаблон с макросом, поэтому антивирус может ругнуться. Но вирусов не должно быть, по идее :)

Шаблон_v2.zip

Ссылка на комментарий
Поделиться на других сайтах

Себе скачал - осмыслю - выскажу свое мнение.

Ссылка на комментарий
Поделиться на других сайтах

Есть ещё такое предложение для уменьшения сложности ввода старорусских букв, исключающее использование старорусской раскладки.
Договариваемся, что вместо Ѣ вводим 1, вместо ѣ - 2 и далее ѵ-3, Ѵ-4, і-5, І-6, ѳ-7, Ѳ-8.
Я пишу макрос, который необходимо будет запустить по окончании ввода и он автоматически проведёт замену цифр на нужные буквы.

 

Единственное ограничение и сложность - в столбце должны быть данные не содержащие цифр. Поэтому такой вариант для дат (если месяцы заводить названиями) не подойдёт :(
Но мы можем решить вводить даты сразу в формате дат, отступая от правила максимального приближения к огигиналу. ;)

Ссылка на комментарий
Поделиться на других сайтах

Для ввода старо-русских символов рекомендую устанавливать типографскую раскладку Ильи Бирмана: http://ilyabirman.ru/projects/typography-layout/

Настройка раскладок клавиатуры после установки находится по пути:
"Панель управления" > "Язык и региональные стандарты" > закладка "Языки" > кнопка "Подробнее" > выбираем раскладку, действующую по-умолчанию
Ссылка на комментарий
Поделиться на других сайтах

Есть ещё такое предложение для уменьшения сложности ввода старорусских букв, исключающее использование старорусской раскладки.
Договариваемся, что вместо Ѣ вводим 1, вместо ѣ - 2 и далее ѵ-3, Ѵ-4, і-5, І-6, ѳ-7, Ѳ-8.
Я пишу макрос, который необходимо будет запустить по окончании ввода и он автоматически проведёт замену цифр на нужные буквы.

 

Единственное ограничение и сложность - в столбце должны быть данные не содержащие цифр. Поэтому такой вариант для дат (если месяцы заводить названиями) не подойдёт :(
Но мы можем решить вводить даты сразу в формате дат, отступая от правила максимального приближения к огигиналу. ;)


Это все неудобно - постоянно думать о цифрах вместо букв. Более оптимальным, и оправдавшим себя в своей простоте и удобстве, видится вариант, использованный в том числе и нами, для набивки списков для Алексеева Б.В. - в верхней строке ячейки с дореформенными буквами, которые копируются в ячейку при набивке - проще и удобнее.
Ссылка на комментарий
Поделиться на других сайтах

Есть ещё такое предложение для уменьшения сложности ввода старорусских букв, исключающее использование старорусской раскладки.
Договариваемся, что вместо Ѣ вводим 1, вместо ѣ - 2 и далее ѵ-3, Ѵ-4, і-5, І-6, ѳ-7, Ѳ-8.
Я пишу макрос, который необходимо будет запустить по окончании ввода и он автоматически проведёт замену цифр на нужные буквы.

 

Единственное ограничение и сложность - в столбце должны быть данные не содержащие цифр. Поэтому такой вариант для дат (если месяцы заводить названиями) не подойдёт :(
Но мы можем решить вводить даты сразу в формате дат, отступая от правила максимального приближения к огигиналу. ;)


Это все неудобно - постоянно думать о цифрах вместо букв. Более оптимальным, и оправдавшим себя в своей простоте и удобстве, видится вариант, использованный в том числе и нами, для набивки списков для Алексеева Б.В. - в верхней строке ячейки с дореформенными буквами, которые копируются в ячейку при набивке - проще и удобнее.

 


Дело привычки. Но копирование - это несколько лишних движений. Я Алексееву описанным мною способом набивал :)
Можно предусмотреть все три варианта - ни один из них никакому другому не мешает, по большому счёту.
Ссылка на комментарий
Поделиться на других сайтах

Просмотрел некоторые списки из газеты "Разведчик" для них предлагаемый шаблон избыточен. Актуальны только столбцы: Звание, Фамилия, Имя отчество, Причина выбытия, иногда встречается титул. Дата отсутствует, можно указывать год по газете и то это будет не вполне достоверно, т.к. в январском номере скорей всего сведения за прошлый год. Что делать с лишними столбцами, удалять или по всем указывать "нет данных" (очень большой балласт). Кроме того встречаются текстовые вставки с более подробной информацией о человеке, или с указанием на ошибки в газете "Русский инвалид" откуда и взята информация о потерях. Куда заносить данную информацию, добавлять столбец "Дополнительные данные" или размещать на отдельной странице. Тут лежит Номер журнала Разведчик где можно увидеть о чем я пишу.

 

И еще я всегда поддерживался того, что надо набирать текст максимально близко к первоисточнику, (даже когда нам кажется что имеется ошибка) но набор на старорусском это уже излишество, набирая в современном стиле информацию мы не искажаем. Зато в старорусском создаем себе дополнительные проблемы. Конкретно для меня: На том компьютере, где я делаю основную массу работы, я не имею административных прав, поэтому дополнительную раскладку установить не смогу, да и макросы отключатся, а добавлять яти через вставку символов слишком непроизводительно.

Ссылка на комментарий
Поделиться на других сайтах

но набор на старорусском это уже излишество, набирая в современном стиле информацию мы не искажаем. Зато в старорусском создаем себе дополнительные проблемы

 

Полностью поддерживаю. В первую очередь над думать о тех, для кого это все делается - для обычных людей, в основной массе не представляющих себе дореформенных правил. И они в жизни не найдут своего Федорова Матвея Федотовича, например.

Ссылка на комментарий
Поделиться на других сайтах

И еще упустил по шаблону: столбец "место инф-ции в источнике" мне кажется надо разбить на два "№ газеты" и № страницы"

Ссылка на комментарий
Поделиться на других сайтах

но набор на старорусском это уже излишество, набирая в современном стиле информацию мы не искажаем. Зато в старорусском создаем себе дополнительные проблемы

 

Полностью поддерживаю. В первую очередь над думать о тех, для кого это все делается - для обычных людей, в основной массе не представляющих себе дореформенных правил. И они в жизни не найдут своего Федорова Матвея Федотовича, например.


Для функции поиска яти и проч. не страшны. Наберёт пользователь "Иван" или "Иванъ" - неважно, система в обоих случаях выдаст ему и тех и других. Но волонтёрам они, конечно же, добавят головной боли.

 

Предложение по вводу ятей возникло по причине того, что была мысль: дать возможность пользователю при работе с базой увидеть результаты в двух режимах - как в источнике (такого типа результат он мог бы напрямую копировать, скажем, в научную статью), так и в нормированном виде (современное написание, расшифровка сокращений и т.п.).
У меня опыта нет. Я просто предполагаю, что когда приводят цитаты из дореформенных источников, то соблюдают всё до точек.
Если это не так, или если команда и руководитель решат, что этого не надо, то настаивать не буду

Ссылка на комментарий
Поделиться на других сайтах

По предложенному шаблону.
Изучил.
Давайте все же подведем итог.
Тема дореформенной орфографии уже затрагивалась в начале проекта в 2012 году.
В результате мы решили набивать в современном стиле - поступим однозначно также и сейчас.
Тем более, если для системы все равно - зачем мучить волонтеров?
Ну проскользнет где-то дореформенная буковка, система ее и считает, коли умеет, а волонтерам мучиться не надо.

 

По источнику информации - считаю правильным сохранить эти два универсальных поля:
№ источника информации (списка, журнала, чего угодно)
№ страницы источника информации (списка, журнала и т.д.)

 

Основная масса документов имеет эти два признака, даже, если мы возьмем архивное дело или выборку по нему (те же полковые выборки) - там также присутствует № документа (дело номер...) и номер страницы документа.

 

По дополнительной и неясной, но тем не менее важной, информации поле "дополнительные сведения" надо вводить - и туда складировать все важное по записи, но непонятно куда относящееся.
Вообще-то у нас ряд граф по иным источникам намечается.
Надо вводить графу сословие, в том числе титульное - в журнале у Василия Ивановича есть и князья и прочие представители дворянского титулованного сословия.
Надо вводить графу "место службы" - и такие записи уже в работе.
Надо думать с графой "Место захоронения" и может быть объединять ее с еще одной новой графой "место гибели/смерти" - и такие записи уже попадаются.
Есть раненые, где указано, в каком лазарете или госпитале они проходили лечение - а это уже или "дополнительные сведения" или отдельная графа.
Лучше - "дополнительные сведения" - станет универсальной графой для разнородной информации о персоне.

Ссылка на комментарий
Поделиться на других сайтах

Шаблон в первую очередь должен быть максимально удобен и понятен волонтеру и максимально прост в использовании при сохранении возможности внесения в него всей имеющейся по персоне информации, а систему потом надо под него адаптировать в меру ее возможностей.
Плюс, он должен быть максимально универсален, чтобы до бесконечности не придумывать все новые и новые графы.

Ссылка на комментарий
Поделиться на других сайтах

И должна быть графа - источник информации(архив, журнал, он-лайн библиотека, фонд, список, и т.д. и т.п.).
Кстати, над этими графами не первый день голову ломаю, когда приступили к иным источникам.
Сейчас постараюсь в черновом виде представить.
Весь новый шаблон должен взять в себя уже использовавшийся плюс новые графы максимально унифицированные.
Графы, которые для какого-либо документа будут невостребованными, останутся пустыми, а при размещении не будут показываться.
При набивке же списков волонтер просто их игнорирует, либо закрывая их поля в шаблоне - либо удаляя, чтобы не мешали при работе.

Ссылка на комментарий
Поделиться на других сайтах

Просмотрел некоторые списки из газеты "Разведчик" для них предлагаемый шаблон избыточен. Актуальны только столбцы: Звание, Фамилия, Имя отчество, Причина выбытия, иногда встречается титул. Дата отсутствует, можно указывать год по газете и то это будет не вполне достоверно, т.к. в январском номере скорей всего сведения за прошлый год. Что делать с лишними столбцами, удалять или по всем указывать "нет данных" (очень большой балласт). Кроме того встречаются текстовые вставки с более подробной информацией о человеке, или с указанием на ошибки в газете "Русский инвалид" откуда и взята информация о потерях. Куда заносить данную информацию, добавлять столбец "Дополнительные данные" или размещать на отдельной странице. Тут лежит Номер журнала Разведчик где можно увидеть о чем я пишу.

 

И еще я всегда поддерживался того, что надо набирать текст максимально близко к первоисточнику, (даже когда нам кажется что имеется ошибка) но набор на старорусском это уже излишество, набирая в современном стиле информацию мы не искажаем. Зато в старорусском создаем себе дополнительные проблемы. Конкретно для меня: На том компьютере, где я делаю основную массу работы, я не имею административных прав, поэтому дополнительную раскладку установить не смогу, да и макросы отключатся, а добавлять яти через вставку символов слишком непроизводительно.

Про "(нет данных)"...
Во-первых, обращаю внимание(!), слова в скобочках.
Во-вторых, можно понадеятся на волонтёров и их внимательность и исключить пункт про "(нет данных)" (но оставить про "(нечитаемо)"!!!). В таком случае пустая ячейка будет чётко интерпретироваться в этом смысле.

 

Про столбцы шаблона...
База данных, куда мы в конце концов данные загрузим, фактически представляет из себя группу обычных таблиц. Поэтому всё, что мы набиваем, надо и набивать в таблицы. Т.е. очень нежелательно часть сведений завести в столбцы для этого предназначенные, а всё оставшееся скопом в столбец дополнительных сведений.
Поэтому алгоритм такой:
- лишние столбцы можно удалять;
- порядок следования столбцов можно менять (думаю, по стандартному заголовку мы сможем разобраться что куда загружать);
- для каждой новой единицы информации заводить новый столбец (не выносить на отдельную страницу!), т.е. если хоть где-то встречается, допустим, титул, то создаём столбец титул (который для большинства записей будет незаполненным).

 

Дат выбытия нет - значит и столбца нет.
Дата газеты, её название и номер указываем на странице "Источник" и помним, что один источник - один файл. Новый источник - новый файл. И тогда в самой таблице указываем только страницу.

 


P.S.: чтобы не плодить столбцы для дополнительных данных, которые для большинства записей будут не заполнены, предлагаю делать для таких людей отдельную страницу в файле.
Т.е., в привязке к "Разведчику"... На странице "Данные" оставляем столбцы: Звание, Фамилия, Имя Отчество, причина выбытия, страница. Но создаём новую страницу "Данные расш.(иренные)", куда заводим записи о людях, для которых указано что-то ещё, кроме перечисленного. На ней делаем дополнительно столбцы: место смерти, дата рождения, звание отца, место рождения, место учёбы, год выпуска и т.д. (на примере полковника Осипа Осиповича Струсевича). Столбцов будет много - практически биография, но таких записей очень мало.
При этом данные заносим либо в "Данные" либо в "Данные расш.") - дублировать не надо.

Ссылка на комментарий
Поделиться на других сайтах

Присоединяйтесь к обсуждению

Вы можете опубликовать сообщение сейчас, а зарегистрироваться позже. Если у вас есть аккаунт, войдите в него для написания от своего имени.

Гость
Ответить в теме...

×   Вставлено в виде отформатированного текста.   Вставить в виде обычного текста

  Разрешено не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.

 Поделиться

  • Сейчас на странице   0 пользователей

    • Нет пользователей, просматривающих эту страницу.
×
×
  • Создать...

Важная информация

Пожалуйста, прочитайте Условия использования