a-KaDeMi-k Опубликовано: 4 июля 2014 Поделиться Опубликовано: 4 июля 2014 Мои дорогие участники проекта - кто готов заняться выборкой потерь нижних чинов из"Томскія губернскія вѣдомости", 1914-1917гг.?Если есть желающие - как вседа, пишите мне на мой майл - вышлю все номера для выборки. Надо бы формат файла обсудить... Подумать, чтобы и волонтёрам работу не усложнять и чтобы в дальнейшем в базу данных легко было закачивать... Эх, программиста не хватает - Андрей сейчас по уши базой занят. А так, можно было бы подумать про онлайн ввод сразу в спец. таблицу базы - без промежуточных экселевских файлов... С поддержкой типичных данных из выпадающих списков и т.п. Цитата Ссылка на комментарий Поделиться на других сайтах Больше способов поделиться...
Николай Чернухин (Энич) Опубликовано: 4 июля 2014 Автор Поделиться Опубликовано: 4 июля 2014 Надо бы формат файла обсудить... Подумать, чтобы и волонтёрам работу не усложнять и чтобы в дальнейшем в базу данных легко было закачивать... Эх, программиста не хватает - Андрей сейчас по уши базой занят. А так, можно было бы подумать про онлайн ввод сразу в спец. таблицу базы - без промежуточных экселевских файлов... С поддержкой типичных данных из выпадающих списков и т.п. Обсуждение только приветствуется!При набивке, с учетом замечаний Андрея и пожеланий Дениса:-должны быть отдельные графы : фамилия-имя-отчество, а не вместе, как сейчас.- вместо номера списка - будет номер ведомостей- вместо страницы списка - страница газеты- плюс все звания и даты надо давать в максимально расшифрованном виде, и не только их, но и по остальным графам.- все записи делать с заглавной буквы- все слова - в именительном падеже.----Если есть другие или альтернативные варианты - готов выслушать. Цитата Ссылка на комментарий Поделиться на других сайтах Больше способов поделиться...
Николай Чернухин (Энич) Опубликовано: 4 июля 2014 Автор Поделиться Опубликовано: 4 июля 2014 Сокращения не приветствуются - а только там, где неясно, как правильно расшифровать.По идее приветствоваться должна современная орфография и написание букв, но если есть желание запись делать оригинальными буквами - можно обсудить.Так что проект продолжается и в части наполнения новыми списками.Главное, не надо Андрею и Денису думать об их срочной заливке в систему - с новыми списками это можно сделать позже и неспешно, после того, как система заработает по уже размещенным РГБ-шным спискам. Цитата Ссылка на комментарий Поделиться на других сайтах Больше способов поделиться...
a-KaDeMi-k Опубликовано: 4 июля 2014 Поделиться Опубликовано: 4 июля 2014 - плюс все звания и даты надо давать в максимально расшифрованном виде, и не только их, но и по остальным графам.- все записи делать с заглавной буквы- все слова - в именительном падеже.Вот эти три пункта капитально противоречат сохранению вида записи максимально приближённом к первоисточнику. Особенно первый.Хоть это и добавляет некоторые сложности с размещением, но я бы оставлял и сокращения и падежи и маленькие буквы. Единственное исключение - даты. Кстати, под них надо два столбца: в первом - конкретная дата или дата начала периода, во втором - пусто или дата окончания периода (правда, ещё есть вариант со списком дат...) Цитата Ссылка на комментарий Поделиться на других сайтах Больше способов поделиться...
helen_ka Опубликовано: 4 июля 2014 Поделиться Опубликовано: 4 июля 2014 Николай, меня интересует Томская губерния. Мои предки в то время проживали там.Присылай источники. Цитата Ссылка на комментарий Поделиться на других сайтах Больше способов поделиться...
АндрейХ Опубликовано: 4 июля 2014 Поделиться Опубликовано: 4 июля 2014 Надо бы формат файла обсудить... Подумать, чтобы и волонтёрам работу не усложнять и чтобы в дальнейшем в базу данных легко было закачивать... Эх, программиста не хватает - Андрей сейчас по уши базой занят. А так, можно было бы подумать про онлайн ввод сразу в спец. таблицу базы - без промежуточных экселевских файлов... С поддержкой типичных данных из выпадающих списков и т.п. Обсуждение только приветствуется!При набивке, с учетом замечаний Андрея и пожеланий Дениса:-должны быть отдельные графы : фамилия-имя-отчество, а не вместе, как сейчас.- вместо номера списка - будет номер ведомостей- вместо страницы списка - страница газеты- плюс все звания и даты надо давать в максимально расшифрованном виде, и не только их, но и по остальным графам.- все записи делать с заглавной буквы- все слова - в именительном падеже.----Если есть другие или альтернативные варианты - готов выслушать. Нет, нет и нет! 1) Весь текст стараемся забивать максимально в том виде, как он в оригинале (с ятями и т.п. анахронизмами). В том числе звания и даты.2) Отдельное поле для фамилии. Имя-отчество, имхо, разумнее хранить слитно, дабы не заморачиваться где что для нерусских имён. Всё. Больше требований нет. Сейчас формализатор прекрасно справляется со всеми формами указания дат, что были в списках. Он сам может поставить «год по умолчанию», сам расшифрует периоды и т.п. Цитата Ссылка на комментарий Поделиться на других сайтах Больше способов поделиться...
Николай Чернухин (Энич) Опубликовано: 4 июля 2014 Автор Поделиться Опубликовано: 4 июля 2014 Всё принимаю к сведению.Елена, пришлю.Не факт, что там можно найти сразу эти списки - иногда может быть просто заметка о воине и не более, так что надо тщательно, номер за номером, страницу за страницей просматривать.Сделал маленькую хронику войны в картинках - сканах из "Ведомостей":1. От начала войны до отречения от Престола:Манифест о начале войны.Отречение Николая 2. 2. Призыв и розыск:Люди увольняются в связи с призывом на войну. Фельдшера идут на войну спасать раненых и больных.И разыскиваются, чтобы быть призванными. 3. Именные списки - везде по разному(От Красного Креста до Генштаба): 4. На дворе уже разгорается гражданская война, а списки только за 1914 год таки появились: Цитата Ссылка на комментарий Поделиться на других сайтах Больше способов поделиться...
Николай Чернухин (Энич) Опубликовано: 4 июля 2014 Автор Поделиться Опубликовано: 4 июля 2014 Андрей и Денис!С учетом Ваших замечаний сделайте, плиз, консолидированную методичку о правилах набивки списков из "Ведомостей",с указанием:- как правильно набивать текст, отталкиваясь от оригинала, и какие графы в файле для набивки должны присутствовать.И разместите здесь, а я тогда методичку включу в шаблоны для набивки тем, кто будет брать "Ведомости" в обработку. Цитата Ссылка на комментарий Поделиться на других сайтах Больше способов поделиться...
АндрейХ Опубликовано: 5 июля 2014 Поделиться Опубликовано: 5 июля 2014 Андрей и Денис!С учетом Ваших замечаний сделайте, плиз, консолидированную методичку о правилах набивки списков из "Ведомостей",с указанием:- как правильно набивать текст, отталкиваясь от оригинала, и какие графы в файле для набивки должны присутствовать.И разместите здесь, а я тогда методичку включу в шаблоны для набивки тем, кто будет брать "Ведомости" в обработку. Денис,Просьба взять это на себя, а я позже подправлю.Для ввода старо-русских символов рекомендую устанавливать типографскую раскладку Ильи Бирмана: http://ilyabirman.ru/projects/typography-layout/ Цитата Ссылка на комментарий Поделиться на других сайтах Больше способов поделиться...
Николай Чернухин (Энич) Опубликовано: 5 июля 2014 Автор Поделиться Опубликовано: 5 июля 2014 Елена Кравцова взяла на себя "Томские губернские ведомости",Василий Иванович Богатырёв - журнал "Разведчик".По журналу - в помощь Василию Ивановичу нужны еще желающие - объемы большие, одному тяжело.Александр Молчанов занимается списками по захоронениям военнопленных,я занялся - потерями среди некоторых полков.Еще Олонецкие и Иркутские губернские ведомости остались неразобранными - есть желающие по ним?Если есть - пишите: вышлю. Цитата Ссылка на комментарий Поделиться на других сайтах Больше способов поделиться...
Николай Чернухин (Энич) Опубликовано: 5 июля 2014 Автор Поделиться Опубликовано: 5 июля 2014 На сайт в свободный доступ размещен очередной дополнительный список по потерям в ПМВ:Список 8. Казаки 3-го воен.отдела Сибирского казачьего войска Цитата Ссылка на комментарий Поделиться на других сайтах Больше способов поделиться...
a-KaDeMi-k Опубликовано: 5 июля 2014 Поделиться Опубликовано: 5 июля 2014 Сделал шаблон под известный список столбцов, но постарался учесть недостатки предыдущего.Готов к обсуждению.Очень хочется услышать мнение наших основных волонтёров-трудоголиков, что можно сделать (в пределах возможного), чтобы облегчить им труд! Внимание! Шаблон с макросом, поэтому антивирус может ругнуться. Но вирусов не должно быть, по идее Шаблон_v2.zip Цитата Ссылка на комментарий Поделиться на других сайтах Больше способов поделиться...
Николай Чернухин (Энич) Опубликовано: 5 июля 2014 Автор Поделиться Опубликовано: 5 июля 2014 Себе скачал - осмыслю - выскажу свое мнение. Цитата Ссылка на комментарий Поделиться на других сайтах Больше способов поделиться...
a-KaDeMi-k Опубликовано: 5 июля 2014 Поделиться Опубликовано: 5 июля 2014 Есть ещё такое предложение для уменьшения сложности ввода старорусских букв, исключающее использование старорусской раскладки.Договариваемся, что вместо Ѣ вводим 1, вместо ѣ - 2 и далее ѵ-3, Ѵ-4, і-5, І-6, ѳ-7, Ѳ-8.Я пишу макрос, который необходимо будет запустить по окончании ввода и он автоматически проведёт замену цифр на нужные буквы. Единственное ограничение и сложность - в столбце должны быть данные не содержащие цифр. Поэтому такой вариант для дат (если месяцы заводить названиями) не подойдёт Но мы можем решить вводить даты сразу в формате дат, отступая от правила максимального приближения к огигиналу. Цитата Ссылка на комментарий Поделиться на других сайтах Больше способов поделиться...
a-KaDeMi-k Опубликовано: 5 июля 2014 Поделиться Опубликовано: 5 июля 2014 Для ввода старо-русских символов рекомендую устанавливать типографскую раскладку Ильи Бирмана: http://ilyabirman.ru/projects/typography-layout/ Настройка раскладок клавиатуры после установки находится по пути:"Панель управления" > "Язык и региональные стандарты" > закладка "Языки" > кнопка "Подробнее" > выбираем раскладку, действующую по-умолчанию Цитата Ссылка на комментарий Поделиться на других сайтах Больше способов поделиться...
Николай Чернухин (Энич) Опубликовано: 5 июля 2014 Автор Поделиться Опубликовано: 5 июля 2014 Есть ещё такое предложение для уменьшения сложности ввода старорусских букв, исключающее использование старорусской раскладки.Договариваемся, что вместо Ѣ вводим 1, вместо ѣ - 2 и далее ѵ-3, Ѵ-4, і-5, І-6, ѳ-7, Ѳ-8.Я пишу макрос, который необходимо будет запустить по окончании ввода и он автоматически проведёт замену цифр на нужные буквы. Единственное ограничение и сложность - в столбце должны быть данные не содержащие цифр. Поэтому такой вариант для дат (если месяцы заводить названиями) не подойдёт Но мы можем решить вводить даты сразу в формате дат, отступая от правила максимального приближения к огигиналу. Это все неудобно - постоянно думать о цифрах вместо букв. Более оптимальным, и оправдавшим себя в своей простоте и удобстве, видится вариант, использованный в том числе и нами, для набивки списков для Алексеева Б.В. - в верхней строке ячейки с дореформенными буквами, которые копируются в ячейку при набивке - проще и удобнее. Цитата Ссылка на комментарий Поделиться на других сайтах Больше способов поделиться...
a-KaDeMi-k Опубликовано: 5 июля 2014 Поделиться Опубликовано: 5 июля 2014 Есть ещё такое предложение для уменьшения сложности ввода старорусских букв, исключающее использование старорусской раскладки.Договариваемся, что вместо Ѣ вводим 1, вместо ѣ - 2 и далее ѵ-3, Ѵ-4, і-5, І-6, ѳ-7, Ѳ-8.Я пишу макрос, который необходимо будет запустить по окончании ввода и он автоматически проведёт замену цифр на нужные буквы. Единственное ограничение и сложность - в столбце должны быть данные не содержащие цифр. Поэтому такой вариант для дат (если месяцы заводить названиями) не подойдёт Но мы можем решить вводить даты сразу в формате дат, отступая от правила максимального приближения к огигиналу. Это все неудобно - постоянно думать о цифрах вместо букв. Более оптимальным, и оправдавшим себя в своей простоте и удобстве, видится вариант, использованный в том числе и нами, для набивки списков для Алексеева Б.В. - в верхней строке ячейки с дореформенными буквами, которые копируются в ячейку при набивке - проще и удобнее. Дело привычки. Но копирование - это несколько лишних движений. Я Алексееву описанным мною способом набивал Можно предусмотреть все три варианта - ни один из них никакому другому не мешает, по большому счёту. Цитата Ссылка на комментарий Поделиться на других сайтах Больше способов поделиться...
bova Опубликовано: 5 июля 2014 Поделиться Опубликовано: 5 июля 2014 Просмотрел некоторые списки из газеты "Разведчик" для них предлагаемый шаблон избыточен. Актуальны только столбцы: Звание, Фамилия, Имя отчество, Причина выбытия, иногда встречается титул. Дата отсутствует, можно указывать год по газете и то это будет не вполне достоверно, т.к. в январском номере скорей всего сведения за прошлый год. Что делать с лишними столбцами, удалять или по всем указывать "нет данных" (очень большой балласт). Кроме того встречаются текстовые вставки с более подробной информацией о человеке, или с указанием на ошибки в газете "Русский инвалид" откуда и взята информация о потерях. Куда заносить данную информацию, добавлять столбец "Дополнительные данные" или размещать на отдельной странице. Тут лежит Номер журнала Разведчик где можно увидеть о чем я пишу. И еще я всегда поддерживался того, что надо набирать текст максимально близко к первоисточнику, (даже когда нам кажется что имеется ошибка) но набор на старорусском это уже излишество, набирая в современном стиле информацию мы не искажаем. Зато в старорусском создаем себе дополнительные проблемы. Конкретно для меня: На том компьютере, где я делаю основную массу работы, я не имею административных прав, поэтому дополнительную раскладку установить не смогу, да и макросы отключатся, а добавлять яти через вставку символов слишком непроизводительно. Цитата Ссылка на комментарий Поделиться на других сайтах Больше способов поделиться...
ИринаФМ Опубликовано: 5 июля 2014 Поделиться Опубликовано: 5 июля 2014 но набор на старорусском это уже излишество, набирая в современном стиле информацию мы не искажаем. Зато в старорусском создаем себе дополнительные проблемы Полностью поддерживаю. В первую очередь над думать о тех, для кого это все делается - для обычных людей, в основной массе не представляющих себе дореформенных правил. И они в жизни не найдут своего Федорова Матвея Федотовича, например. Цитата Ссылка на комментарий Поделиться на других сайтах Больше способов поделиться...
bova Опубликовано: 5 июля 2014 Поделиться Опубликовано: 5 июля 2014 И еще упустил по шаблону: столбец "место инф-ции в источнике" мне кажется надо разбить на два "№ газеты" и № страницы" Цитата Ссылка на комментарий Поделиться на других сайтах Больше способов поделиться...
a-KaDeMi-k Опубликовано: 5 июля 2014 Поделиться Опубликовано: 5 июля 2014 но набор на старорусском это уже излишество, набирая в современном стиле информацию мы не искажаем. Зато в старорусском создаем себе дополнительные проблемы Полностью поддерживаю. В первую очередь над думать о тех, для кого это все делается - для обычных людей, в основной массе не представляющих себе дореформенных правил. И они в жизни не найдут своего Федорова Матвея Федотовича, например. Для функции поиска яти и проч. не страшны. Наберёт пользователь "Иван" или "Иванъ" - неважно, система в обоих случаях выдаст ему и тех и других. Но волонтёрам они, конечно же, добавят головной боли. Предложение по вводу ятей возникло по причине того, что была мысль: дать возможность пользователю при работе с базой увидеть результаты в двух режимах - как в источнике (такого типа результат он мог бы напрямую копировать, скажем, в научную статью), так и в нормированном виде (современное написание, расшифровка сокращений и т.п.).У меня опыта нет. Я просто предполагаю, что когда приводят цитаты из дореформенных источников, то соблюдают всё до точек.Если это не так, или если команда и руководитель решат, что этого не надо, то настаивать не буду Цитата Ссылка на комментарий Поделиться на других сайтах Больше способов поделиться...
Николай Чернухин (Энич) Опубликовано: 5 июля 2014 Автор Поделиться Опубликовано: 5 июля 2014 По предложенному шаблону.Изучил.Давайте все же подведем итог.Тема дореформенной орфографии уже затрагивалась в начале проекта в 2012 году.В результате мы решили набивать в современном стиле - поступим однозначно также и сейчас.Тем более, если для системы все равно - зачем мучить волонтеров?Ну проскользнет где-то дореформенная буковка, система ее и считает, коли умеет, а волонтерам мучиться не надо. По источнику информации - считаю правильным сохранить эти два универсальных поля:№ источника информации (списка, журнала, чего угодно)№ страницы источника информации (списка, журнала и т.д.) Основная масса документов имеет эти два признака, даже, если мы возьмем архивное дело или выборку по нему (те же полковые выборки) - там также присутствует № документа (дело номер...) и номер страницы документа. По дополнительной и неясной, но тем не менее важной, информации поле "дополнительные сведения" надо вводить - и туда складировать все важное по записи, но непонятно куда относящееся.Вообще-то у нас ряд граф по иным источникам намечается.Надо вводить графу сословие, в том числе титульное - в журнале у Василия Ивановича есть и князья и прочие представители дворянского титулованного сословия.Надо вводить графу "место службы" - и такие записи уже в работе.Надо думать с графой "Место захоронения" и может быть объединять ее с еще одной новой графой "место гибели/смерти" - и такие записи уже попадаются.Есть раненые, где указано, в каком лазарете или госпитале они проходили лечение - а это уже или "дополнительные сведения" или отдельная графа.Лучше - "дополнительные сведения" - станет универсальной графой для разнородной информации о персоне. Цитата Ссылка на комментарий Поделиться на других сайтах Больше способов поделиться...
Николай Чернухин (Энич) Опубликовано: 5 июля 2014 Автор Поделиться Опубликовано: 5 июля 2014 Шаблон в первую очередь должен быть максимально удобен и понятен волонтеру и максимально прост в использовании при сохранении возможности внесения в него всей имеющейся по персоне информации, а систему потом надо под него адаптировать в меру ее возможностей.Плюс, он должен быть максимально универсален, чтобы до бесконечности не придумывать все новые и новые графы. Цитата Ссылка на комментарий Поделиться на других сайтах Больше способов поделиться...
Николай Чернухин (Энич) Опубликовано: 5 июля 2014 Автор Поделиться Опубликовано: 5 июля 2014 И должна быть графа - источник информации(архив, журнал, он-лайн библиотека, фонд, список, и т.д. и т.п.).Кстати, над этими графами не первый день голову ломаю, когда приступили к иным источникам.Сейчас постараюсь в черновом виде представить.Весь новый шаблон должен взять в себя уже использовавшийся плюс новые графы максимально унифицированные.Графы, которые для какого-либо документа будут невостребованными, останутся пустыми, а при размещении не будут показываться.При набивке же списков волонтер просто их игнорирует, либо закрывая их поля в шаблоне - либо удаляя, чтобы не мешали при работе. Цитата Ссылка на комментарий Поделиться на других сайтах Больше способов поделиться...
a-KaDeMi-k Опубликовано: 5 июля 2014 Поделиться Опубликовано: 5 июля 2014 Просмотрел некоторые списки из газеты "Разведчик" для них предлагаемый шаблон избыточен. Актуальны только столбцы: Звание, Фамилия, Имя отчество, Причина выбытия, иногда встречается титул. Дата отсутствует, можно указывать год по газете и то это будет не вполне достоверно, т.к. в январском номере скорей всего сведения за прошлый год. Что делать с лишними столбцами, удалять или по всем указывать "нет данных" (очень большой балласт). Кроме того встречаются текстовые вставки с более подробной информацией о человеке, или с указанием на ошибки в газете "Русский инвалид" откуда и взята информация о потерях. Куда заносить данную информацию, добавлять столбец "Дополнительные данные" или размещать на отдельной странице. Тут лежит Номер журнала Разведчик где можно увидеть о чем я пишу. И еще я всегда поддерживался того, что надо набирать текст максимально близко к первоисточнику, (даже когда нам кажется что имеется ошибка) но набор на старорусском это уже излишество, набирая в современном стиле информацию мы не искажаем. Зато в старорусском создаем себе дополнительные проблемы. Конкретно для меня: На том компьютере, где я делаю основную массу работы, я не имею административных прав, поэтому дополнительную раскладку установить не смогу, да и макросы отключатся, а добавлять яти через вставку символов слишком непроизводительно. Про "(нет данных)"...Во-первых, обращаю внимание(!), слова в скобочках.Во-вторых, можно понадеятся на волонтёров и их внимательность и исключить пункт про "(нет данных)" (но оставить про "(нечитаемо)"!!!). В таком случае пустая ячейка будет чётко интерпретироваться в этом смысле. Про столбцы шаблона...База данных, куда мы в конце концов данные загрузим, фактически представляет из себя группу обычных таблиц. Поэтому всё, что мы набиваем, надо и набивать в таблицы. Т.е. очень нежелательно часть сведений завести в столбцы для этого предназначенные, а всё оставшееся скопом в столбец дополнительных сведений.Поэтому алгоритм такой: - лишние столбцы можно удалять; - порядок следования столбцов можно менять (думаю, по стандартному заголовку мы сможем разобраться что куда загружать); - для каждой новой единицы информации заводить новый столбец (не выносить на отдельную страницу!), т.е. если хоть где-то встречается, допустим, титул, то создаём столбец титул (который для большинства записей будет незаполненным). Дат выбытия нет - значит и столбца нет.Дата газеты, её название и номер указываем на странице "Источник" и помним, что один источник - один файл. Новый источник - новый файл. И тогда в самой таблице указываем только страницу. P.S.: чтобы не плодить столбцы для дополнительных данных, которые для большинства записей будут не заполнены, предлагаю делать для таких людей отдельную страницу в файле.Т.е., в привязке к "Разведчику"... На странице "Данные" оставляем столбцы: Звание, Фамилия, Имя Отчество, причина выбытия, страница. Но создаём новую страницу "Данные расш.(иренные)", куда заводим записи о людях, для которых указано что-то ещё, кроме перечисленного. На ней делаем дополнительно столбцы: место смерти, дата рождения, звание отца, место рождения, место учёбы, год выпуска и т.д. (на примере полковника Осипа Осиповича Струсевича). Столбцов будет много - практически биография, но таких записей очень мало.При этом данные заносим либо в "Данные" либо в "Данные расш.") - дублировать не надо. Цитата Ссылка на комментарий Поделиться на других сайтах Больше способов поделиться...
Рекомендованные сообщения
Присоединяйтесь к обсуждению
Вы можете опубликовать сообщение сейчас, а зарегистрироваться позже. Если у вас есть аккаунт, войдите в него для написания от своего имени.