Перейти к контенту
abv

Именной список нижних чинов в войне 1914-1920 годов

Рекомендуемые сообщения

Есть такое издание:
"Именной список убитым, раненым и без вести пропавшим нижним чинам".
Это издание имеет шифр: в РГБ v 70/94, в РНБ 34692/65 (или 37.77.1.10 ?), в БАН 3в/18087. Всего издание состоит из 2835 выпусков, каждый по 16 страниц, итого 45360 страниц. Выпуски охватывают диапазон времени с августа 1914 года по июль 1916 года и содержат примерно 1.8 миллиона фамилий. В РГБ имеется лишь 67 томов (как правило, каждый том содержит 20 выпусков), т.е. около половины всех выпусков.

 

Позвольте представить Вашему вниманию проект http://history.h15.ru/#1914-1918, посвященный этому изданию.
Цель проекта - создание базы данных о потерях нижних чинов в Великой войне 1914-1918 гг.
(Обратите внимание, что этот проект, хотя и крупный, как по времени его исполнения, так и по объему данных, но лишь один из полутора десятков проектов, которые я веду на своем сайте Персональная история русскоязычного мира).

 

В рамках этого проекта собрана коллекция сканов издания, содержащая в наст. время около 890 выпусков (из вышедших в свое время - 1914-1916 - 2835 выпусков) - это прим. 15000 страниц. Функционируют два центра сканирования - ЦС-Питер и ЦС-Москва, осуществляющие сканирование оригиналов, соотв. из РНБ и РГБ, на средства Фонда Минувших Поколений (ФМП), образуемые исключительно из взносов добровольных жертвователей и моих взносов и направляемые исключительно на оплату фактических затрат сканирования.

 

По ЦС-Москва: осталось отсканировать около 400 выпусков, в деньгах это 32000р., поскольку 1 скан стоит 5 руб., а 400 выпусков - это 6400 стр. Я намерен тратить в месяц 5000р., что означает заверешение сканирования в течение полугода. Если найдутся желающие ускорить процесс, милости просим - мой емайл.

 

По ЦС-Питер: 100 выпусков в работе, кроме них, осталось отсканировать около 40 выпусков. Желающим помочь конкретно этому центру (финансово или организационно) дам координаты контактного лица в Питере.

 

ПРОСЬБА № 1. Финансовая помощь проекту.

 

К сожалению, коллекции РГБ и РНБ, даже вместе взятые, составляют лишь около половины всех опубликованных выпусков (точную инф-ию см. на указанной выше странице сайта). Поэтому очень нужна поисковая работа по отысканию мест "залегания" отсутствующих в РГБ и РНБ выпусков. Особенно было бы интересно проверить библ. Конгресса и универс. библиотеки США - там очень сильны фонды по славистике. Далеко не все еще проверено и в библиотеках Москвы.

 

ПРОСЬБА № 2. Помощь в поиске других источников оригиналов списка.

 

Есть вторая половина проекта, не менее важная, реализующая его второй этап. Это подпроект набивки данных со сканов в Эксель. Приходится, к сожалению, именно набивать, глядя на сканы, т.к. качество большинства сканов (которые были созданы в теч. трех лет разными людьми, разными способами, на разных носителях) недостаточно для автоматич. распознавания ФайнРидером. Источник набивается "один-к-одному", в доревол. шрифте, с ятями, чтобы набитый текст мог полностью заменить собой в дальнейшем оригиналы и даже сканы. Единств. изменение в тексте - замена признаков повторения текста типа "--" на непоср. набивку повторяемого текста - нужно для целей третьего этапа - преобразования набитого текста в базу данных.

 

Работа происходит так: человек пишет мне емайл с изъявлением желания участвовать в подпроекте набивки и указывает предпочтения - губернию или губернии, сведения по которой (которым) ему наиболее интересны. Я составляю выборку из базы данных выпусков (см. ниже, среди ресурсов подпроекта) - список выпусков, содержащих сведения по выбранным губерниям, упорядоченный по убыванию числа страниц, относящихся в этих выпусках к губерниям, указанным в предпочтениях. Таким образом, первыми в списке оказываются наиболее интересные человеку выпуски. Затем я посылаю потенциальному помощнику этот список и просьбу подтврдить готовность выполнять непременное условие: набивать надо ВСЕ 16 страниц высылаемого выпуска, а не только "интересные". Это своеобразная плата помощника (вдобавок к набивке им текста) за получение сканов оригинала издания. Ответное письмо кандидата с согласием на это условие означает его переход в разряд активных помощников. Я высылаю ему 4 письмами, по 4 прикрепл. скана формата jpg в каждом, первый из списка ненабитых выпусков - тот, что наиболее ему интересен. Нормативный срок набивки - 2 недели.

 

Ресурсы подпроекта:
Головная страница- общая инф-ия, список имеющихся в библиотеках, отсканированных, набитых выпусков, список набиваемых выпусков и данные о добровольных помощниках (число набитых страниц и выпусков, сроки, скорость, рейтинг и т.д.).
Инструкции по набивке - подробные инструкции, набор правил, шаблон набивки, файл со станд. значениями, в частности, списки наименований насел. пунктов дорев. России по губерниям, уездам и волостям.
База данных выпусков - список диапазонов страниц выпусков, посвященных конкретной губернии; это своего рода оглавление издания, в этом списке сейчас 7374 записи (реквизиты: выпуск, страницаОт, страницаПо, наличиеСкана, наличиеТекста, губерния), они охватывают практически полностью всю объединенную коллекцию РГБ+РНБ, т.е. все выпуски, месторасположение оригиналов которых на данный момент известно.

 

Состояние подпроекта. Набито 1555 страниц из имеющихся в виде сканов 15000 стр. Всего сейчас около 30 помощников, среди которых сравнит. активных - около десятка. Скорость набивки меняется значительно - от 3-5 дней на выпуск из 16 страниц для лучших помощников - до полугода и бесконечности для некоторыз штатских. Если принять за нормативный срок набивки 16-страничного выпуска две недели, требуется еще около 1800 человеко-недель. Поэтому нужны еще помощники.

 

ПРОСЬБА № 3. Нужны дбровольные помощники в набивке текста списка по высылаемым сканам

 

Заранее благодарен за отклик на любую из просьб,
с извинениями за слишком большое их число (сами мы не местные, отстали от поезда),
Борис Алексеев (abv)

Поделиться этим сообщением


Ссылка на сообщение
Поделиться на других сайтах

На ВГД этот проект действует давно. Может чем-то можем помочь Борису? Тут нужно больше умение работаь в Экселе

Поделиться этим сообщением


Ссылка на сообщение
Поделиться на других сайтах

Всем откликнувшимся большое спасибо! Проект практически завершен!
Пробная версия (в ней 120 тысяч записей) с 2007 года доступна по адресу http://history.h15.ru/db/db.php?table=%601...%F2%E5%F0%E8%60
Полный список в виде базы данных будет опубликован, примерно, в феврале или начале марта (это будет примерно 910 тысяч записей - тех, что уже набиты), а набиваемые выпуски будут добавляться туда по мере набивки). Общий объем составит чуть меньше 950 тысяч записей.

Поделиться этим сообщением


Ссылка на сообщение
Поделиться на других сайтах

Кстати, закинула удочку в Мичигане, насчет поиска недостающих списков. Обещали помочь посмотреть в их университете.

Поделиться этим сообщением


Ссылка на сообщение
Поделиться на других сайтах

Было бы здорово и даже отлично!

Поделиться этим сообщением


Ссылка на сообщение
Поделиться на других сайтах

Создайте аккаунт или авторизуйтесь, чтобы оставить комментарий

Комментарии могут оставлять только зарегистрированные пользователи

Создать аккаунт

Зарегистрировать новый аккаунт в нашем сообществе. Это несложно!

Зарегистрировать новый аккаунт

Войти

Есть аккаунт? Войти.

Войти

  • Недавно просматривали   0 пользователей

    Ни один зарегистрированный пользователь не просматривает эту страницу.

×

Важная информация

Пожалуйста, прочитайте Условия использования