Перейти к публикации

Беседка


Рекомендованные сообщения

Добрый день, коллеги
В списках есть вычеркнутые фамилии. Как поступаете в таких случаях? Если зачеркнуты так, что уже нечитаемые.

Ссылка на комментарий
Поделиться на других сайтах

Я бы, наверное, внёс информацию и в доп. сведениях (примечании) указал о том, что фамилия вычеркнута. Это - если всё читабельно!
Если прочитать невозможно - то и вносить нечего :pardon:

Ссылка на комментарий
Поделиться на других сайтах

Залита очередная "порция" (+7 140 строк) из "Разведчика". В базе 1 063 791 запись.

 


Текущая ревизия по этому журналу такова...

 

1) Из всех номеров за 1914-1917 годы (с №1243 по №1414) у нас отсутствуют сканы только №1252.

 

2) Подготовлены операторами в формате Excel все с №1243 по №1377, кроме №№ 1255, 1292, 1293, 1374, 1375.
(Причём ими были объёдинены в единые файлы данные из номеров 1309+1310, 1322+1323, 1324+1325, 1334+1335+1336. В базе сейчас нету записей с номерами журналов 1310, 1323, 1325, 1335 и 1336. Я не проверял пока что, ошибка ли это операторов при объединённом заполнении файлов или в этих номерах реально нет данных о потерях! Вероятна ситуация, что ставили первый номера журналов из пары - надо смотреть.)

 

3) Из подготовленных операторами не залиты пока что в базу №№ 1291, 1294, 1295, 1356.

 


Николай, я немного структуру на Я.Диске поменял. Все вновь присылаемые операторами номера бросайте в папку "Разведчик" (для новых, незалитых в базу, номеров). По мере заливки я их оттуда буду перемещать в основную папку... А то уже путаюсь :blush::wacko:

Ссылка на комментарий
Поделиться на других сайтах

...
Николай, я немного структуру на Я.Диске поменял. Все вновь присылаемые операторами номера бросайте в папку "Разведчик" (для новых, незалитых в базу, номеров). По мере заливки я их оттуда буду перемещать в основную папку... А то уже путаюсь :blush::wacko:

Денис, понял, принято.
Ссылка на комментарий
Поделиться на других сайтах

Получено принципиальное согласие от Шеврон с сайта История Уральского (Яицкого) казачьего войска и Уральской области на использование (дублирование) в нашей базе информации о потерях, которую он будет размещать в теме Списки потерь уральских казаков в 1-й Мировой войне. Источник - Уральские Войсковые Ведомости. В дополнение к полям, представленным в "наших" списках потерь, там есть данные о месте службы, обстоятельствах ранения/смерти и т.д.

 

Николай, я Ваш e-mail ему оставил.
Договоренность, пока что такая: мы можем брать его инф-ю, но ссылку давать на указанную тему форума. Пока там её очень мало, так что торопиться нет смысла. Потом переведём в формат нашего шаблона и зальём в базу.
Склонить его к полноценному участию в качестве волонтёра пока не удалось :)

Ссылка на комментарий
Поделиться на других сайтах

Хорошо.

Ссылка на комментарий
Поделиться на других сайтах

В связи с обнаружением иностранных коллег, которые плотно пользуют базу, сейчас прорабатывается идея создания мультиязычной оболочки.
Хранение и поиск информации будет, как и прежде, вестись на русском, но для иностранных посетителей будет производиться машинный перевод результатов поиска.
Сейчас прорабатывается вопрос, как лучше выдавать результаты. Есть два пути: транскрипция (перевод произношения) или транслитерация (перевод написания). После размышлений над путями решения был сделан вывод, что нельзя убирать исходный русский текст. Потому сейчас на обсуждение выношу два варианта вывода (на примере польского языка):

 

Как основной я рассматриваю запись вида
«Яшнискин Алексей [Jaszniskin Aloksiej]»,
как альтернативный — вида
«Яшнискин Алексей (šniskin Aleksej [Jaszniskin Aloksiej])».

 

Ваши мнения?

Ссылка на комментарий
Поделиться на других сайтах

У нас в базе уже есть разновариантные фамилии, т.е. там, где альтернативный вариант указан в круглых скобках.

 

Поэтому предлагаю либо в отдельный стобец/поле, либо хотя бы чётко в квадратные скобки+выделение (цветом, например)

 

Яшнискин (Яшонискин) [šniskin (šoniskin) / Jaszniskin (Jaszoniskin)]

 

И ещё... Не думаю, что вывод данных в такой форме нужно делать основным. Только опционально, "по требованию"

Ссылка на комментарий
Поделиться на других сайтах

Друзья, коллеги, команда, сочувствующие!
Как же до Вас всех достучаться? Рассылку что ли какую-нибудь придумать для всех участников, раз уж мало кто отслеживает оперативно ситуацию по проекту?
Но нам, действительно, необходимо знать мнения максимально возможного кол-ва человек, а то варимся тут, практически, в собственном соку.
Опросы внутри форума не помогают (в последнем, по переименованию, всего 16 человек поучаствовало :(). Прям хоть делай страницу "Новости проекта" в интерфейсе поиска и обращайся ко всем посетителям/пользователям...

 

На текущий момент, хотелось бы услышать Ваши мысли о том, что мы сейчас с Андреем можем улучшить в базе данных: в механизме поиска по ней, в самом интерфейсе, быть может, как-то облегчить работу набивающих сведения и т.д.? Что Вы считаете наиболее актуальным и необходимым?

 

Первое предложение от Андрея - сделать сайт многоязычным, т.е. предоставить возможность работы с базой для иностранцев на своём родном языке: перевести все отображаемые на страницах тексты, перевести справочные данные (вероисповедания, звания и т.д.), выводить результаты поиска в транслитерированном/транскрипизированном виде (не "Иванов", а "Ivanov" для англоязычных, например)...

Ссылка на комментарий
Поделиться на других сайтах

Как минимум, предлагаю добавить в базу данных и в окно поиска код или наименование источника данных.
Если это понравится, можно и чуть дальше пойти - развести источники разной структуры по разным таблицам, объединяя их черех окно поиска.
Если и это покажется не бессмысленным, можно и еще чуть дальше пойти - добавить еще таблиц, которые будут содержать не фактические данные, а будут хранить структуры разных источников. Тогда таблицы с данными должны будут "плясать под дудку" этих структурных таблиц.
При наличии интереса в этом направлении, можно будет высказать и другие мысли в том же духе.

 

Многоязычность мне кажется менее существенной. Если ее реализовывать, то, естесственно, перевод (хоть транслитерацию, хоть транскрипцию) лучше делать "на лету" при выводе результата выборки, на клиентской стороне, с учетом языка броузера пользователя, а не хранить в самой базе.

Ссылка на комментарий
Поделиться на других сайтах

Да, вопрос добавление "типа" источника данных ("Списки потерь", "журнал 'Разведчик' и т.д.) в форму расширенного поиска уже назрел. В базе эта информация есть и в результаты поиска выводится. Её нет только в наборе префильтров.
Спасибо, Борис Васильевич, что озвучили и напомнили.

 

Что касается изменения структуры базы и подстраивания её под источники, то мы решили не идти этим путём. Во-первых, он противоречит сами принципам формирования реляционных баз данных, а во-вторых, мы такое явно не потянем нашими человеческими ресурсами. Т.е. будем подстраивать информацию из источников под существующую структуру БД, а не наоборот.

Ссылка на комментарий
Поделиться на других сайтах

Моё субъективное мнение, что рассылка будет работать эффективнее, чем обращение к участникам посредством форума.

 

А по облегчению/улучшению работы набивщиков у меня есть другое, опять таки субъективное, мнение. Вот не хватает мне веб-интерфейса по он-лайн набивке данных. Сейчас у меня в работе список приблизительно на 11 000 строк. Затем эти тысячи имён будут "допиливаться" перед "заливкой" в базу - по сути это увеличение времени и трудозатрат, как минимум, вдвое. На сайте Родная Вятка (который упоминался уже на форуме) похожие действия (набивка списка населенных мест) делаются именно через "веб-морду". Каждый авторизованный участник вкладывается насколько может, кто-то внес уже сотни НП, другие несколько десятков. Количество он-лайн внесённых данных за день/неделю вряд ли будет составлять тысячи строк, что позволит быстрее их проверить и, в случае необходимости, исправить и оперативно "залить". Я так думаю, да.

Ссылка на комментарий
Поделиться на других сайтах

...Затем эти тысячи имён будут "допиливаться" перед "заливкой" в базу - по сути это увеличение времени и трудозатрат, как минимум, вдвое...

В "допиливании", тем не менее, есть и положительный момент. Какой-то процент ошибок я перехватываю и в базу они не попадают ;)

 


Создание web-формы для ввода, в принципе, витающая в воздухе идея. Но её надо реализовывать хорошо. А это, как минимум:
- авторизация пользователей
- устаканившаяся и отточенная структура базы данных
- разработка механизма дублированного ввода одной и той же информации разными операторами, автоматизированной её дальнейшей обработки для случаев безошибочного ввода и ручного разрешения ситуации в обратных случаях

 

Всё это, конечно, сделать можно, но, ИМХО, довольно трудоёмко. Пока что "в планах" :pardon:

Ссылка на комментарий
Поделиться на других сайтах

Залиты сведения из Тульских губернских ведомостей (5 021 запись, включая 25 из отдельного списка дезертиров)

 

В базе 1 068 811 записей.

Ссылка на комментарий
Поделиться на других сайтах

Есть у кого-нибудь возможность "прошерстить" каталог РГБ в связи с этой темой - РГБ составляет списки литературы для оцифровки, поучаствуйте в составлении списков?

 

У нас в базе отсутствуют ссылки на сканы для следующих выпусков:
83-100, 121-140, 241-260, 390-395, 397-400, 404, 406-408, 421, 423-425, 427-431, 434-436, 438-440, 602,
1088-1101, 1103-1119, 1121-1150, 1152, 1221-1230, 1914-1915,
2586-2608, 2610, 2621-2623, 2625-2627, 2629-2643, 2645-2680, 2685, 2687-2696

 

Так же у нас вообще не обработаны из-за отсутствия выпуски:
857, 872, 976, 1231-1235, 1369-1913, 1916-2585, 2611-2620, 2697 и далее

Ссылка на комментарий
Поделиться на других сайтах

В каталоге есть № 601-620 (1915) С.9601-9920. Отсутствующий № 602 отсюда или я может не так чего-то понимаю?

Ссылка на комментарий
Поделиться на других сайтах

Похоже все верно. Листаю каталог, вижу многие списки, коих у нас нет.

 

18. № 241-260. - [1914]. - С. 3841-4160
21. № 421-440. - [1915]. - С. 6721-7040
32. № 601-620. - [1915]. - С. 9601-9920
№ 861-880. - [1914]. - С. 13761-14080
№ 961-980. - [1914]. - С. 15361-15680
39. № 1201-1230. - [1915]. - С. 19201-19680

Ссылка на комментарий
Поделиться на других сайтах

№ 241-260. - [1914]. - С. 3841-4160
241-260

 

№ 421-440. - [1915]. - С. 6721-7040
421-440

 

№ 601-620. - [1915]. - С. 9601-9920
Этот список уже давно был размещен на РГБ, и нами задействован. В нем отсутствует список 602.

 

№ 861-880. - [1914]. - С. 13761-14080
Также давно известен и задействован нами в проекте.

 

№ 961-980. - [1914]. - С. 15361-15680
Как и предыдущий - давно известен и задействован нами в проекте.

 

№ 1201-1230. - [1915]. - С. 19201-19680
Как и предыдущий - давно известен и задействован.

 

------------
ИТОГО:
Денис - надо бы теперь увязать данные БД со списками РГБ №№ 241-260 и 421-440.
Надо, стало быть, почаще нам сюда заглядывать.

Ссылка на комментарий
Поделиться на других сайтах

Денис, с учётом вышеизложенного, убираю из папки на Я-диске "Сканы списков, отсутствующих на сайте РГБ"
папки под эти списки:
- 241-260
и
- 421-440,
как имеющиеся теперь на РГБ в свободном доступе.
Себе в папку на всякий случай их сканы закачал.

Ссылка на комментарий
Поделиться на других сайтах

Денис, с учётом вышеизложенного, убираю из папки на Я-диске "Сканы списков, отсутствующих на сайте РГБ"
...

Что-то убрать не получилось (наверное, изменил там что-либо?) - может сам?
Ссылка на комментарий
Поделиться на других сайтах

Есть у кого-нибудь возможность "прошерстить" каталог РГБ в связи с этой темой - РГБ составляет списки литературы для оцифровки, поучаствуйте в составлении списков?

 

У нас в базе отсутствуют ссылки на сканы для следующих выпусков:
83-100, 121-140, 241-260, 390-395, 397-400, 404, 406-408, 421, 423-425, 427-431, 434-436, 438-440, 602,
1088-1101, 1103-1119, 1121-1150, 1152, 1221-1230, 1914-1915,
2586-2608, 2610, 2621-2623, 2625-2627, 2629-2643, 2645-2680, 2685, 2687-2696

 

Так же у нас вообще не обработаны из-за отсутствия выпуски:
857, 872, 976, 1231-1235, 1369-1913, 1916-2585, 2611-2620, 2697 и далее


Каталог "перешерстил" весь - только два новых списка: 241-260 и 421-440 - ссылки выше дал, себе в архив сохранил,
в соответствующей теме ссылки добавил.
Ссылка на комментарий
Поделиться на других сайтах

Николай, я выписала 861-880, потому что в списке недостающих Денис приводит 872. Значит 872 реально отсутствует?
В 961-980, недостающий 976 отсутствует?
Глянула 1201-1230. Вижу 1221, 1222... Денис указывает, что 1221-1230 отсутствуют ссылки на сканы.

Ссылка на комментарий
Поделиться на других сайтах

Николай, я выписала 861-880, потому что в списке недостающих Денис приводит 872. Значит 872 реально отсутствует?
В 961-980, недостающий 976 отсутствует?
Глянула 1201-1230. Вижу 1221, 1222... Денис указывает, что 1221-1230 отсутствуют ссылки на сканы.

1201 - 1230 - давно на РГБ есть, у нас присутствует.
К сожалению, сами файлы с пакетом списком не всегда полноценно содержат списки по номерам, иногда там, в файлах, бывают пропуски одного или нескольких списков.
Периодически я сверяю заполняемость файлов списками - на данный момент пока изменений, кроме двух указанных выше файлов со списками, нет.
Но в указанном здесь по ссылке, списки
№1221. Волынская, Воронежская, Вятская и Екатеринославская губ.
№1222. Вятская, Екатеринославская, Киевская и Курская губ.
№1223. Киевская , Курская, Минская, Могилевская и Нижегородская губ.
№1224. Минская, Могилевская, Нижегородская и Оренбургская губ.
№1225. Пермская, Подольская, Полтавская и Рязанская губ.
№1226. Полтавская, Рязанская, Самарская и Саратовская губ.
№1227. Самарская, Саратовская, Смоленская, Тамбовская и Тобольская губ.
№1228. Саратовская, Смоленская, Тамбовская, Тобольская и Томская губ.
№1229. Томская, Тульская, Уфимская и Харьковская губ.
№1230. Тульская, Уфимская, Харьковская и Херсонская губ.

 

давно имеются.
Поэтому, не знаю, что имел ввиду Денис - они давно доступны.
Кстати, Денис имел ввиду вот эти списки: 1231-1235 - они действительно отсутствуют в свободном доступе, но в РГБ они есть.

Ссылка на комментарий
Поделиться на других сайтах

Присоединяйтесь к обсуждению

Вы можете опубликовать сообщение сейчас, а зарегистрироваться позже. Если у вас есть аккаунт, войдите в него для написания от своего имени.

Гость
Ответить в теме...

×   Вставлено в виде отформатированного текста.   Вставить в виде обычного текста

  Разрешено не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.

 Поделиться

  • Сейчас на странице   0 пользователей

    • Нет пользователей, просматривающих эту страницу.
×
×
  • Создать...

Важная информация

Пожалуйста, прочитайте Условия использования