IPB

Здравствуйте, гость ( Вход | Регистрация )

88 страниц V  « < 86 87 88  
Ответить в данную темуНачать новую тему
> Беседка, тема для текущих вопросов и обсуждений при работе над проектом
a-KaDeMi-k
сообщение 23.4.2017, 1:52
Сообщение #1741





Группа: Пользователи
Сообщений: 719
Регистрация: 24.9.2013
Пользователь №: 19547



В базу залиты данные из Иркутских губернских новостей:
- выборка за 1914 год - 787 записей
- выборка за 1915 год, часть 1 - 1075 записей
- выборка за 1915 год, часть 2 - 792 записи
- выборка за 1915 год, часть 3- 903 записи
Всего 3 557 записей.

На данный момент в базе содержится 1 311 391 запись.
Перейти в начало страницы
 
+Цитировать сообщение
a-KaDeMi-k
сообщение 23.4.2017, 2:29
Сообщение #1742





Группа: Пользователи
Сообщений: 719
Регистрация: 24.9.2013
Пользователь №: 19547



Обработано нашими волонтерами (т.е. информация набрана в промежуточные экселевские файлы, которые теперь ожидают предварительной корректрировки и нормализации с моей стороны и дальнейшей загрузки в базу):
1) Григоровские списки (Очень сложный источник в плане подготовки данных. Я бы даже предложил рассмотреть вариант отказа от его ввода в базу. Тем более, что он есть в обработанном в пригодном для индексации поисковиками виде на сайте Рогге. Но раз уж файлы набраны, усилия затрачены - буду нормализовывать)
- Воронежская кн. памяти - 3705+7954+74+519=12 252 записи
- Рязанская - 65+109+144+201=519 записей
2) Губернские новости
- Олонецкие - 780
3) Прочие источники
- Пленные Вятской губ. - 93+21=114 записей
- Балахнинцы - 149
- Архангелогородцы - 60
- 2-й список уч-ов ПМВ 195 г. - 719 (???)
4) Журнал Разведчик
- 1915 год - 196+293+161+433+315=1398
- 1916 год - 149
- (115-1916 гг.) - 21852 (???)

Итого: 37 992 записи.
В необходимости заливки 719+21852 я пока сомневаюсь - будем с Николаем Ивановичем обсуждать ещё. Так что "чистыми" - 15 421 выходит.

Есть ещё списки захоронений военнопленных с латиницей - 4101+316+1902=6319 записей. Их мы даже технически не готовы загружать в базу. Её надо для этого дорабатывать.
Перейти в начало страницы
 
+Цитировать сообщение
MrAnich
сообщение Вчера, 18:58
Сообщение #1743





Группа: Пользователи
Сообщений: 1149
Регистрация: 3.1.2016
Из: Александровское
Пользователь №: 22299



Цитата(a-KaDeMi-k @ 23.4.2017, 2:29) *
Обработано нашими волонтерами (т.е. информация набрана в промежуточные экселевские файлы, которые теперь ожидают предварительной корректрировки и нормализации с моей стороны и дальнейшей загрузки в базу):
1) Григоровские списки (Очень сложный источник в плане подготовки данных. Я бы даже предложил рассмотреть вариант отказа от его ввода в базу. Тем более, что он есть в обработанном в пригодном для индексации поисковиками виде на сайте Рогге. Но раз уж файлы набраны, усилия затрачены - буду нормализовывать)
- Воронежская кн. памяти - 3705+7954+74+519=12 252 записи
- Рязанская - 65+109+144+201=519 записей
...

Согласен.
Не лежала у меня душа к ним - долго с ними тянул, не пускал в раздачу.
Правда, перед людьми, которые их набивали, совестно.
Больше раздачу по ним делать не буду.
Простят ли за напрасно потраченное время?
Перейти в начало страницы
 
+Цитировать сообщение
MrAnich
сообщение Вчера, 19:08
Сообщение #1744





Группа: Пользователи
Сообщений: 1149
Регистрация: 3.1.2016
Из: Александровское
Пользователь №: 22299



Цитата(MrAnich @ 25.4.2017, 18:58) *
Цитата(a-KaDeMi-k @ 23.4.2017, 2:29) *
Обработано нашими волонтерами (т.е. информация набрана в промежуточные экселевские файлы, которые теперь ожидают предварительной корректрировки и ...
...

...

Как вариант, уже обработанные списки отсортировать в виде алфавита с указанием страниц на книгу Григорова
и разместить их на форуме в виде отдельной темы.
Перейти в начало страницы
 
+Цитировать сообщение
pensionerka52
сообщение Вчера, 19:11
Сообщение #1745





Группа: Пользователи
Сообщений: 35
Регистрация: 17.12.2012
Из: Армавир
Пользователь №: 18405



Простить-то мы простим, но и правда очень много сил этому отдано. Списки сложные для набора, неудобные. Мне вот пришлось тайм-аут взять, чтобы от них отойти.
Перейти в начало страницы
 
+Цитировать сообщение
Бибиков Валерий
сообщение Вчера, 20:10
Сообщение #1746





Группа: Правление
Сообщений: 13093
Регистрация: 21.9.2006
Из: Москва
Пользователь №: 5



Не понимаю, за что стыдно Николаю и труды людей были не напрасны. Делается благое дело, в адрес СВРТ приходят письма с благодарностью волонтерам за их труд. В любом случае, доступ к информации через базу СВРТ удобнее, чем в ином виде, пусть даже и размещенная в инете, не говорю уже о печатных источниках.
Перейти в начало страницы
 
+Цитировать сообщение
MrAnich
сообщение Вчера, 20:38
Сообщение #1747





Группа: Пользователи
Сообщений: 1149
Регистрация: 3.1.2016
Из: Александровское
Пользователь №: 22299



Цитата(Бибиков Валерий @ 25.4.2017, 20:10) *
Не понимаю, за что стыдно Николаю и труды людей были не напрасны. Делается благое дело, в адрес СВРТ приходят письма с благодарностью волонтерам за их труд. В любом случае, доступ к информации через базу СВРТ удобнее, чем в ином виде, пусть даже и размещенная в инете, не говорю уже о печатных источниках.

Ничего стыдного и постыдного в проекте нет - благое дело делаем.
Здесь совсем о другом сказано - что совестно перед участниками, если труд был напрасен.
На будущее надо выносить на обсуждение - есть смысл набивать те или иные списки или нет - с обязательным привлечением того же Дениса,
чтобы он давал оценку в свете набивки тех или иных списков их адаптации к БД.
Речь об этом - ответ на поставленный Денисом вопрос.
Перейти в начало страницы
 
+Цитировать сообщение
a-KaDeMi-k
сообщение Вчера, 23:34
Сообщение #1748





Группа: Пользователи
Сообщений: 719
Регистрация: 24.9.2013
Пользователь №: 19547



Цитата(MrAnich @ 25.4.2017, 19:08) *
Как вариант, уже обработанные списки отсортировать в виде алфавита с указанием страниц на книгу Григорова
и разместить их на форуме в виде отдельной темы.


Боюсь, я недостаточно ясно выразился.
ВСЁ, что уже набрано и Ольгой Алексеевной, и Василием Ивановичем, и Майей Владиславовной, и Татьяной Валерьевной, и другими нашими участниками проекта мы обязательно в конце концов зальём в базу! Прям вот следующей партией, планирую (IMG:style_emoticons/default/wink.gif)
Труд этот не пропадёт и он - не напрасный, т.к., хотя обсуждаемые списки и есть в открытом доступе, но, соглашусь с Валерием Владимировичем, получать информацию по ним всё ж удобнее через нашу базу.
Я просто хотел поднять вопрос о целесообразности обработки остальных книг Григорова, ещё не розданных в "набор". Мы, получается делаем повторную набивку после самого Григорова - ладно б удалось от него их в табличном экселевском виде получить, пусть и не в "нашем" формате. Перекомпоновали бы, "подрихтовали"... (IMG:style_emoticons/default/smile.gif)
Ну, вот Николай Иванович это и озвучил. Согласен, что их надо отодвинуть в конец очереди.


В целом же по вопросу отбора источников для обработки и дальнейшей заливки в базу могу сказать следующее... Только за себя, конечно.

Я рассматриваю наш проект как (пока еще) один из крупнейших в Рунете агрегаторов информации по участникам Первой мировой. Да, большую часть данных, которые мы предоставляем, пользователи могут обнаружить и на других сайтах. Но это, объективно, будет для них более трудоёмко и времязатратно. Поэтому я "за" то, чтобы мы продолжали (с разрешения правообладателей, конечно) дублировать у себя какие-то уже опубликованные списки. Тем более, что один из первейших принципов, которому мы всё это время придерживаемся, это указание на первоисточник в каждой(!) выданной в результате поиска строчке.

Но мы же, фактически, рекламируем их, авторов! Поэтому, мне кажется, имеем право на некоторое ответное действие?
Хотите, чтобы о Вас и Вашей работе узнало больше людей? Чтобы больше пользователей ею воспользовались? Мы можем разместить её результаты в нашей базе! И нам - не особо трудно, и Вам - приток посетителей по прямым ссылкам, и дело общее, благородное делаем. Только давайте, всё ж мы со своей стороны не будем тратить наши крайне ограниченные ресурсы на то, что Вы можете сделать за пару кликов мышкой! Присылайте табличку, а мы её доработаем и выложим в базу!

Что же касается информации, ранее ещё не опубликованной, неиндексированной (т.е. неприспособленной для обработки поисковыми сервисами типа Яндекса), то она представляет на порядок больший интерес!
Как списки потерь (pdf-файлы лежат в открытом доступе, но работать с ними без нашей базы невозможно), как информация, полученная лично нашими волонтерами при работе в архивах, как выложенные сканы Георгиевских кавалеров (их набирали не только мы, но сколько ж несоответствий выявилось в той обработке при сравнении с нашей!), "Губернские ведомости", "Разведчик" (тоже - источники открытые, а толку от них в плане поиска людей без нашей базы чуть больше нуля).

Поэтому такого типа источники, мне кажется, надо ставить в приоритете. А решение по первым (уже где-то опубликованным) принимать, ориентируясь на наличие ресурсов с нашей стороны, на трудоемкость набора и адаптации их под формат нашей базы, на их уникальность и количество, на готовность авторов к сотрудничеству.


Не знаю, что будет через год-два, когда в полном объёме заработает ЭЛАРовская база под эгидой Министерства обороны. Но сейчас мы - ОБД "Мемориал" по Первой мировой! Со всеми вытекающими отсюда обязательствами и преференциями. (IMG:style_emoticons/default/blush.gif)


Вот такие мысли... Очень бы хотелось почитать мнения остальных участников нашей команды!
Перейти в начало страницы
 
+Цитировать сообщение
MrAnich
сообщение Сегодня, 0:09
Сообщение #1749





Группа: Пользователи
Сообщений: 1149
Регистрация: 3.1.2016
Из: Александровское
Пользователь №: 22299



Цитата(a-KaDeMi-k @ 25.4.2017, 23:34) *
... Но сейчас мы - ОБД "Мемориал" по Первой мировой! Со всеми вытекающими отсюда обязательствами и преференциями. (IMG:style_emoticons/default/blush.gif)


Вот такие мысли... Очень бы хотелось почитать мнения остальных участников нашей команды!

Денис -
(IMG:http://liubavyshka.ru/_ph/114/2/603675831.png)
Лучше и не скажешь.
Перейти в начало страницы
 
+Цитировать сообщение
Бибиков Валерий
сообщение Сегодня, 0:46
Сообщение #1750





Группа: Правление
Сообщений: 13093
Регистрация: 21.9.2006
Из: Москва
Пользователь №: 5



Хотите, чтобы о Вас и Вашей работе узнало больше людей? Чтобы больше пользователей ею воспользовались? Мы можем разместить её результаты в нашей базе! И нам - не особо трудно, и Вам - приток посетителей по прямым ссылкам, и дело общее, благородное делаем. Только давайте, всё ж мы со своей стороны не будем тратить наши крайне ограниченные ресурсы на то, что Вы можете сделать за пару кликов мышкой! Присылайте табличку, а мы её доработаем и выложим в базу!

Полностью с этим согласен.

Что же касается информации, ранее ещё не опубликованной, неиндексированной (т.е. неприспособленной для обработки поисковыми сервисами типа Яндекса), то она представляет на порядок больший интерес!
Как списки потерь (pdf-файлы лежат в открытом доступе, но работать с ними без нашей базы невозможно), как информация, полученная лично нашими волонтерами при работе в архивах, как выложенные сканы Георгиевских кавалеров (их набирали не только мы, но сколько ж несоответствий выявилось в той обработке при сравнении с нашей!), "Губернские ведомости", "Разведчик" (тоже - источники открытые, а толку от них в плане поиска людей без нашей базы чуть больше нуля).
Поэтому такого типа источники, мне кажется, надо ставить в приоритете. А решение по первым (уже где-то опубликованным) принимать, ориентируясь на наличие ресурсов с нашей стороны, на трудоемкость набора и адаптации их под формат нашей базы, на их уникальность и количество, на готовность авторов к сотрудничеству.


Абсолютно верно.
Перейти в начало страницы
 
+Цитировать сообщение

88 страниц V  « < 86 87 88
Ответить в данную темуНачать новую тему
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 



Текстовая версия Сейчас: 26.4.2017, 18:45