IPB

Здравствуйте, гость ( Вход | Регистрация )

3 страниц V  < 1 2 3 >  
Ответить в данную темуНачать новую тему
> Работа над ошибками. Выверка географии
АндрейХ
сообщение 20.3.2015, 14:10
Сообщение #21





Группа: Члены СВРТ
Сообщений: 604
Регистрация: 13.2.2013
Пользователь №: 18716



Цитата(a-KaDeMi-k @ 20.3.2015, 13:26) *
Цитата(АндрейХ @ 20.3.2015, 10:56) *
Все населённые пункты пишем в названиях на даты войны.

Именно так указано в описании нашего справочника. Любое иное поведение может стать причиной серьёзных ошибок — не делайте этого!

Применительно к указанному случаю надо писать «д. Сиваш (Лихачева)».


О каких ошибках речь? Наоборот, мы нивелируем ошибки пользователя, когда он (по незнанию) вводит современное название населённого пункта.
Ввёл "Первомайский", а ему в результат данные по Лихачево. Но он же сразу видит, что Первомайский - это альтернативное наименование.

Другой вариант, что во время ПМВ существовало где-то другое Первомайское. Ну так ничего страшного! У него будет либо другие губерния/уезд/волость, либо тоже альтернативное (современное) название. Получит пользователь чуть больше данных для анализа. Не меньше же!

К тому же, я совсем не исключаю варианта, что даже тогда - в период ПМВ - один и тот же н.п. разные люди называли по-разному. Так что нам, только официальные названия заводить что ли?

Всё равно эта задача - определение соответствия между старыми и текущими названиями - перед нами когда-нибудь встанет. Так зачем второй раз перелопачивать всё АТД потом, если это можно сделать сейчас.
Если уж так принципиально отделить современное наименование от бывшего - давай его в отдельный столбец бить или в какие-нибудь квадратные скобки. Но это - лишнее, по-моему.


.

Если очень хочется делать соответствия между старым и новым названиями — я не мешаю, НО смешивать их нельзя.
Пользователя предупредили, что все названия — старые. Если он этого не понял, это его проблемы…
Хуже будет, если он это понял и ожидает адекватной реакции системы, а в ответ получает совсем иной результат. Первомайское, да, будет одно и перепутать его будет сложно (т.к. до ПМВ не было первого мая).

Но как быть с реальным примером из моих поисков, когда на расстоянии пяти километров есть два населённых пункта: один в те времена назывался с.Берёзово и сейчас называется д.Березово (и находится при этом уже в другом районе), а второй тогда назывался Печерниковские выселки, а ныне называется с.Берёзово?

Если исследователь плохо разбирается в географии своего места, получив два разных с.Берёзова из одного и того же уезда одной и той же волости он получит проблему идентификации. Более того, резко повысится вероятность ошибок в его исследовании, т.к. населённые пункты расположены близко и в них много однофамильцев.

И я уверен, что подобных примеров, будет предостаточно…

Как я уже говорил, любая поисковая система — это тонкий баланс между полнотой и точностью. Так вот в данном случае, желая увеличить полноту поиска, ты оказываешь исследователям «медвежью услугу», т.к. серьёзно снижаешь точность поиска и усложняешь восприятие результатов.

.

Сообщение отредактировал Николай Чернухин (Энич) - 20.3.2015, 14:46
Перейти в начало страницы
 
+Цитировать сообщение
Николай Чернухин...
сообщение 20.3.2015, 14:49
Сообщение #22


Руководитель проекта


Группа: Пользователи
Сообщений: 7085
Регистрация: 29.3.2008
Из: Александровское Ставропольского края
Пользователь №: 5346



Цитата(АндрейХ @ 20.3.2015, 14:10) *
...

Андрей, при переносе сообщения убрал две строки из твоего сообщения, как утратившие актуальность в связи с переносом сообщений в данную тему (вместо них поставил по одной точке).
Или отредактируй твой ответ Денису сам, тогда я уберу своё это сообщение.
Перейти в начало страницы
 
+Цитировать сообщение
Nadezhda-Vus
сообщение 20.3.2015, 14:58
Сообщение #23





Группа: Пользователи
Сообщений: 21
Регистрация: 1.6.2013
Из: Харьков
Пользователь №: 19193



[Спасибо, буду работать.
Ивиниите за распросы. Просто хочется все сделать правильно
Перейти в начало страницы
 
+Цитировать сообщение
АндрейХ
сообщение 20.3.2015, 15:15
Сообщение #24





Группа: Члены СВРТ
Сообщений: 604
Регистрация: 13.2.2013
Пользователь №: 18716



Цитата(Николай Чернухин (Энич) @ 20.3.2015, 14:49) *
Цитата(АндрейХ @ 20.3.2015, 14:10) *
...

Андрей, при переносе сообщения убрал две строки из твоего сообщения, как утратившие актуальность в связи с переносом сообщений в данную тему (вместо них поставил по одной точке).
Или отредактируй твой ответ Денису сам, тогда я уберу своё это сообщение.

Годится.

Цитата(Nadezhda-Vus @ 20.3.2015, 14:58) *
[Спасибо, буду работать.
Ивиниите за распросы. Просто хочется все сделать правильно

Зря извиняетесь — очень правильные вопросы. Они вскрыли потенциальную назревающую проблему. Без этих вопросов могло быть только хуже.

Так что Вы очень правильно делаете, что задаёте их тут — так мы совместными усилиями сделаем самую удобную и полезную поисковую систему в мире по ПМВ!

А потом у меня в планах завоевать и остальной мир…
Перейти в начало страницы
 
+Цитировать сообщение
a-KaDeMi-k
сообщение 20.3.2015, 15:17
Сообщение #25





Группа: Пользователи
Сообщений: 733
Регистрация: 24.9.2013
Пользователь №: 19547



Надежда, извинения не принимаются! Ибо не за что извиняться. (IMG:http://forum.svrt.ru/style_emoticons/default/smile.gif)

Система у нас ещё неустоявшаяся. Правки в неё саму и в технологию работы с нею мы вносим регулярно. Поэтому часть вопросов приходится решать по ходу возникновения.

По сути проблемы:
Вводите современные названия в отдельный столбец. Лишней эта информация, несмотря на пример, приведённый Андреем, не будет.
А мы потом решим, как с ней работать.
Перейти в начало страницы
 
+Цитировать сообщение
ИринаФМ
сообщение 20.3.2015, 17:49
Сообщение #26





Группа: Главные администраторы
Сообщений: 8974
Регистрация: 24.9.2006
Из: Москва
Пользователь №: 10



А у меня тогда вопрос с посадами...
На период ПМВ по СНМ они получаются так:
тип нас. пункта - посад, название Павловский. Сейчас: город Павловский Посад.
со вторым еще хуже... он в списках и посад Троицкий, и посад Сергиев, и посад Троице-Сергиев. Сейчас город Сергиев Посад.
Т.е. мне писать Павловский и Сергиев, а посад - в тип выносить?
Перейти в начало страницы
 
+Цитировать сообщение
a-KaDeMi-k
сообщение 20.3.2015, 18:00
Сообщение #27





Группа: Пользователи
Сообщений: 733
Регистрация: 24.9.2013
Пользователь №: 19547



тип н.п. - посад
название - Павловский
современное название - Павловский Посад

тип н.п. - посад
название - Троице-Сергиев (Троицкий, Сергиев)
современное название - Сергиев Посад
Перейти в начало страницы
 
+Цитировать сообщение
АндрейХ
сообщение 20.3.2015, 22:59
Сообщение #28





Группа: Члены СВРТ
Сообщений: 604
Регистрация: 13.2.2013
Пользователь №: 18716



Согласен.

В названии пишем сначала основное (наиболее известное/употребляемое (?)), а в скобках (при желании и наличии) — альтернативные версии
Перейти в начало страницы
 
+Цитировать сообщение
Aratka
сообщение 1.10.2015, 7:36
Сообщение #29





Группа: Пользователи
Сообщений: 20
Регистрация: 15.3.2015
Из: Дзержинск Нижегородской
Пользователь №: 21340



Нашел ошибки по нескольким волостям Сергачского у. Нижегородской губ.
Перейти в начало страницы
 
+Цитировать сообщение
a-KaDeMi-k
сообщение 1.10.2015, 8:39
Сообщение #30





Группа: Пользователи
Сообщений: 733
Регистрация: 24.9.2013
Пользователь №: 19547



Волости пока что не выверялись, к сожалению. Эту работу надо проводить комплексно - править ошибки сразу по всем записям губернии или хотя бы уезда.
Для единичных правок наших ресурсов не хватает.

Если Вы готовы обработать всю губернию или уезд, я могу подготовить Вам файл с уникальными географическими названиями, встречающимися в базе по выбранной Вами территории.
Перейти в начало страницы
 
+Цитировать сообщение
Aratka
сообщение 1.10.2015, 17:15
Сообщение #31





Группа: Пользователи
Сообщений: 20
Регистрация: 15.3.2015
Из: Дзержинск Нижегородской
Пользователь №: 21340



Цитата(a-KaDeMi-k @ 1.10.2015, 8:39) *
Волости пока что не выверялись, к сожалению. Эту работу надо проводить комплексно - править ошибки сразу по всем записям губернии или хотя бы уезда.
Для единичных правок наших ресурсов не хватает.

Если Вы готовы обработать всю губернию или уезд, я могу подготовить Вам файл с уникальными географическими названиями, встречающимися в базе по выбранной Вами территории.


Ошибки не только в написании волостей , но и населенных пунктов.
Я готов попробовать обработать Сергачский у. Нижегородской губ.
Перейти в начало страницы
 
+Цитировать сообщение
a-KaDeMi-k
сообщение 1.10.2015, 22:45
Сообщение #32





Группа: Пользователи
Сообщений: 733
Регистрация: 24.9.2013
Пользователь №: 19547



Цитата(Aratka @ 1.10.2015, 17:15) *
Я готов попробовать обработать Сергачский у. Нижегородской губ.
Файл сделал. Можете попробовать. Только, пожалуйста, во-первых, прочитайте все сообщения данной темы, и, во-вторых, если у Вас останутся или позже, в процессе, возникнут вопросы или сомнения - обязательно их озвучивайте!
В данном случае, лучше перестраховаться, чем потом что-то переделывать (Вам или мне).


АТД - Нижегородская губерния Сергачский уезд.xlsx


Перейти в начало страницы
 
+Цитировать сообщение
Aratka
сообщение 3.10.2015, 5:52
Сообщение #33





Группа: Пользователи
Сообщений: 20
Регистрация: 15.3.2015
Из: Дзержинск Нижегородской
Пользователь №: 21340



Цитата(a-KaDeMi-k @ 1.10.2015, 22:45) *
Цитата(Aratka @ 1.10.2015, 17:15) *
Я готов попробовать обработать Сергачский у. Нижегородской губ.
Файл сделал. Можете попробовать. Только, пожалуйста, во-первых, прочитайте все сообщения данной темы, и, во-вторых, если у Вас останутся или позже, в процессе, возникнут вопросы или сомнения - обязательно их озвучивайте!
В данном случае, лучше перестраховаться, чем потом что-то переделывать (Вам или мне).


АТД - Нижегородская губерния Сергачский уезд.xlsx


Начал обработку.Возникнут вопросы - озвучу.
Перейти в начало страницы
 
+Цитировать сообщение
Aratka
сообщение 3.10.2015, 8:39
Сообщение #34





Группа: Пользователи
Сообщений: 20
Регистрация: 15.3.2015
Из: Дзержинск Нижегородской
Пользователь №: 21340



Цитата(Aratka @ 3.10.2015, 5:52) *
Цитата(a-KaDeMi-k @ 1.10.2015, 22:45) *
Цитата(Aratka @ 1.10.2015, 17:15) *
Я готов попробовать обработать Сергачский у. Нижегородской губ.
Файл сделал. Можете попробовать. Только, пожалуйста, во-первых, прочитайте все сообщения данной темы, и, во-вторых, если у Вас останутся или позже, в процессе, возникнут вопросы или сомнения - обязательно их озвучивайте!
В данном случае, лучше перестраховаться, чем потом что-то переделывать (Вам или мне).


АТД - Нижегородская губерния Сергачский уезд.xlsx


Начал обработку.Возникнут вопросы - озвучу.


При предварительном просмотре обнаружил ,что в Сергачском у. Глуховской волости и с.(д) Глухово - нет (есть в Ардатовском и Макарьевском у.) Как быть?
Перейти в начало страницы
 
+Цитировать сообщение
a-KaDeMi-k
сообщение 3.10.2015, 11:53
Сообщение #35





Группа: Пользователи
Сообщений: 733
Регистрация: 24.9.2013
Пользователь №: 19547



К сожалению, в данный момент у нас нет доступа к скану первоисточника - списку №2691.

Можно предположить, что оператор ошибочно ввёл название уезда с соседней записи и исправить по ней. Но, увы, на странице №43048 кроме нескольких строк о Макарьевском уезде встречается и одна единственная об Ардатовском.

С другой стороны, в базе по Нижегородской губернии встречается ещё Голованков Алексей (id 457147; заведён как "Голованнов", но, скорее всего, всё таки на скане "нк", а не "нн"). Он - из Макарьевского уезда Глуховской волости.

Поэтому я предлагаю всё таки в поле "Уезд (исправленный)" записать "Макарьевский уезд", в поле "Волость (исправленная)" - "Глуховская волость" и т.д. В поле "Примечание" добавить пояснение "Изначально введено в Сергачский уезд. Требуется дополнительная проверка!"


В других аналогичных случаях, когда даже косвенно непонятно, к какому уезду/волости относить населённый пункт, думаю, надо писать в соответствующие столбцы строку "(ошибка определения)"

Можно послушать, что скажут про данную ситуацию другие коллеги. Николай!? Андрей!?
Перейти в начало страницы
 
+Цитировать сообщение
Николай Чернухин...
сообщение 3.10.2015, 17:57
Сообщение #36


Руководитель проекта


Группа: Пользователи
Сообщений: 7085
Регистрация: 29.3.2008
Из: Александровское Ставропольского края
Пользователь №: 5346



Цитата(a-KaDeMi-k @ 3.10.2015, 11:53) *
...
Можно послушать, что скажут про данную ситуацию другие коллеги. Николай!? Андрей!?

Честно говоря, однозначного мнения у меня лично нет.
А твоё мне кажется вполне себе логичным.
Может Ирина что дельного скажет.
Перейти в начало страницы
 
+Цитировать сообщение
Aratka
сообщение 3.10.2015, 20:47
Сообщение #37





Группа: Пользователи
Сообщений: 20
Регистрация: 15.3.2015
Из: Дзержинск Нижегородской
Пользователь №: 21340



Цитата(a-KaDeMi-k @ 3.10.2015, 11:53) *
К сожалению, в данный момент у нас нет доступа к скану первоисточника - списку №2691.

Можно предположить, что оператор ошибочно ввёл название уезда с соседней записи и исправить по ней. Но, увы, на странице №43048 кроме нескольких строк о Макарьевском уезде встречается и одна единственная об Ардатовском.

С другой стороны, в базе по Нижегородской губернии встречается ещё Голованков Алексей (id 457147; заведён как "Голованнов", но, скорее всего, всё таки на скане "нк", а не "нн"). Он - из Макарьевского уезда Глуховской волости.

Поэтому я предлагаю всё таки в поле "Уезд (исправленный)" записать "Макарьевский уезд", в поле "Волость (исправленная)" - "Глуховская волость" и т.д. В поле "Примечание" добавить пояснение "Изначально введено в Сергачский уезд. Требуется дополнительная проверка!"


В других аналогичных случаях, когда даже косвенно непонятно, к какому уезду/волости относить населённый пункт, думаю, надо писать в соответствующие столбцы строку "(ошибка определения)"

Можно послушать, что скажут про данную ситуацию другие коллеги. Николай!? Андрей!?


Такие ошибки нужно выносить вниз списка каждого уезда.Проще найти и обработать.
Перейти в начало страницы
 
+Цитировать сообщение
a-KaDeMi-k
сообщение 3.10.2015, 23:03
Сообщение #38





Группа: Пользователи
Сообщений: 733
Регистрация: 24.9.2013
Пользователь №: 19547



Понятие "низ" и "верх" в базах данных (коей является и наша) отсутствует (IMG:style_emoticons/default/smile.gif)

Их можно печатать внизу (или вверху) в результатах поиска, на странице статистики, в файле для выверки географии... Вы про что писали?

В поиске, если ищут по Макарьевскому уезду, мой вариант обнаружится; если по Ардатовскому - нет. Если же завести "(ошибка определения)", то запись попадёт в результаты поиска только при вводе строки "Глуховская" или той же самой "(ошибка определения)".

В статистике все ошибки выводятся первыми, чтобы пользователь видел и знал, что таковые в базе присутствуют.

В файле по АТД выверяемые записи отсортированы по алфавиту. ИМХО, так проще обрабатывать.
Перейти в начало страницы
 
+Цитировать сообщение
Aratka
сообщение 11.10.2015, 10:09
Сообщение #39





Группа: Пользователи
Сообщений: 20
Регистрация: 15.3.2015
Из: Дзержинск Нижегородской
Пользователь №: 21340



Здравствуйте! При работе по Сергачскому у. столкнулся с проблемой; некоторые населенные пункты числились в разных волостях -Ново Молчаново(Молчаново) Зверевская -Итмановская; Н. Девичьи Горы- Юрьевкая - Покровская. И таких много.Пытался разобраться через АТД 1917-1929 гг., но там все очень запутано.Чтобы разобраться, потребуется время.
Перейти в начало страницы
 
+Цитировать сообщение
a-KaDeMi-k
сообщение 11.10.2015, 21:21
Сообщение #40





Группа: Пользователи
Сообщений: 733
Регистрация: 24.9.2013
Пользователь №: 19547



Aratka, да, это не та задача, которая решается с наскока. Но наш проект не однодневный. Время есть. Главное, чтобы терпения хватило (IMG:style_emoticons/default/wink.gif)
Перейти в начало страницы
 
+Цитировать сообщение

3 страниц V  < 1 2 3 >
Ответить в данную темуНачать новую тему
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 



Текстовая версия Сейчас: 20.8.2017, 18:15