Замахнулся на «святое»?

Сказав «А», буду «ползти» до «Я», но - «доползу»!

 

Дорогие пользователи!

Пару месяцев назад приобрел DVD-диски известнейших баз партий, и уже потирал руки от предвкушения пользования ими для успешной заочной игры. Своя супербаза, собираемая и пестуемая около 10 лет, у меня была (7,3 миллиона партий), однако, скомпилированная из десятков источников, с именами в ней был такой хаос, что имя того же Корчного в ней писалось четырьмя вариантами.


Но…

Начали появляться вопросы, на которые рождались ответы, неудобные для производителя. Может, эти мои заметки и вызовут неудовольствие фирмы-производителя продуктов «Chessbase», если, конечно, попадутся им в переведенном виде. Однако – «Сократ мне друг, но истина дороже». Что же меня не устроило?

Ответ – не очевидный, но самая главная претензия одна: ОБОИМИ этими базами НЕЛЬЗЯ всерьез пользоваться для подготовки к серьезным турнирам. Чтоб изучить творчество конкретного соперника – это почти пожалуйста (термин «почти» расшифрую ниже), а вот сгенерировать с помощью этих баз две дебютные книги, оценкам которых можно доверять (а такие суперкниги дебютов уже висят на торрент-трекерах!) – я бы категорически не рекомендовал. Причина – в обоих базах полным-полно (по моим оценочным прикидкам – не менее 30-35%) партий крайне слабых любителей, с рейтингом от 400 до 1600 единиц, взятых составителями базы с какого-либо школьного первенства Индонезии, либо, условно говоря, девичьего чемпионата категории до 10 лет не особо шахматного Марокко. Что может нам продемонстрировать это, с позволения сказать, творчество юных и не очень любителей? Ну уж если и не зевки фигур в дебюте, хотя и такое возможно, но в любом случае – не напряженный, мягко скажем, полет дебютной мысли. ТАКИЕ ПАРТИИ ДЛЯ ПОСТРОЕНИЯ ДЕБЮТНОЙ КНИГИ НЕ НУЖНЫ, ПОТОМУ КАК ОНИ ВСЕРЬЕЗ СМАЖУТ СТАТИСТИКУ ЛЮБОГО ВАРИАНТА – И ТАКОЙ КНИГОЙ БУДЕТ ПОЛЬЗОВАТЬСЯ ПРОСТО ОПАСНО!

Расшифрую, как обещал, смысл и вышесказанного «почти пожалуйста». Я столкнулся с безобразным фактом – фамилии шахматистов в обоих базах, как и в моей личной самопальной базе, пишутся по-разному! От 2-х – до 5-ти вариантов написаний! И если вы наберете в поисковике, к примеру, «Rich…», вы рискуете никогда не увидеть имя того же игрока в транслитерации «Rych…». Кроме того, и это особенно неприятно для тех, кто платит за эти продукты приличные деньги, в базах полным-полно дублей! Нет, не партий, но – имен! Вот, неверующие могут любоваться или проверить сами:


 

Понятно, что это – не три разных человека, а один, поданный под тремя «соусами» написания в базе троекратно.

Очевидно, что составители баз допустили в этом плане небрежности, могли бы нанять десяток студентов, раскидав между ними буквы латиницы, и под руководством опытного шахматного куратора исправить эти дефекты.

Кроме того, в базе очных партий полным-полно (что-то около 20 тысяч) игр с …нулевым количеством ходов, где в швейцарках играл «Bye», их, конечно, тоже не мешало бы с базы вовремя убрать.

Также не понравилось то, что для того, чтобы познакомиться в полном объеме с творчеством конкретного шахматиста, надо рыскать по обоим этим базам. Ведь десятки тысяч шахматистов, в том числе ну очень известных, баловались не просто игрой по переписке, но и до сих пор играют заочно на сервере ИКЧФ. Пример, который напрашивается – Вячеслав Рагозин, хотя есть не столь громкие имена….

Но… Что есть – то есть, однако в результате приходит на ум единственное решение – объединить обе этих супербазы вместе и самостоятельно эти шероховатости устранить. С тем, чтобы потом, «на выходе», получить как ДОСТОВЕРНУЮ дебютную книгу, так и навести вручную (вместо так и не нанятых фирмой-производителем студентов) порядок с именами.

Слил обе базы в одну, на выходе, как и предполагал, получил ожидаемый результат, можно любоваться:

Понятно, что тот же Рагозин сыграл 711 партий за доской и 37 – по переписке. Однако в ряде случаев, что было уже приятно, имена, не отличавшиеся по транслитерации в обоих базах, в единой - слились в одну.

Но для формирования полноценной единой супербазы, а на ее основе – единой дебютной суперкниги - которые, как представляется, не будут иметь аналогов, я уже предпринял следующие шаги:

А. Удалены результаты с «шахматистом» «Bye».

Б. Удалены все партии, завершившиеся вничью до 7-го хода, Такие гроссмейстерские ничьи, может, и исказят на выходе статистику тех или иных шахматистов, однако дебютная книга будет информативнее и достовернее.

В. Удалены все партии шахматистов с рейтингом ниже 2100 единиц, и здесь пришлось попотеть, так как приходилось учитывать тот факт, что система ЭЛО введена сравнительно недавно, так что ни Петросян, ни Таль, творившие в 70-е годы и не имевшие рейтинга, не «пострадали». При этом, путем визуального просмотра вручную (!) оставлены все партии безрейтинговых шахматистов, ИГРАВШИХ по переписке или под никами на серверах, ведь отсутствие в подобных случаях рейтинга вовсе не означает, что игрок играет слабо, или что под ником не скрывается мастер или гросс. Здесь, согласитесь, лучше все же недобдеть, чем перебдеть - и отсечь десятки тысяч вполне приличных для дебютной теории партий.

Г. Отдельный вопрос – компьютерное творчество. При решении этого вопроса я исходил из той логичной аксиомы, что ЛЮБОЙ движок, за небольшими исключениями, играет практически уж никак не менее силы обозначенного мною рейтинга 2100 – и поэтому компьютерные партии в мою единую базу будут мною включены, все они пока идет работа, болтаются в моей имеющейся старой мегабазе. Причем могу обрадовать, что ВСЕ блиц-партии движков мною ИСКЛЮЧЕНЫ, оставлены лишь те, что шли с контролем от 30 минут на партию и выше. Таковых – порядка 1,8 миллионов (а вообще на сайтах, с учетом 1- и 3-минуток, «оптом» можно накачать около 5-ти миллионов).

Д. Партии вслепую (тот же Амбер-турнир) и блиц-партии «белковых» шахматистов в единой базе оставлены. Понятно, что в миттельшпиле в подобных случаях ведущие шахматисты могут не блистать, но уж дебют, в любом случае, поставят солидно и в полную силу.

Исходя из желания иметь ЕДИНУЮ мегабазу, свободную от «косяков», я и приступил, как тот студент, к работе. Уже «почищена» буква «А», ползу по букве «В». По моим прикидкам, «ползти» мне еще несколько месяцев, так как на сегодня в объединенной мною базе – около 300000 имен, из которых, исходя из того, как я часто щелкаю по клавиатуре, клонов по именам – не менее 50-70 тысяч. Рабочий процесс несколько замедляется тем, что в процессе «чистки» я «раскидываю» сколько-нибудь значимые имена по личным именным базам сыгранных ими партий, по двум папкам – «завершили карьеру» и «продолжают играть». Более конкретного и умного определения папок мне подобрать не удалось, так как перестать играть можно в силу разных причин, увы, хотя бы той же смерти.

Можно посмотреть, например, что уже получилось с буквой «А»:

 

ЗАВЕРШИЛИ КАРЬЕРУ


ПРОДОЛЖАЮТ КАРЬЕРУ


В этих папках - базы упомянутых шахматистов в формате CBH, в том числе в разделе «завершили карьеру» - дебютные книги таких шахматистов (до 25-го хода). Кто-то ушел из них в мир иной сотни лет назад, кто-то – недавно, и пусть эти книги будут им своеобразным памятником… Ну а кто-то просто действительно просто перестал играть в шахматы, но, слава Богу, жив. Тем, кто еще играет, книги, конечно, «рисовать» не нужно, их базы партий мною просто ежегодно будут пополняться! На выходе ожидаю объединенную супербазу размером те же 7 миллионов партий. И это действительно будет Union Megabase.

Не знаю, есть ли у меня в этом плане предшественники, и выполнил ли уже кто-либо ранее, до меня, столь необходимую и кропотливую работу. Но если кому интересно обсудить эту тему – могут написать мне по адресу ogn63@yandex.ru.


Геннадий ОБУХОВ

Вернуться на главную страницу

 


Последнее обновление 20.10.13 18-00