ГоловнаЕкономікаБізнес

Як приватизували український тлумачний словник

Хоч сайт Slovnyk.net не входив до переліку найбільш популярних ресурсів українського інтернету, зате до числа найбільш корисних сайтів він належав напевно.

Словник є предметом першої необхідності не тільки для студентів
Фото: proza.ru
Словник є предметом першої необхідності не тільки для студентів

Що цілком зрозуміло – час від часу в кожного з нас виникає потреба подивитися в словнику правопис того чи іншого слова, приклади його вживання, парадигму (набір словозмінних форм) тощо. Slovnyk.net протягом чотирьох років свого існування був єдиним повноцінним лексикографічним сайтом в Україні. Так тривало до осені 2010 року.

А тоді в роботі сайту з’явилися дивні перебої: він то ставав недоступним, то знову з’являвся, щоб зрештою зникнути остаточно. На українських форумах, де обговорювали це питання, з’явилася інформація про те, що сайт хочуть закрити по суду, бо він начебто порушує чиїсь авторські права.

Що це було – остаточно з’ясувалося у грудні 2011 року. Тоді сайт slovnyk.net знову з’явився – але тепер з його доменного імені здійснювалася переадресація на зовсім іншу адресу, що належить компанії-виробнику програмного забезпечення Abbyy. А наведений там-таки коментар розставляв усі крапки над "і". Наведемо його повністю:

Шановний користувачу Slovnyk.net!

Протягом останнього року в роботі slovnyk.net відбувались перебої у зв’язку з кримінальною справою, порушеною за фактом незаконного використання в мережі інтернет Великого тлумачного словника сучасної української мови. Згідно з підписаною мировою угодою доменне ім’я "slovnyk.net" було передано компанії ABBYY.

Ми вирішили залишити Вам можливість вільного доступу до цього словника. Заходьте та використовуйте Великий тлумачний словник сучасної української мови і ще понад 50 безкоштовних словників. Додавайте свої слова та приклади перекладів. Обговорюйте варіанти перекладів та складності вивчення мов. Переглядайте сучасні приклади вживання слів та словосполучень в унікальній базі перекладів в реченнях з художньої та технічної літератури, законодавчих та юридичних документів, інтернет-сайтів.

Если в какой-либо достаточно большой стране отменят авторское право, то вертолеты Apache с "миротворцами" будут там гораздо быстрее, чем, если там начнут повально нарушать права человека

— Александр Ольшанский, президент холдинга Internet Invest Group

Відразу звертає на себе увагу те, що зі згадкою про "кримінальну справу" автори цієї заяви однозначно переборщили. Але менше з тим – набагато важливіше зрозуміти, що це за "Великий тлумачний словник української мови", і яким чином ця лексикографічна праця раптом стала уособлювати авторські права на слова української мови та їх тлумачення.

Про який саме словник ідеться, встановити неважко: це однотомний "Великий тлумачний словник української мови", надрукований видавництвом "Перун" у 2001 році та перевиданий у 2005 році.

Фактично відбулася приватизація української мови
Фото: ukurier.gov.ua
Фактично відбулася приватизація української мови

Софтверна компанія Abbyy, яка серед своїх продуктів має електронний словник Lingvo, придбала права на цей тлумачний словник. І коли виявила, що він же використовується на сайті slovnyk.net, подала позов, який зрештою завершився переходом ресурсу під її контроль. Так, сайт функціонує, але лише доти, доки Abbyy це дозволяє. При бажанні чи потребі закрити доступ до цього ресурсу можна за хвилину.

А тепер – найцікавіше. Насправді видавництво "Перун" та його директор, він же одноосібний редактор словника В'ячеслав Бусел, фактично продали Abbyy права на чужу роботу. Адже насправді "Великий тлумачний словник української мови" - це ніщо інше, ніж скопійований з незначними доповненнями 11-томний "Словник української мови". Цей словник, виданий в 1970-80-х роках, створили лінгвісти Інституту української мови Академії наук УРСР. А вже за незалежної України їхня монументальна праця послужила основою для словників-"новоробів", які копіювали матеріал СУМу фактично без змін.

Той самий словник
Той самий словник

І якщо називати речі своїми іменами, то Abbyy придбала вкрадений матеріал. А потім змогла довести в суді своє право одноосібно користуватися вкраденим. У тому, що це саме так, може переконатися будь-хто: достатньо взяти до рук СУМ або будь-який "похідний" від нього словник і порівняти першу-ліпшу словникову статтю з тією, яку видасть slovnyk.net на запит цього слова. Збіг буде стовідсотковим. Єдине виключення – нові слова (неологізми), яких у СУМі не було. Але їх кількість незначна. Абсолютна більшість словникового реєстру банально списана з СУМу.

Сталося так, що автор цієї статті абсолютно точно знає, звідки "єсть пішли" всі українські великі тлумачні словники, опубліковані за часів незалежності. Наприкінці 1990-х років хтось із старших колег-викладачів приніс на кафедру філфаку університету Шевченка цікаву новину: 11-томний СУМ відскановано, текст розпізнано, і зараз його вичитують на предмет неминучих при подібній процедурі помилок. До цієї роботи долучалися аспіранти та навіть студенти, кожному з яких вручалася пачка роздрукованих аркушів, на яких треба було знайти помилки, а потім внести виправлення у текстовий файл, що додавався до роздруківки.

Праця важка, але її й близько не можна порівняти з тими титанічними зусиллями, які свого часу пішли на укладання СУМу і про які розповідали ті ж таки старші колеги. Тоді ж бо все робилося вручну: укладання реєстру, визначення кількості значень слів, пошук прикладів тощо. А десять років тому завдяки прогресу комп’ютерної техніки все відбувалося значно простіше – кілька місяців праці двох-трьох фахівців та підпорядкованих їм "чорноробів", і вуаля - у вас повна електронна копія найбільшого українського словника.

А з цим файлом вже можна було іти до першого-ліпшого видавництва і пропонувати їм унікальний продукт - новий тлумачний словник української мови. І кого обходить, що насправді цей «новий» словник – це все той же старий 11-томний СУМ? Академія наук ледь животіла, масштабні лексикографічні проекти ніхто не фінансував, про перевидання СУМу мова не йшла, але при цьому в країні існував високий попит на «великий» словник. Є попит – є і пропозиція.

"Першою ластівкою" подібної технології став "Новий великий тлумачний словник української мови" В. Яременка та О.Сліпушко. В академічних колах його поява спричинила скандал: як же так, ви ж взяли наш СУМ, старі статті у вас із нашими ілюстраціями, до нових ви взагалі ілюстрацій не підбирали – що ж це таке? Втім, пригадуючи ту ситуацію, слід зауважити, що від такого "творчого списування" було більше користі, ніж шкоди: дуже вже великою була потреба в новому словнику, а Академія наук на той час могла хіба бідкатися на адресу більш активних колег: ні зробити щось нове, ні перевидати "старе", ні навіть захистити власні авторські права ці люди не могли, та й не дуже хотіли.

Однак коли в 2001 році "творче списування" СУМу повторилося вдруге – саме з тим словником під редакцією В. Бусела, права на який згодом придбала компанія Abbyy, лінгвісти з Академії наук не змовчали і влаштували новоявленому "лексикографу" показове шмагання просто на презентації цього видання (більш детально про цей скандал можна прочитати в цій статті у "Дзеркалі тижня". ).

Так, директор Інституту української мови НАН України В.Німчук у своєму виступі повідомив, що працівники Інституту української мови здійснили експертний аналіз презентованого словника, і наведені в ньому тлумачення слів повністю збігаються з тлумаченнями, поданими у виданому в 70—80-ті роки одинадцятитомному словнику української мови. Єдина відмінність — відсутність ілюстративного матеріалу, тобто прикладів.

У відповідь на це пан Бусел почав досить-таки недолуго виправдовуватися, що "тлумачення однакові, бо в мові всі слова однакові", і взагалі, словник отримав схвальну рецензію в акадамічних "верхах", а отже – з ним усе гаразд.

Однак таке ліберальне ставлення до чужих прав зовсім не завадило директору та редактору згодом продати на "творчо скопійований" словник компанії Abbyy. А та, в свою чергу, натисла на юридичні важелі, щоб припинити "незаконне використання" словника, який з’явився на світ шляхом копіювання чужої праці.

Сучасний процес копіювання книжок
Фото: elarobot.ru
Сучасний процес копіювання книжок

І тепер виникає цікава ситуація. Насправді "перунівський" словник – не єдиний, укладений за принципом "відскануй СУМ і надрукуй як своє". Але тепер, схоже, такі словники також можуть потрапити під санкції: адже відмінностей із "перунівським" там практично нема, бо всі здирали з одного першоджерела. Тобто, якщо завтра інший сайт зробить онлайн-словник на основі іншої копії СУМу, Abbyy зможе і в цьому випадку довести порушення власних прав.

Ба більше – навіть якби лінгвісти Академії наук довели, що насправді це Abbyy порушує їхні авторські права, використовуючи "крадений" словник (хоча шанси на подібний розвиток подій дорівнюють нулю), це мало б точно такі ж наслідки, бо "справжні" автори точно так само продали б права, як це зробили "самозванц".

Ситуація, що склалася на цей момент, - це ситуація глухого кута. Існуючий лексикографічний спадок радянської науки фактично приватизовано, і будь-які спроби розвивати словникові проекти на цій базі можуть бути елементарно заблоковані новими правовласниками.

Що робити в цій ситуації? Схоже, що найкращим виходом з цього глухого кута була б поява цілком нового лексикографічного проекту. Причому від самого початку він має розроблятися за принципами General Public License та Creative Commons – вільного ліцензування, що дозволяє будь-кому безперешкодно використовувати та розповсюджувати кінцевий інформаційний продукт.

При цьому реєстр словника (власне перелік слів) можна запозичити і в словників, "похідних" від СУМу: на щастя, авторське право на словниковий склад мови нікому не належить. Зрозуміло, що реєстр доведеться поповнити неологізмами та запозиченнями, і що не завадить почистити "старий" реєстр від русизмів, які свого часу потрапили до СУМу не так з лінгвістичних, як з ідеологічних міркувань.

Найскладніша частина завдання – це пошук ілюстрацій до слів, тобто, прикладів їх вживання в художніх чи публіцистичних текстах. Однак зараз із цим завданням впоратися набагато легше, ніж десять років тому, а порівняно з 1970-ми роками це простіше на порядки. Більше того, в Україні є проекти із створення корпусу текстів сучасної української мови (інша справа, чи можна буде скористатися цим доробком для створення "вільного" словника). Схоже, що починати варто було б із укладання потужної онлайн-бібліотеки україномовних книжок. Україномовні бібліотеки в інтернеті є, як і тексти українською на "російських" бібліотечних сайтах, однак всі ці ресурси є розрізненими, а здалося б їх об’єднати "під спільним дахом". Після цього пошук ілюстрацій до слів з реєстру словника буде тривіальним: програмним способом такі завдання вирішуються елементарно.

Зрозуміло, що в цього проекту має бути фахове лінгвістичне "ядро": на голому ентузіазмі, без професійних знань, таке завдання вирішити неможливо. Втім, будь-який авторитетний виш міг би "потягнути" подібну координацію. Під такий проект знайшлися б і грантові кошти, і не бракувало б охочих підтримати його приватними пожертвами. При цьому колективне фінансування стало б додатковою гарантією того, що "ближче коло" не підпаде під спокусу "монетизації" результатів цієї роботи.

Як би там не було, наразі це єдиний шлях до створення в Україні справді нового, а не переписаного чи вкраденого тлумачного словника. Альтернатива – купувати "творчо списані" з СУМу словники, або сподіватися, що Abbyy не прикриє завтра slovnyk.net остаточно.

PS Вперше ця стаття була розміщена на сайті Texty.org.ua.

Сергій Лук'янчук, журналіст, філолог, викладач української мови
Читайте головні новини LB.ua в соціальних мережах Facebook, Twitter і Telegram