Лапо Лапин
Авторката на криминални романи Камила Лекберг отдавна е преследвана от слухове, че се ползва от услугите на писатели в сянка. Лапо Лапин решава да проучи въпроса посредством методите на стилометрията, статистически анализ на данни, изследващ индивидуалния почерк на всеки писател. Резултатът е красноречив и сочи друг прочут шведски писател като истинския автор на някои от книгите ѝ.
Пресаташето на Лекберг Паулина Л. Бонге оспорва резултата от анализа: „35 милиона продадени книги говорят сами за себе си”.
Вглеждам се продължително в цветните точици на екрана. Компютърната програма е анализирала всички книги на Камила Лекберг и резултатите не оставят никакво съмнение.
Стилът на два от романите ѝ ̶ „Безмилостни жени” и „Истината или се осмеляваш” ̶ се различава малко от този на останалите ѝ книги. Според анализа са писани от друг, а това на свой ред означава, че Лекберг работи съвместно с писатели в сянка.
Сам по себе си този резултат е забележителен, но анализът на програмата не свършва дотук, защото с голяма степен на вероятност посочва и кой е истинският автор на „Безмилостни жени”.
Стилометрия
Представете си един ден в пощенската ви кутия да се появи дебела купчина листове. Вземате я, разгръщате я и виждате, че страниците са запълнени от изрязани и повторно залепени думи от вестници. Нищо в ръкописа не сочи кой би могъл да е автор на текста ̶ няма думи, написани на ръка, пръстови отпечатъци или адрес за връщане.
Можем ли въпреки това да разберем кой стои зад текста? Краткият отговор е „да”.
Или поне това схващане стои в основата на развитието на науката стилометрия, която се занимава с изследване на стила и езика на авторите. Начинът ни на писане ̶ какви думи използваме и как ги подреждаме ̶ е също толкова неповторим и уникален, колкото и пръстовите ни отпечатъци.
Но макар учените да са постигнали забележителен напредък в сферата, сред широката общественост стилометрията все още е сравнително непозната.
Една от първите засвидетелствани употреби на методите на стилометрията била във връзка с поредица от 85 политически статии, известни под общото название The Federalist Papers[1] и публикувани през 1788 в броеве на различни нюйоркски вестници под псевдонима Публий. Зад това анонимно име се криели тримата бащи основатели Джон Джей, Джеймс Мадисън и Александър Хамилтън. Впоследствие станало ясно кой коя статия е написал. Единствено за авторството на дванайсет от статиите предявили претенции и Джеймс Мадисън, и Александър Хамилтън. След като озадачавала историците в продължение на поколения, загадката била разрешена едва през 1963 от американските професори Фредерик Мостелер и Дейвид Уолъс.
Двамата обаче не били историци, а статистици и подходили към проблема със средствата на статистиката. Методът им се основавал на това да разберат до чий стил на писане се доближават повече статиите с неуточнен автор. За тази цел Мостелер и Уолъс изчислили с каква честота писалият статиите е използвал някои избрани функционални думи, като while, upon и whatever, думи, които хората употребяват почти несъзнателно. След това проверили колко често се срещат тези привидно незначителни думи в статии с потвърдено авторство. Накрая съпоставили двата резултата и стигнали до единственото възможно решение на загадката: Джеймс Мадисън бил авторът на всички дванайсет статии.
През шейсетте години на миналия век стилометричните изследвания се извършвали единствено чрез бавно и трудоемко смятане на ръка. За целите на проучването си Мостелер и Уолъс трябвало да изрежат една по една думите от статиите и да ги сортират по азбучен ред. „Докато траеше всичко това, една по-дълбока въздишка можеше да завихри буря от конфети и да ти създаде враг за цял живот”, впоследствие пише дуото учени. Процесът на изследването отнел общо три години.
Благодарение на дигитализацията за един такъв анализ днес са нужни не повече от няколко секунди. Стилометричните програми вече са достъпни за сваляне и използване от широката общественост и захранени с достатъчно данни, само за секунди могат да анализират милиони различни фактори и да извършат сложни и комплексни изчисления. А методите на стилометрията се считат за толкова достоверни, че полицията и службите за сигурност си служат с тях при разкриване на извършители.
„Стайло“ идентифицира писателите в сянка
След известно търсене се спирам на една такава стилометрична програма, „Стайло”, разработена от трима световно признати учени в областта, Мачей Едер, Майк Кестемонт и Ян Рибицки. Програмата ме печели и с това, че именно с нейна помощ е разгадана загадката за самоличността на автора под псевдонима Елена Феранте. (Анализът на стила и езика еднозначно сочи към професора по лингвистика от Неапол, Доменико Старноне.)
Започвам да търся шведска литературна загадка, върху която да тествам метода, и случайно попадам на интригуващия роман „Писателят в сянка” (2021) от Хокан Линдгрен. Един от протагонистите в книгата е кралицата на криминалните романи Мили Монсон, която в хода на успешната си кариера спира да пише сама собствените си книги и делегира работата си на писател в сянка. Спокойно можем да кажем, че образът ѝ има известни сходства с една реално съществуваща кралица на криминални романи в Швеция, а именно Камила Лекберг, за която отдавна се носят слухове, че работи съвместно с писатели в сянка. Лекберг е задминала впечатляващия брой от 30 милиона продадени книги в световен мащаб и с това можем да предположим, че всяко ново заглавие ѝ носи завидни приходи.
Редакторката на Лекберг от издателство „Форум” опровергава слуховете със следния коментар пред „Те Те”[2]: „Камила хвърля много кръв, пот и сълзи в книгите си. Тя винаги е работила здраво и всъщност е един от най-трудолюбивите хора, които познавам”.
Доколкото ми е известно, досега в Швеция не е правен стилометричен анализ на книга заради подозрения за измама с авторството, но пък стилометрията е много подходяща за целта. Програмата „Стайло” изчислява кои са най-често използваните думи в един текст, после с помощта на статистически методи ги сравнява с най-често използваните думи в друг текст и накрая оформя резултата в точкова диаграма, на която разликата в стиловете на текстовете е изобразена графично посредством разстояние между точиците. Или казано по друг начин, колкото повече се различава езикът в две книги, толкова по-далече една от друга ще попаднат в диаграмата.
Решавам да тествам програмата със световноизвестната трилогия криминални романи на Стиг Ларшон „Милениум”, първи сред които е посмъртно излезлият „Мъжете, които мразеха жените”. Трите книги на Ларшон са последвани от втора трилогия, написана от друг прочут криминален автор, Давид Лагеркранс, а наскоро излезе и още едно продължение от Карин Смирноф. Ако вкараме тези седем книги в програмата „Стайло” и сравним 1000 най-често използвани думи във всяка от тях, ще получим следния резултат.
Макар да съпоставяме книги от същия жанр, даже от същата поредица, диаграмата показва видими различия в стила.
Само за да си поиграем с мисълта, можем да си представим, че в някоя паралелна вселена шведското издателство намира смяната на автора за твърде рискован ход от маркетингова гледна точка и затова решава да издаде и продълженията под името на Стиг Ларшон, като скалъпва някаква история за още шест ръкописа, намерени в прашен сандък на тавана му.
Дори обаче книгите да бяха излезли под едно и също име на корицата, пак щяхме да можем да различим три отделни стила на писане, а това на свой ред би следвало да ни подскаже, че зад поредицата стоят трима различни автори.
Ако Камила Лекберг работи съвместно с писатели в сянка, то би трябвало да открием нещо подобно и в нейните книги. Захранвам програмата с единайсетте романа от поредицата ѝ за Фелбака, за да сравня стила ѝ с този на петима други шведски криминални автори ̶ Лиса Марклунд, Ларш Кеплер, Софи Саренбрант, Давид Лагеркранс и Стиг Ларшон. Резултатът от анализа е красноречив: книгите на Лекберг се струпват на едно място в долния ляв ъгъл.
Използваният от програмата метод се нарича мултидименсионално измерване и представлява визуално изобразяване на отликите между различни обекти посредством диаграма.
Точковата диаграма показва ясно, че всички книги от поредицата за Фелбака имат сходен стил, а този резултат е достатъчен, за да обори хипотезата, че Лекберг е ползвала писатели в сянка за написването на най-известната си поредица.
За да разсея напълно съмненията около авторството на романите ѝ, въвеждам в програмата и останалите ѝ книги. През 2019 Камила Лекберг издава два кратки романа, „Безмилостни жени” и „Истината или се осмеляваш”, известни също като поредицата „Отмъщение”. Освен поотделно двата романа излизат и в общо книжно тяло, което се продава в над 100 000 копия. В същата година Лекберг започва и друга поредица, „Отмъщението на Фей”, от която досега са излезли книгите „Златната клетка” (2019) и „Сребърните криле” (2020). Когато захраня програмата и с тези четири книги обаче, се случва нещо различно.
В последната диаграма изведнъж резултатът се променя. Също както и в предния експеримент, романите от поредицата за Фелбака се струпват в концентриран син облак в единия край на диаграмата. Но нововъведените книги попадат встрани от прочутата ѝ поредица, а това на свой ред означава, че в тях програмата не разпознава характерния почерк на авторката. Романите за Фей, „Златната клетка” и „Сребърните криле”, имат сходен стил и попадат сравнително близо до поредицата за Фелбака. „Безмилостни жени” и „Истината или се осмеляваш”, от друга страна, се озовават в съвсем различни краища на диаграмата, и двете на голямо разстояние от характерния стил на Лекберг.
Възможно ли е този резултат да се дължи на факта, че най-често използваните думи са различни в различните поредици? Бих казал, че не, защото преди да въведа книгите в програмата, премахнах думите, които биха могли да изкривят резултата, защото по обясними причини се срещат само в конкретни книги ̶ като например имената на главните герои, мястото, където се развива действието, и т.н. Решаващото при анализа са малките думички, непретенциозните части на речта, които почти незабележимо се стрелкат пред очите ни, думи като „и”, „това”, „че”, „върху”, „в” (за да вземем най-често срещаните думи при Лекберг).
Възможен кандидат
Възможно ли е смяната на стила в тези четири книги на Лекберг да свидетелства за намесата на така одумвания ѝ писател в сянка? Намирам нейно интервю по темата за вестник „Афтонбладет”. В него интервюиращият я пита дали слуховете, че тайният ѝ писател в сянка бил Паскал Енгман, са верни. Енгман, бивш журналист във вестник „Експресен”, също се развива като успешен писател на криминална литература и става известен най-вече с поредицата си за полицейския инспектор Ванеса Франк. На въпроса Лекберг отговаря, че Енгман просто е бил редактор на книгите ѝ „и нищо повече от това”, твърдение, което впоследствие и самият Енгман потвърждава за вестника. На свой ред репортерът на „Афтонбладет” пита: „А работили ли сте с друг писател в сянка?”.
„Не, ха-ха. Потребността ми да контролирам всичко е твърде голяма, за да оставя работата си на друг”, гласи отговорът на Лекберг.
В „Златната клетка” тя благодари на Паскал Енгман, задето е „безумно надарен колега”, който „е изказвал ценното си мнение, когато е обсъждала с него героите в книгата”[3]. В продължението „Сребърните криле” Енгман отново получава благодарностите ѝ, този път като неин „приятел и колега”, чийто „принос при подхвърлянето на идеи е бил брилянтен и ангажиран”[7]. В „Безмилостни жени” Лекберг благодари на „свръхталантливия” Енгман, който е бил „голяма подкрепа и ценен съветник при написването на книгата”.
Може ли Паскал Енгман да е писателят в сянка, чието скришно присъствие прозира в последните романи на Лекберг? Въвеждам в „Стайло” дебютния роман на Енгман „Патриотите” (2017), както и петте книги от поредицата му за Ванеса Франк и задавам на програмата да ги сравни с романите на Камила Лекберг, Софи Саренбрант и Ларш Кеплер. Анализът се извършва на база 1000 най-често използвани думи във всяка книга.
След последния анализ романите на Паскал Енгман се подреждат по една относително права ос в долния край на диаграмата, съвсем близо до книгата на Камила Лекберг „Безмилостни жени”. Тоест според „Стайло” е по-вероятно книгата да е написана от Енгман, отколкото от Лекберг. Двата романа от поредицата „Отмъщението на Фей” попадат на сравнително равно отстояние от двамата автори, докато „Истината или се осмеляваш” се озовава в съвсем друга част от диаграмата, което сочи, че може би е дело на трети автор.
Докато подготвяме статията, Паскал Енгман ни изпраща имейл, в който пише, че е редактирал трите книги „Безмилостни жени”, „Златната клетка” и „Сребърните криле”, но нищо повече от това. Имейлът му продължава така: „Всички издатели на книги знаят, че ролята на редактора е да работи с текста по различни начини. За да сме наясно ̶ категорично се разграничавам от това, което се опитвате да намекнете”.
Проверявам резултата в програма за машинно обучение
За да се уверя в истинността на резултата, получен от „Стайло”, решавам да го проверя в друга програма за стилометрични изследвания, JGAAP[5]. Преди няколко години ученият, който я е разработил, американският професор по компютърни науки, Патрик Юола, предизвика фурор по целия свят, когато с помощта на самообучаващата се програма JGAAP успя да разгадае кой се крие зад псевдонима Робърт Галбрейт, автор на нашумелия криминален роман „Зовът на кукувицата” (2013). Оказа се, че зад книгата стои добре познатото ни име на Дж. К. Роулинг, автор на успешната поредица за Хари Потър.
Затова искам да проверя дали JGAAP ще потвърди резултата, който получих от „Стайло”.
Въвеждам в програмата четиресет книги на осем от най-продаваните автори на криминални романи в страната: Камила Лекберг (използвам поредицата ѝ за Фелбака), Софи Саренбрант, Давид Лагеркранс, Стиг Ларшон, Ларш Кеплер, Лиса Марклунд, Паскал Енгман и Денис Рюдберг.
Първата ми работа е да проверя достоверността на резултатите на JGAAP. Тази програма извършва анализите си въз основа на различни параметри. Не просто сравнява най-често използваните думи в отделните книги, но съпоставя и най-често повтарящите се последователности от думи, най-обичайните последователности от знаци, средната дължина на думите, средната дължина на фразите, най-рядко използваните думи и т.н.
Избирам всяка от четиресетте книги поотделно и карам програмата да познае автора ѝ, като сравни най-често срещаните думи в нея с тези от останалите книги, които съм вкарал в софтуера. Резултатът е 40 от 40 успешни опита. С други думи, програмата различава с голяма точност стиловете на отделните автори.
После вкарвам в програмата и останалите четири книги на Камила Лекберг, „Безмилостни жени”, „Истината или се осмеляваш”, „Златната клетка” и „Сребърните криле”, и ѝ задавам да отгатне кой от вече познатите ѝ осем автори е написал тези книги.
С най-голяма степен на сигурност програмата посочва автора на краткия роман „Безмилостни жени” и според нея той не е Камила Лекберг, а Паскал Енгман. Анализът се извършва не просто въз основа на най-често срещаните думи, но и на останалите параметри, които програмата може да измерва. И всички те еднозначно сочат, че книгата е написана от Енгман.
Според измерването стилът на „Истината или се осмеляваш” се доближава най-много до почерка на Софи Саренбрант и Ларш Кеплер, по-малко до този на Паскал Енгман и едва на последно място до този на Лекберг. Това не означава, че някой от горепосочените е написал романа, а само че езикът в конкретната книга на Лекберг повече се доближава до техния стил на писане. Показателно е обаче, че по много от параметрите Лекберг се нарежда изненадващо надолу в класацията, а по някои дори и на последно място. Сборният резултат от всички показатели сочи, че зад „Истината или се осмеляваш” не стои нито Лекберг, нито Енгман, а трети писател.
Що се касае до „Златната клетка” и „Сребърните криле”, програмата счита Камила Лекберг за най-вероятния автор, но дори и тук наблюдаваме интересни резултати. И двете книги се доближават относително много до стила на Енгман, а според анализа на някои от параметрите даже е по-вероятно той да е написал „Сребърните криле”.
Резултатът от анализа на четирите книги на Лекберг с програмата JGAAP е както следва:
– „Безмилостни жени”, автор: Паскал Енгман.
– „Истината или се осмеляваш”, автор: неизвестен писател в сянка.
– „Златната клетка”, автор: с голяма вероятност Камила Лекберг, но романът се доближава и до стила на Паскал Енгман.
– „Сребърните криле”, автор: с голяма вероятност Камила Лекберг, но романът се доближава и до стила на Паскал Енгман.
Какво обаче означава, че „Златната клетка” и „Сребърните криле” се доближават значително до стила на Енгман, макар резултатът да посочва Лекберг като реалния автор? Начинът на писане на Енгман и Лекберг не са особено сходни, или поне не толкова, че програмата да ги обърка. JGAAP успява безпогрешно да определи авторството на всички останали книги на Лекберг. Сравнително малко вероятно е и писателката да е променила стила си в по-новите си романи, защото езикът в последната ѝ книга от поредицата за Фелбака, „Кукувичето”, излязла през 2022, еднозначно отговаря на характерния ѝ почерк.
Възможно обяснение би било, че по време на редакцията Енгман е оставил в текста следи от собствения си стил, които впоследствие са били уловени от програмата и са повлияли на анализа. Може би полученият резултат идва да ни подскаже, че в тези две книги Лекберг е работила по-тясно с редактора си и по тази причина езикът в тях се различава от този в поредицата ѝ за Фелбака. Това обаче е само предположение, което не може да бъде потвърдено от програмата.
По-смели заключения бихме могли да си извлечем от анализа на двете книги „Безмилостни жени” и „Истината или се осмеляваш”. В този случай резултатите от изследването еднозначно подкрепят теорията за писател в сянка. По отношение на „Безмилостни жени” JGAAP приписва авторството на Паскал Енгман. Що се касае до втората книга обаче, програмата не успява да намери достатъчно добро съвпадение сред въведените в софтуера осем писатели. А това навярно означава, че истинският автор е някой неизвестен писател в сянка.
Решавам да помоля Майк Кестемонт, професор по литература към Университета в Антверпен и един от разработчиците на „Стайло”, да оцени резултатите от проучването ми.
„Доколкото виждам, всички анализи сочат в една и съща посока, а това не е за подценяване”, отговаря ми той.
Уточнява, че това, разбира се, не доказва нищо, но и бърза да допълни, че: „С пълно основание можем да кажем, че резултатите ви по-скоро идват в подкрепа на теорията за писателя в сянка, отколкото на официалната позиция на издателството относно авторството на тези две книги”.
Питам го доколко е възможно Лекберг да е променила стила си на писане само в тези две конкретни книги. Отговорът на Кестемонт гласи: „Почеркът на един писател не може да се промени от днес за утре. Освен ако в живота на автора не се случи нещо чрезвичайно, което да може да оправдае подобна рязка промяна”.
Отказан ми е отговор
Накрая се опитвам да се свържа и със самата Камила Лекберг посредством пиар агенцията „Асефа Комюникейшън”, която се грижи за връзките ѝ с медиите. Двадесет и четири часа по-късно получавам есемес от пресаташето ѝ, Паулина Л. Бонге, който гласи:
„Имам преки наблюдения колко здраво работи Камила Лекберг над книгите си. Затова не възнамерявам да удостоя обвиненията Ви с отговор. 35 милиона продадени книги говорят сами за себе си.”
Еба Йостбери, главен редактор в издателство „Форум”, ми изпраща имейл, където пише, че „това, което се опитвам да намекна, е сериозно обвинение”.
„За съжаление, не съм запозната с методите на стилометрията и по тази причина не бих могла да коментирам анализа, който ми изпращате. От друга страна обаче, с радост мога да Ви уверя, че едно от многото силни качества на Камила Лекберг е способността ѝ непрекъснато да обновява стила си и да изпробва нови похвати на писане, нещо, което ние от издателство „Форум” винаги сме ценили високо. И точно заради това днес Лекберг заема едно почти уникално място на шведската и международната литературна сцена.”
В друг от имейлите си Йостбери пише, че издателство „Форум” работи с Камила Лекберг от близо двайсет години и за този период сътрудничеството им винаги се е основавало на доверие и професионализъм.
Превод от шведски: СТЕФКА КОЖУХАРОВА
Преводът е направен по:
https://kvartal.se/artiklar/ai-visar-de-har-romanerna-av-lackberg-ar-spokskrivna/
[1] Федералистките книжа (англ.). ̶ Б.пр.
[2] Съкратено от Tidningarnas Telegrambyrö AB, Нациоалната информационна агенция в Швеция, основана през 1921 г. ̶ Б.пр.
[3] Лекберг, К., Златната клетка, Колибри, София, 2019, превод Любомир Гиздов. ̶ Б.пр.
[4] Лекберг, К., Сребърните криле, Колибри, София, 2021, превод Любомир Гиздов. ̶ Б.пр.
[5] Java Graphical Authorship Attribution Programme. ̶ Б.пр.