Далечно четене

Популярни статии

бр. 11/2026

Натали М. Хюстън

 

Множеството технологични преобразования, настъпили през първите десетилетия на двадесет и първия век, доведоха до дълбоки и структуроопределящи изменения както в проблематиката и предметния обхват, така и в инструментариума и методологическите практики на хуманитарното научно изследване. В съвременната академична среда дори онези учени, които не възприемат собствените си изследователски методи или обекти като пряко свързани с дигиталните технологии, на практика неизбежно прибягват до електронни библиотечни каталози и референтни бази данни, до четене на първични или вторични източници посредством техните дигитални репрезентации, както и до съхраняване и организиране на част от личните си изследователски материали под формата на цифрови файлове.

Макар през последните години понятието „далечно четене“ в значителна степен да се асоциира предимно с компютърно подпомаган анализ, осъществяван върху обширни корпуси от текстуални данни, когато Франко Морети за пръв път въвежда този термин през 2000 г., той го употребява в по-широк сравнителноаналитичен смисъл. В първоначалната му концептуализация изразът обозначава сравнителни изследвания, които синтезират емпирични данни, извлечени от множество разнородни източници с цел да направят възможно разглеждането на литературната история в значително по-мащабна и системна перспектива.

По-нататъшната научна дейност на Морети, включително сътрудничеството му със Stanford Literary Lab, нарастващата достъпност на дигитализирани текстови корпуси, както и оформянето на интердисциплинарното направление, известно като „дигитални хуманитарни науки“, постепенно довеждат до съвременното разбиране за далечно четене като „компютърна обработка на текстова информация в дигитална форма“ или като „използване на цифрови инструменти за „прочитане“ на обширни текстови масиви“[1].

В рамките на този методологически подход, както отбелязва Морети, „дистанцията представлява условие за познание“, тъй като именно тя позволява на изследователя да насочи вниманието си към аналитични единици, които могат да бъдат или значително по-малки, или значително по-големи от самия текст: отделни художествени похвати, тематични структури, реторични тропи – или, напротив, по-обхватни жанрови формации и литературни системи.[2]

Когато през 2004 г. Google Library Project започва мащабното дигитално сканиране на фондовете на университетските библиотеки, а през 2008 г. е създадена HathiTrust Digital Library, възможностите за провеждане на мащабни литературоведски изследвания върху обширни текстови корпуси се разширяват в безпрецедентна степен, откривайки нови перспективи за количествен и сравнителен анализ на литературната история.

Едновременно с това както изследователите, така и обикновените интернет потребители постепенно свикват с практиката да търсят в цифров текст – от уебстраници до академични бази данни. Както отбелязва Тед Ъндърууд, алгоритмичното търсене през последните две десетилетия е било „незабележимо натурализирано“, което прикрива както технологичната сложност на самите процеси на търсене, така и влиянието на подреждането на резултатите според тяхната релевантност.[3] Текстовото търсене и цифровите архиви със свободен достъп значително разшириха видовете изследователски въпроси, които литературоведите могат да поставят, както на изключително мащабно, така и на много детайлно аналитично равнище.

Но макар тези процеси да направиха компютрите и дигитализацията изключително познати и широко използвани, интегрирането на компютърния анализ в хуманитарните науки се развива сравнително бавно и на моменти предизвиква изключително интензивни дискусии. Реторическата сила на израза „далечно четене“ се запазва отчасти благодарение на начина, по който Франко Морети го противопоставя на методите на „близкото“ четене (close reading), утвърдени в англо-американската литературна критика след появата на Нова критика. Морети твърди, че „проблемът на близкото четене (във всичките му проявления – от Новата критика до деконструкцията) е, че то неизбежно разчита на изключително ограничен канон –  човек инвестира толкова много в отделни текстове само ако смята, че наистина са значими много малко от тях“[4].

По този начин Морети свързва аргумента си за промяна на мащаба, в който се пише литературната история, с критика към литературния канон като прекомерно ограничителен. Той същевременно признава, че изследването на литературните форми и културните процеси в други мащаби предполага, че „между много малкото и много голямото самият текст изчезва“: следователно далечното четене изобщо не е същото нещо като четенето.[5]

Работата с изключително обширен корпус от текстове изисква нови видове аналитични процедури, както Морети отбелязва в по-късно изследване: „ние не правим същото нещо, само че хиляда пъти по-голямо; ние правим различно нещо. Новият мащаб променя нашето отношение към обекта, а всъщност променя и самия обект“[6]. Макар в традиционните литературоведски изследвания мотивите за подбор невинаги да се формулират изрично, учените неизбежно се съсредоточават върху определена селекция от текстове: текстове, избрани, защото онагледяват определени модели, жанрове или теми, защото са създадени при специфични исторически условия или защото принадлежат на определени автори.

Подборът и подготовката на текстове за компютърен анализ обаче изисква ясно и аргументирано обосноваване на множество решения, вземани на различни етапи от процеса. Както отбелязва Морети, „никой не пише корпуси; те не са „комуникативни събития“ – те изобщо не са събития, а изкуствени обекти, създадени от изследователя“[7]. Дори за онези учени, които разполагат със стабилна институционална подкрепа и значителни ресурси, възниква необходимостта да се вземе решение дали изследването ще се ограничи в рамките на вече дигитализирани материали – с техните неизбежни селекционни пристрастия и технологични ограничения – или пък ще бъдат вложени значително време, финансови средства и човешки труд в дигитализирането на други текстове.

Като променя мащаба, в който текстовете се анализират – независимо дали чрез разчленяването на един текст до равнището на отделните части на речта, или чрез проследяването на развитието на жанрове в продължение на десетилетия – далечното четене трансформира самия обект на изследване и съответно разширява видовете въпроси, които могат да бъдат поставяни.

Може да се проследят интелектуалните корени на далечното четене в области като историята на книгата, социологията и лингвистиката, които поставят широки исторически въпроси относно литературата и отговарят на тях чрез изследвания на извадки от социални или текстуални доказателства. Приемането на експериментален подход предполага ясно разграничаване между различните етапи в производството на научно знание: формулиране на изследователски въпрос, изграждане на хипотеза, подбор на подходящи данни, провеждане на анализа и формулиране на аргумент относно значимостта на получените резултати. Важно е, че тази експериментална методология разграничaва конструирането на извадката от процеса на историческо извеждане на заключения. Разграниченията между тези етапи често остават само подразбиращи се в литературната критика. Експерименталният подход предлага метод, чрез който конкуриращи се наблюдения и заключения могат да бъдат проверявани и отхвърляни, което, от своя страна, противоречи на традиционния акцент върху дебата и субективната интерпретация в литературните изследвания.

В статистиката моделът представлява високо равнище, глобално описание на даден набор от данни, което идентифицира неговите съществени характеристики и ги използва или за обобщаване и описание на данните (т.нар. описателно моделиране), или за формулиране на хипотези относно процесите на разпределение, които са породили тези данни (т.нар. генеративно моделиране), или като основа за извличане на знание от данните с цел прогнозиране на характеристики на други точки от данни (т.нар. прогнозиращо моделиране).

Един модел може да бъде разбран като „обща схема“ или шаблон, който представя както компонентите на информацията (например особености на текстове, изображения, числа и др.), така и отношенията между тях. Целта на анализа определя избора на модел, който от своя страна насочва подбора на конкретните характеристики на данните.

Например библиотечният каталог може да бъде разглеждан като модел за представяне на книгите, които се намират по рафтовете на библиотеката. Повечето каталози на библиотеки за общо заемане представят всяка книга чрез нейната библиографска информация –  например името на автора, заглавието на книгата, годината на издаване, както и името и местоположението на издателя. По този начин каталогът може да генерира различни обобщени описания на библиотечния фонд. Една и съща колекция например може да бъде описана като съдържаща 500 книги, книги от 200 различни автори, книги, публикувани между 1705 и 1999 г., или книги, издадени в Лондон, Ню Йорк и Париж.

Един малко по-сложен описателен модел би анализирал как тези различни характеристики се свързват помежду си, например чрез преброяване на броя книги от всеки автор или чрез разглеждане на разпределението на местоположенията на издателите през различни десетилетия.

Моделите винаги се конструират с определена цел и включват множество решения относно това кои аспекти на обекта на изследване ще бъдат представени. Например каталозите на библиотеки за заемане рядко представят материалните характеристики на своите фондове в подробности, като например състава на хартията или материалите на подвързията. Библиотеките за редки книги обаче могат да изберат да включват подобни характеристики в своите каталожни записи, тъй като те се считат за по-значими за разбирането или класифицирането на редките издания. Както отбелязва Андрю Пайпър, макар езикът на моделирането на пръв поглед да изглежда чужд на областта на литературните изследвания, литературните критици всъщност също представят текстовете чрез своеобразен описателен модел –  например, когато цитират откъси от даден текст и изготвят исторически, биографични или формални описания на него.[8]

За да бъдат подготвени текстове за статистическо моделиране, думите и другите характеристики на текста трябва да бъдат представени чрез числови стойности. Това може да стане чрез бинарно представяне (1, ако дадена дума присъства, и 0, ако тя отсъства) или чрез измерване на честотата на появата на думата в текста.

Характеристики на текста, които не са свързани пряко с думите, също могат да бъдат включени в модела –  например чрез категориални променливи, описващи особености като жанр, форма или авторство, или чрез дискретни или непрекъснати числови променливи, които регистрират информация като дати, брой стихове или редове, както и различни формални елементи на текста.

                                                                                         

 Превод от английски: ЛИЛИЯ РАЙЧЕВА

 

 Преводът е по: Houston, Natalie M. “Distant Reading.” В: Technology and Literature, редактор Adam Hammond, 361–377. Cambridge: Cambridge University Press, 2024

[1] Johanna Drucker, “Why Distant Reading Isn’t,” PMLA 132.3 (2017): 629; ред. Matthew K. Gold и Lauren F. Klein, “Introduction. Forum: Text Analysis at Scale,” в: Debates in the Digital Humanities, ред. Matthew K. Gold и Lauren F. Klein (Minneapolis: University of Minnesota Press, 2016), издание със свободен достъп: https://dhdebates.gc.cuny.edu/projects/debates-in-the-digital-humanities-2016 (посетено на 22 април 2022 г.).

[2] Franco Moretti, Distant Reading (London: Verso, 2013), 48.

[3] Ted Underwood, “Theorizing Research Practices We Forgot to Theorize Twenty Years Ago,” in: Representations 127.1 (Summer 2014): 64.

[4] Moretti, Distant Reading, 48.

[5] Пак там, 49.

[6] Franco Moretti, “Patterns and Interpretation,” Pamphlets of the Stanford Literary Lab 15 (September 2017), 1.

[7] Пак там, 2.

[8] Andrew Piper, “Think Small: On Literary Modeling,” PMLA 132.3 (2017): 652–653.

 

Подобни статии

НАПИШЕТЕ ОТГОВОР

Моля въведете вашият коментар!
Моля въведете вашето име тук

Времето е превишено. Моля попълнете кода отново.

Най-нови статии

spot_img
spot_img