დიგიტალური ქართველოლოგია ტომი III

დიგიტალური ქართველოლოგია
ტომი III

დიგიტალური ჰუმანიტარიის აკადემიის რეცენზირებადი ელექტრონული ორენოვანი სამეცნიერო ჟურნალი

ISSN 2720-8427 (ელექტრონული ვერსია)

ჟურნალის ახალი ნომერი:
ტომი 3, 2024 წ. (სრული ვერსია)

ონლაინჟურნალის "დიგიტალური ქართველოლოგიის" მესამე ტომში წარმოდგენილია უახლესი კვლევები ხელნაწერთა დიგიტალური კვლევების, დიგიტალური ქართველოლოგიისა და დიგიტალური რუსთველოლოგიის, ასევე ენათმეცნიერებისა და ლექსიკოგრაფიის სფეროდან.

ავტორები და სტატიები:

ხელნაწერთა დიგიტალური კვლევა

იოსტ გიპერტი (ჰამბურგის უნივერსიტეტი, ჰამბურგი), დანიელ შტეკლ ბენ ეზრა (უმაღლესი განათლების პრაქტიკული სკოლა, პარიზი)
ქართული ხელნაწერების ავტომატური ამოკითხვა eScriptorium-ის პლატფორმაზე

საკვანძო სიტყვები: სიმბოლოების ოპტიკური ამოცნობა, ხელნაწერი ტექსტის ამოცნობა, ტექსტური კორპუსები, ძველი ქართული, ხელნაწერები

აბსტრაქტი: სტატიაში აღწერილია eScriptorium-ის პლატფორმაზე ქართული ხელნაწერების ავტომატური წაკითხვის საშუალებების შექმნის პროცესი და მისი გამოყენების საფუძველზე მიღწეული პირველადი შედეგები. სტატიაში მიმოხილულია 1980-იანი წლების ბოლოს ქართული ნაბეჭდი წიგნების ტექსტზე ოპტიკური სიმბოლოების ამოცნობის (OCR) ტექნოლოგიის გამოყენების მიმართულებით დაწყებული სამუშაოები. ასევე წარმოდგენილია მოკლე შესავალი eScriptorium-ის პლატფორმაზე ხელნაწერი ტექსტის ამოცნობის (HCR) მეთოდებისა და მისი ფუნქციების შესახებ. სტატია დეტალურად აღწერს eScriptorium-ის გამოყენების პროცესს, რომელიც სამი ძირითადი ეტაპისაგან შედგება: ტექსტით დაფარული სვეტებისა და სტრიქონების ავტომატური სეგმენტაცია, მონიშნული სტრიქონების ავტომატური ტრანსკრიბირება ხელით შეყვანილი მონაცემების საფუძველზე, შესაბამისი მოდელების შემუშავება და არსებული ელექტრონული ტექსტების გასწორება, რაც eScriptorium-ის შემდგომი წვრთნისათვის სანდო საწყის მონაცემებს უზრუნველყოფს. 292 გვერდის ტრანსკრიბირება მანუალურად განხორციელდა; რაც შეეხება ავტომატურად ტრანსკრიბირებულსა და არსებულ გამოცემათა ტექსტებთან გასწორებული გვერდების რაოდენობა, მისი ოდენობა 7488 გვერდს შეადგენს. დაგროვილი მასალა საშუალებას გვაძლევს, გავაუმჯობესოთ ტრანსკრიბირების აქამდე არსებული მოდელი.

მაია მაჭავარიანი (კორნელი კეკელიძის სახელობის საქართველოს ხელნაწერთა ეროვნული ცენტრი, თბილისი)
დიგიტალური ჰუმანიტარია და კ. კეკელიძის სახელობის საქართველოს ხელნაწერთა ეროვნული ცენტრი

საკვანძო სიტყვები: დიგიტალური ჰუმანიტარია, ხელნაწერები, კორნელი კეკელიძის სახელობის საქართველოს ხელნაწერთა ეროვნული ცენტრი

აბსტრაქტი: დიგიტალური ჰუმანიტარიის, როგორც სამეცნიერო დარგის, მნიშვნელობა, კ. კეკელიძის სახელობის ხელნაწერთა ინსტიტუტში კარგად ჰქონდათ გააზრებული ინსტიტუტის ხელმძღვანელობასა და მეცნიერ-მუშაკებს ჯერ კიდევ გასული საუკუნის ბოლოს. 1990-იანი წლების დასაწყისში მაშინდელ ხელნაწერთა ინსტიტუტში დაიწყო ციფრული ჰუმანიტარიის პირველი პროექტი − ქართულ ისტორიულ დოკუმენტებში დაცული მონაცემების პირველი დიგიტალური ბაზის შექმნა. ისტორიული დოკუმენტების ანალიზისა და დაცვა-კატალოგიზაციის გარდა, ამ პროექტს სხვა, უფრო სტრატეგიული მიზანიც ჰქონდა − წარმოეჩინა, თუ რა შესაძლებლობებს იძლეოდა ახალი ტექნოლოგიების გამოყენება ჰუმანიტარულ მეცნიერებებში. ეს იყო ცდა კვლევის მეთოდოლოგიების პარადიგმების შეცვლის, რათა მეცნიერებს ახალი ტექნოლოგიები მიეღოთ და გაეთავისებინათ, როგორც თანამედროვე ჰუმანიტარული კვლევის აუცილებელი კომპონენტი. მას შემდეგ ინსტიტუტმა, შემდგომში კი − კორნელი კეკელიძის სახელობის საქართველოს ხელნაწერთა ეროვნულმა ცენტრმა, შოთა რუსთაველის სახელობის საქართველოს ეროვნული სამეცნიერო ფონდის მხარდაჭერითა და სხვადასხვა აკადემიურ დაწესებულებებთან თანამშრომლობით არაერთი პროექტი განახორციელა დიგიტალურ ჰუმანიტარიაში. ამ პროექტებიდან ზოგიერთი წარმოდგენილია წინამდებარე სტატიაში.

დიგიტალური ქართველოლოგია

ელენე ჟერარდინი ((უმაღლესი განათლების პრაქტიკული სკოლა, პარიზი)
დიალექტოლოგიური ლექსიკოლოგიური მონაცემთა ბაზის აგება ქართული ენის ზიარი კოგნატების ანალიზისათვის

საკვანძო სიტყვები: ქართული დიალექტოლოგია, ლევენშტაინის დისტანციები, დიატოპიური და დიაქრონიული შედარება

აბსტრაქტი: წინამდებარე ნაშრომში განხილულია ის გამოწვევები, რომელიც ქარ­თუ­ლი დი­ა­ლექ­ტე­ბის ლექ­სი­კურ მო­ნა­ცემ­თა ბა­ზის შექ­მნას ახლდა თან.  ნაშრომის დასაწყისში აღწერილია მონაცემთა შეგროვებისა და ფორმატირების მეთოდოლოგიური მიდგომები, შემდეგ კი მიმოხილულია მონაცემთა ბაზის არსებული ვერსია და მისი გამოყენება ლინგვისტური ანალიზისთვის. მონაცემთა ბაზა შექმნილია ფართო სპექტრის კვლევების ხელშესაწყობად და შესაძლებელს ხდის ისეთი კვლევების განხორციელებას, როგორიცაა ლევენშტაინის დისტანციის გამოთვლები და დიაქრონიული და დიატოპიური შედარებები. პროექტის გრძელვადიანი მიზანია ღია წვდომის რესურსის შექმნა, რომელიც მუდმივად გამდიდრდება ახალი მონაცემებით, ხელს შეუწყობს კომპიუტერული ინსტრუმენტების განვითარებას და გააღრმავებს ჩვენს ცოდნას ქართული და ქართველური ენების დიალექტთა შესახებ.

ქეთევან დათუკიშვილი, ნანა ლოლაძე (არნოლდ ჩიქობავას ენათმეცნიერების ინსტიტუტი, თბილისი), მერაბ ზაქალაშვილი (ლინგვისტური ტექნოლოგიების ჯგუფი, თბილისი)
ქართული ენის ლინგვისტურ მოდელზე დაფუძნებული მორფოლოგიური სინთეზი და ანალიზი (სახელის სინთეზი)

საკვანძო სიტყვები: ლინგვისტური მოდელი, სიტყვათა სინთეზი, ქართული ენის მორფოლოგიური პროცესორი

აბსტრაქტი: ქართული ენის მორფოლოგიური სინთეზისა და ანალიზის ამოცანის შესასრულებლად  ჩვენ შევქმენით ლინგვისტური მოდელი. მასში სრულად არის წარმოდგენილი ენის მორფოლოგიური სტრუქტურა. მოდელის საფუძველზე განხორციელდა პროგრამული უზრუნველყოფა: შეიქმნა ინსტრუმენტი – პროცესორი, რომლითაც შესაძლებელია სიტყვაფორმათა გენერირება და ანალიზი. ჩვენს ლინგვისტურ მოდელში ენა არ არის აღწერილი რომელიმე კონკრეტული გრამატიკული თეორიის მიხედვით, არამედ არსებული თეორიების გათვალისწინებით ენობრივი მონაცემები წარმოდგენილია განსხვავებული ფორმატით – ფორმალიზებული სახით. სტატიაში განხილულია სახელის მოდელი და მასზე დაფუძნებული სინთეზის მექანიზმი. მოდელში თითოეული მორფემა გამოისახება სიმბოლური ნიშნით, რომელთა ერთობლიობა ქმნის სიტყვის მორფოლოგიურ ფორმულას. სიტყვათა გამოსახვა მორფოლოგიური ფორმულებით არის ჩვენ მიერ შემოთავაზებული მეთოდი, რომლითაც შესაძლებელია ყველა ტიპის სიტყვაფორმის ფორმალიზებული სახით წარმოდგენა.  გარკვეული სახის ფორმულები ერთიანდება შაბლონებში. შაბლონი წარმოადგენს იმ მორფოლოგიური ფორმულების ერთობლიობას, რომლებიც საჭიროა ერთი ფუძიდან ყველა  სიტყვაფორმის (საშუალოდ – 3 000 ერთეული) დასაგენერირებლად.  დღეისათვის ქართული ენის მორფოლოგიური პროცესორით შესაძლებელია 266 მილიონზე მეტი სიტყვაფორმის სინთეზი. ყველა ეს ფორმა  არ არის დადასტურებული ელექტრონულ ტექსტებში ან დიდი მოცულობის კორპუსებში, მაგრამ პოტენციურად დასაშვებია. ამგვარ სიტყვებს პირობითად „პოტენციურ ფორმებს“ ვუწოდებთ.  პოტენციური ფორმები  მნიშვნელოვანია ბუნებრივ ენათა დამუშავების სხვადასხვა საკითხის კვლევისას, აგრეთვე ხელოვნური ინტელექტის ცალკეული ამოცანების გადასაწყვეტად. სამომავლოდ დაზუსტდება პროცესორით გენერირებულ მონაცემთა სიხშირული მახასიათებლები და განისაზღვრება მათი გამოყენების სფეროები.

დიგიტალური რუსთველოლოგია

მანანა თანდაშვილი (ფრანკფურტის გოეთეს უნივერსიტეტი, ფრანკფურტი) მარიამ ყამარაული (ჰამბურგის უნივერსიტეტი, ჰამბურგი)
ეკვივალენტობის კვლევისათვის მრავალენოვან პარალელურ კორპუსში

საკვანძო სიტყვები: დიგიტალური რუსთველოლოგია, შოთა რუსთაველი, თარგმანმცოდნეობა, ეკვივალენტობა, აფორიზმები, მრავალენოვანი პარალელური კორპუსი

აბსტრაქტი: შოთა რუსთაველის პოემა „ვეფხისტყაოსანი“ ქართული ლიტერატურის მწვერვალი, ხოლო აფორისტული სტილის თვალსაზრისით გამორჩეული შედევრია. ავტორის მსოფლმხედველობის კომპლექსურობა შუა საუკუნეებისა და რენესანსული აზროვნების შერწყმის შედეგს წარმოადგენს და აერთიანებს, ერთი მხრივ, ქრისტიანულ (და, ზოგადად, რელიგიურ) აზრებს ანტიკურ ფილოსოფიასთან (პლატონი, დიონისე არეოპაგელი, არისტოტელე) და, მეორე მხრივ, მითიურ და ტრანსცენდენტულ ხედვებს ანალიტიკურ აზროვნებასთან. მე-12 საუკუნეში შექმნილმა პოემამ განსაკუთრებული ადგილი მოიპოვა არა მხოლოდ ქართველთა კულტურულ მეხსიერებაში, არამედ მსოფლიო ლიტერატურის ისტორიაშიც – 2013 წლიდან პოემა შეტანილია იუნესკოს მსოფლიო კულტურული მემკვიდრეობის რეესტრში. დღეისათვის მოგვეპოვება „ვეფხისტყაოსნის“ 150-ზე მეტი თარგმანი მსოფლიოს 58 ენაზე, რაც უნიკალურ შესაძლებლობას იძლევა  მრავალენოვანი პარალელური კორპუსის შესაქმნელად. ენათა სიმრავლე და სხვადასხვა დროს შესრულებული თარგმანების მრავალფეროვნება, რომელიც დღეისათვის არის წარმოდგენილია „ვეფხისტყაოსნის“ თარგმანების პარალელურ კორპუსში Rustaveli goes digital, იშვიათ შესაძლებლობას იძლევა თარგმანმცოდნეობისათვის თარგმანების ხარისხის შესასწავლად, კერძოდ, თარგმანის მეთოდების გასაანალიზებლად, მთარგმნელთა მიერ გამოყენებული სტრატეგიების გამოსავლენად და შეპირისპირებითი ანალიზის ჩასატარებლად.  წინამდებარე ნაშრომში განხილულია თარგმანის ხარისხის დადგენის, კერძოდ ეკვივალენტობის კვლევის თეორიული საფუძვლები და კვლევის მეთოდები, და წარმოდგენილია სტატიის ავტორთა მიერ შემუშავებული კონცეპტუალური მოდელი, რომლის მეშვეობითად ავტორები ცდილობენ აფორიზმების ეკვივალენტობის  შეფასებას მრავალენოვან პარალელურ კორპუსში.

ენათმეცნიერება

ჯორჯ ჰიუიტი (აღმოსავლეთმცოდნეობისა და აფრიკანისტიკის სკოლა, ლონდონი)
პავლე მოციქულის პირველი ეპისტოლე კორინთელთა მიმართ თავი 13 ქართული და აფხაზური თარგმანების შედარება (ბერძნული ორიგინალის გათვალისწინებით)

საკვანძო სიტყვები: აფხაზური, ქართული, ბერძნული, ლათინური, რუსული, ბიბლია, ახალი აღთქმა, პავლე მოციქული, წმინდა იერონიმე, ვულგატა, ტინდეილი, ბიბლიის თარგმნის ინსტიტუტი, საპატრიარქო, ქველმოქმედება, სიყვარული, ლასურია

აბსტრაქტი: საყოველთაოდ აღიარებულია, რომ ბიბლია მსოფლიოში ყველაზე ხშირად თარგმნილი წიგნია.  ბიბლიის თარგმნას საუკუნეების განმავლობაში ჩამოყალიბებული ლიტერატურული ტრადიცია აქვს და ბიბლიის (ძველი და ახალი აღთქმის) არაერთი სრული თარგმანია ხელმისაწვდომი ქართულ ენაზე. აფხაზურ ენაზე კი მხოლოდ ახალი აღთქმის ერთი სრული ვერსია არსებობს, რომელიც 2004 წელს კერძო ინტერესებიდან გამომდინარე გამოიცა. თარგმანი შესრულებულია რუსული ენიდან აფხაზი მწერლის მუშნი ლასურიას მიერ. ბიბლიის თარგმნის ინსტიტუტი (რომელიც ერთ დროს სტოკჰოლმში იყო, ახლა კი მოსკოვშია) რამდენიმე წლის წინ დამიკავშირდა და მთხოვა ლასურიას მიერ შესრულებული სახარება-ოთხთავის აფხაზური თარგმანის რედაქტირება (იმავდროულად სხვა აფხაზურ თარგმანზეც ვმუშაობდი, კერძოდ, ზაირა ხიბას მიერ რუსულიდან აფხაზურად თარგმნილ ოთხთავზე). აფხაზურ თარგმანზე მუშაობა დიდხანს გაგრძელდა და მრავალი თვის განმავლობაში ინტენსიური მუშაობა დამჭირდა იმისათვის, რომ მეჩვენებინა, თუ რა ცვლილებები იყო შესატანი თარგმანში, რომ აფხაზური თარგმანი ბერძნულ დედანთან დაგვეახლოებინა. ზაირა ხიბას მიერ აფხაზურად თარგმნილი ოთხთავების ეს ვერსია ინტერნეტში ხელმისაწვდომია. ვფიქრობთ, საინტერესოა ახალი აღთქმის ერთი განსაკუთრებით ცნობილი ნაწილის, კერძოდ, პავლე მოციქულის ეპისტოლეში კორინთელთა მიმართ სიყვარულის თემის განხილვა  და იმის შესწავლა, თუ როგორ ასახეს ეს საკითხი ლასურიამ აფხაზურად და ქართველმა მთარგმნელებმა ქართულად (როგორც ძველ ქართულში, ისე ახალში).  საკითხი საინტერესოა იმ თვალსაზრისითაც, რომ ვნახოთ რამდენად ესადაგება შესრულებული თარგმანები ბერძნულ წყაროს.  ზოგადად, პავლე მოციქულის პირველი ეპისტოლე კორინთელთა მიმართ, კერძოდ, მე-13 თავი, განიხილება, როგორც სიყვარულის თემისადმი მიძღვნილი წერილი. შეიძლება გასაკვირი იყოს, მაგრამ ინგლისურ თარგმანებში ყველგან არ იკითხება სიტყვა ‘love’ (სიყვარული); მის ნაცვლად გამოყენებულია სიტყვა ‘charity’ (ქველმოქმედება). სტატიაში განვიხილავთ იმ ცხარე პოლემიკის მიზეზებს, რაც ამ ჩანაცვლებამ გამოიწვია მე-16 საუკუნის ინგლისში.

მაია ლომია, ქეთევან მარგიანი (ივანე ჯავახიშვილის თბილისის სახელმწიფო უნივერსიტეტი, თბილისი)
ქართველურ ენათა ზმნურ პარადიგმებში ევიდენციალობის მარკერის გამოყოფის თეორიული საფუძვლები და პრაქტიკული ღირებულება

საკვანძო სიტყვები: ევიდენციალობა, ქართველური ენები, ევიდენციალობის მორფოლოგიური მარკერები

აბსტრაქტი: პერფექტული ევიდენციალური ზმნური ფორმები საერთოქართველური მოვლენაა;  მათ­თვის ევიდენ­ცია­ლობის გამოხატვა მეორეული, სინქრონიულ დონეზე გააქტი­ურე­ბული ფუნ­ქციაა; პერფექტულ ევიდენციალურ ზმნურ ფორმებს სპეციალური მორფო­ლოგიური მაწარ­მ­ოებელი  არ მოეპოვებათ.  ისინი ლექსიკურად გამოხატავენ უნახაობას; ამით უპირის­პირ­დე­ბიან  ნახული მოქმედების გამომხატველ აორისტის ჯგუფის ზმნურ ფორმებს. იმპერფექტული ევიდენციალური ზმნური ფორმები მხოლოდ არასა­ლიტე­რატურო ქარ­თველურ ენებში (მეგრული, ლაზური, სვანური) გაჩნდა; ამათგან, ლაზურში ლექსი­კურადაა გამოხატული (აღწერითი წარმოებისაა), ხოლო მეგრულსა და სვანურში სპეციალური მორ­ფო­ლოგიური მარ­კერით აღინიშნება. მეგრულში აწმყოსა და იმპერ­ფექტის ზმნური ფორმები გამოხა­ტავენ ნახულ მოქ­მედებას; მათ  უპირისპირდებიან ევიდენციალური იმპერ­ფექტული ზმნები უნახავი მო­ქ­მედების გამოხატვის თვალ­საზ­რისით. სვანურში ნეიტრალურ იმპერფექტს ორი ფორმა უპირისპირდება: საზედაო ქცევის ევიდენციალური იმპერფექტი I  და ევიდენციალური იმპერფექტი II. მეგრულში  ევიდენციალური იმპერფექტი I და  ევიდენციალური იმპერფექტი II,   ხოლო სვანურში  ევიდენციალური იმპერფექტი II თავიდან აღ­წე­რითი წარმოების იყო:. ეს ფორმები ტრან­ს­­­ფორ­მა­ციის შედეგად ორგანულ წარმო­ებად ჩა­მოყალიბდა და ორივე ენაში ევიდენ­ციალობის გამომ­ხატველი სპეციალური მარკერიც მაშინ გაჩნ­და. საზედაო ქცევის გა­მომხატველი სვანური ევიდენციალური იმპერფექტი I თავიდანვე ორგანული წარმოების  ჩანს. სვანურსა და მეგრულში ევიდენციალობა ჩამოყალიბებულია როგორც მორფო­ლო­გიური კატეგორია. არასალიტერატურო ქართველურ ენებში ევიდენცილურ ზმნურ ფო­რ­მათა სეგმენტირება-გლოსირება და ევიდენციალობის მარკერის გამოყოფა პრაქ­ტი­კული ღირებულებისაა.

ლექსიკოგრაფია

თინათინ მარგალიტაძე, სალომე ჭიღლაძე (ილიას სახელმწიფო უნივერსიტეტი, თბილისი)
ინგლისურ-ქართული ლექსიკოგრაფიის უცნობი ფურცლები (ჯორჯ ელისის ქართველური ენების შედარებითი ლექსიკონი)

საკვანძო სიტყვები: ქართველური ენები, ქართული ენა, მეგრული ენა, სვანური ენა, შედარებითი ლექსიკონი, ტრანსლიტერაციის წესები, ენათა ნათესაობა

აბსტრაქტი: 1788 წელს ლონდონში გამოიცა ბრიტანელი ავტორის ჯორჯ ელისის წიგნი რუკა შავი და კასპიის ზღვებს შორის მოთავსებული ქვეყნებისა, კავკასიის ხალხთა აღწერითა და მათი ენების სიტყვარებით. მასში აღწერილია კავკასიის ხალხთა ისტორია, კულტურა, რელიგია და მოცემულია ინფორმაცია კავკასიის რეგიონში გავრცელებული ენების შესახებ. წიგნში ავტორი განიხილავს საქართველოსაც და მკითხველს აწვდის როგორც გეოგრაფიულ და პოლიტიკურ, ისე ეთნოგრაფიულ ინფორმაციას საქართველოს შესახებ. წიგნს დართული აქვს  ქართველური ენების  მომცრო შედარებითი ლექსიკონი. საყურადღებოა, რომ ავტორი ინტერესდება არა მხოლოდ ქართული ენით, არამედ ქართველური ენებით, და წიგნში ქართულთან ერთად წარმოდგენილია მეგრული და სვანური ენების მასალაც. შეიძლება ითქვას, რომ ამ წიგნში შესული ლექსიკოგრაფიული მასალა არის პირველი ნიმუში ქართველური ენების განხილვისა ინგლისურ ენასთან მიმართებით. სტატიაში წარმოდგენილია მოკლე ინფორმაცია თავად ამ წიგნის შესახებ, განხილულია ჯორჯ ელისის ქართველური ენების შედარებითი ლექსიკონი და მისი წყაროები. სტატიაში განსაკუთრებული ყურადღება ეთმობა ქართველური ენების სიტყვების ინგლისურად ტრანსლიტერაციის წესებს, რომელიც ძირითადად ახალი ინგლისური ენის კითხვის წესებს ეფუძნება.  ჯორჯ ელისის ქართველური ენების ლექსიკონი მნიშვნელოვანია ინგლისურ-ქართული ლექსიკოგრაფიის ისტორიის ადრეული ეტაპის შესასწავლად.  ეს ლექსიკონი საინტერესოა იმის გამოც, რომ მასში ქართველური ენები შეტანილია ენათა გენეზისური კავშირების კვლევისა და ენათა ნათესაობის დადგენის კონტექსტში.