საკვანძო სიტყვები: სიმბოლოების ოპტიკური ამოცნობა, ხელნაწერი ტექსტის ამოცნობა, ტექსტური კორპუსები, ძველი ქართული, ხელნაწერები
აბსტრაქტი: სტატიაში აღწერილია eScriptorium-ის პლატფორმაზე ქართული ხელნაწერების ავტომატური წაკითხვის საშუალებების შექმნის პროცესი და მისი გამოყენების საფუძველზე მიღწეული პირველადი შედეგები. სტატიაში მიმოხილულია 1980-იანი წლების ბოლოს ქართული ნაბეჭდი წიგნების ტექსტზე ოპტიკური სიმბოლოების ამოცნობის (OCR) ტექნოლოგიის გამოყენების მიმართულებით დაწყებული სამუშაოები. ასევე წარმოდგენილია მოკლე შესავალი eScriptorium-ის პლატფორმაზე ხელნაწერი ტექსტის ამოცნობის (HCR) მეთოდებისა და მისი ფუნქციების შესახებ. სტატია დეტალურად აღწერს eScriptorium-ის გამოყენების პროცესს, რომელიც სამი ძირითადი ეტაპისაგან შედგება: ტექსტით დაფარული სვეტებისა და სტრიქონების ავტომატური სეგმენტაცია, მონიშნული სტრიქონების ავტომატური ტრანსკრიბირება ხელით შეყვანილი მონაცემების საფუძველზე, შესაბამისი მოდელების შემუშავება და არსებული ელექტრონული ტექსტების გასწორება, რაც eScriptorium-ის შემდგომი წვრთნისათვის სანდო საწყის მონაცემებს უზრუნველყოფს. 292 გვერდის ტრანსკრიბირება მანუალურად განხორციელდა; რაც შეეხება ავტომატურად ტრანსკრიბირებულსა და არსებულ გამოცემათა ტექსტებთან გასწორებული გვერდების რაოდენობა, მისი ოდენობა 7488 გვერდს შეადგენს. დაგროვილი მასალა საშუალებას გვაძლევს, გავაუმჯობესოთ ტრანსკრიბირების აქამდე არსებული მოდელი.
საკვანძო სიტყვები: დიგიტალური ჰუმანიტარია, ხელნაწერები, კორნელი კეკელიძის სახელობის საქართველოს ხელნაწერთა ეროვნული ცენტრი
აბსტრაქტი: დიგიტალური ჰუმანიტარიის, როგორც სამეცნიერო დარგის, მნიშვნელობა, კ. კეკელიძის სახელობის ხელნაწერთა ინსტიტუტში კარგად ჰქონდათ გააზრებული ინსტიტუტის ხელმძღვანელობასა და მეცნიერ-მუშაკებს ჯერ კიდევ გასული საუკუნის ბოლოს. 1990-იანი წლების დასაწყისში მაშინდელ ხელნაწერთა ინსტიტუტში დაიწყო ციფრული ჰუმანიტარიის პირველი პროექტი − ქართულ ისტორიულ დოკუმენტებში დაცული მონაცემების პირველი დიგიტალური ბაზის შექმნა. ისტორიული დოკუმენტების ანალიზისა და დაცვა-კატალოგიზაციის გარდა, ამ პროექტს სხვა, უფრო სტრატეგიული მიზანიც ჰქონდა − წარმოეჩინა, თუ რა შესაძლებლობებს იძლეოდა ახალი ტექნოლოგიების გამოყენება ჰუმანიტარულ მეცნიერებებში. ეს იყო ცდა კვლევის მეთოდოლოგიების პარადიგმების შეცვლის, რათა მეცნიერებს ახალი ტექნოლოგიები მიეღოთ და გაეთავისებინათ, როგორც თანამედროვე ჰუმანიტარული კვლევის აუცილებელი კომპონენტი. მას შემდეგ ინსტიტუტმა, შემდგომში კი − კორნელი კეკელიძის სახელობის საქართველოს ხელნაწერთა ეროვნულმა ცენტრმა, შოთა რუსთაველის სახელობის საქართველოს ეროვნული სამეცნიერო ფონდის მხარდაჭერითა და სხვადასხვა აკადემიურ დაწესებულებებთან თანამშრომლობით არაერთი პროექტი განახორციელა დიგიტალურ ჰუმანიტარიაში. ამ პროექტებიდან ზოგიერთი წარმოდგენილია წინამდებარე სტატიაში.
საკვანძო სიტყვები: ქართული დიალექტოლოგია, ლევენშტაინის დისტანციები, დიატოპიური და დიაქრონიული შედარება
აბსტრაქტი: წინამდებარე ნაშრომში განხილულია ის გამოწვევები, რომელიც ქართული დიალექტების ლექსიკურ მონაცემთა ბაზის შექმნას ახლდა თან. ნაშრომის დასაწყისში აღწერილია მონაცემთა შეგროვებისა და ფორმატირების მეთოდოლოგიური მიდგომები, შემდეგ კი მიმოხილულია მონაცემთა ბაზის არსებული ვერსია და მისი გამოყენება ლინგვისტური ანალიზისთვის. მონაცემთა ბაზა შექმნილია ფართო სპექტრის კვლევების ხელშესაწყობად და შესაძლებელს ხდის ისეთი კვლევების განხორციელებას, როგორიცაა ლევენშტაინის დისტანციის გამოთვლები და დიაქრონიული და დიატოპიური შედარებები. პროექტის გრძელვადიანი მიზანია ღია წვდომის რესურსის შექმნა, რომელიც მუდმივად გამდიდრდება ახალი მონაცემებით, ხელს შეუწყობს კომპიუტერული ინსტრუმენტების განვითარებას და გააღრმავებს ჩვენს ცოდნას ქართული და ქართველური ენების დიალექტთა შესახებ.
საკვანძო სიტყვები: ლინგვისტური მოდელი, სიტყვათა სინთეზი, ქართული ენის მორფოლოგიური პროცესორი
აბსტრაქტი: ქართული ენის მორფოლოგიური სინთეზისა და ანალიზის ამოცანის შესასრულებლად ჩვენ შევქმენით ლინგვისტური მოდელი. მასში სრულად არის წარმოდგენილი ენის მორფოლოგიური სტრუქტურა. მოდელის საფუძველზე განხორციელდა პროგრამული უზრუნველყოფა: შეიქმნა ინსტრუმენტი – პროცესორი, რომლითაც შესაძლებელია სიტყვაფორმათა გენერირება და ანალიზი. ჩვენს ლინგვისტურ მოდელში ენა არ არის აღწერილი რომელიმე კონკრეტული გრამატიკული თეორიის მიხედვით, არამედ არსებული თეორიების გათვალისწინებით ენობრივი მონაცემები წარმოდგენილია განსხვავებული ფორმატით – ფორმალიზებული სახით. სტატიაში განხილულია სახელის მოდელი და მასზე დაფუძნებული სინთეზის მექანიზმი. მოდელში თითოეული მორფემა გამოისახება სიმბოლური ნიშნით, რომელთა ერთობლიობა ქმნის სიტყვის მორფოლოგიურ ფორმულას. სიტყვათა გამოსახვა მორფოლოგიური ფორმულებით არის ჩვენ მიერ შემოთავაზებული მეთოდი, რომლითაც შესაძლებელია ყველა ტიპის სიტყვაფორმის ფორმალიზებული სახით წარმოდგენა. გარკვეული სახის ფორმულები ერთიანდება შაბლონებში. შაბლონი წარმოადგენს იმ მორფოლოგიური ფორმულების ერთობლიობას, რომლებიც საჭიროა ერთი ფუძიდან ყველა სიტყვაფორმის (საშუალოდ – 3 000 ერთეული) დასაგენერირებლად. დღეისათვის ქართული ენის მორფოლოგიური პროცესორით შესაძლებელია 266 მილიონზე მეტი სიტყვაფორმის სინთეზი. ყველა ეს ფორმა არ არის დადასტურებული ელექტრონულ ტექსტებში ან დიდი მოცულობის კორპუსებში, მაგრამ პოტენციურად დასაშვებია. ამგვარ სიტყვებს პირობითად „პოტენციურ ფორმებს“ ვუწოდებთ. პოტენციური ფორმები მნიშვნელოვანია ბუნებრივ ენათა დამუშავების სხვადასხვა საკითხის კვლევისას, აგრეთვე ხელოვნური ინტელექტის ცალკეული ამოცანების გადასაწყვეტად. სამომავლოდ დაზუსტდება პროცესორით გენერირებულ მონაცემთა სიხშირული მახასიათებლები და განისაზღვრება მათი გამოყენების სფეროები.
საკვანძო სიტყვები: დიგიტალური რუსთველოლოგია, შოთა რუსთაველი, თარგმანმცოდნეობა, ეკვივალენტობა, აფორიზმები, მრავალენოვანი პარალელური კორპუსი
აბსტრაქტი: შოთა რუსთაველის პოემა „ვეფხისტყაოსანი“ ქართული ლიტერატურის მწვერვალი, ხოლო აფორისტული სტილის თვალსაზრისით გამორჩეული შედევრია. ავტორის მსოფლმხედველობის კომპლექსურობა შუა საუკუნეებისა და რენესანსული აზროვნების შერწყმის შედეგს წარმოადგენს და აერთიანებს, ერთი მხრივ, ქრისტიანულ (და, ზოგადად, რელიგიურ) აზრებს ანტიკურ ფილოსოფიასთან (პლატონი, დიონისე არეოპაგელი, არისტოტელე) და, მეორე მხრივ, მითიურ და ტრანსცენდენტულ ხედვებს ანალიტიკურ აზროვნებასთან. მე-12 საუკუნეში შექმნილმა პოემამ განსაკუთრებული ადგილი მოიპოვა არა მხოლოდ ქართველთა კულტურულ მეხსიერებაში, არამედ მსოფლიო ლიტერატურის ისტორიაშიც – 2013 წლიდან პოემა შეტანილია იუნესკოს მსოფლიო კულტურული მემკვიდრეობის რეესტრში. დღეისათვის მოგვეპოვება „ვეფხისტყაოსნის“ 150-ზე მეტი თარგმანი მსოფლიოს 58 ენაზე, რაც უნიკალურ შესაძლებლობას იძლევა მრავალენოვანი პარალელური კორპუსის შესაქმნელად. ენათა სიმრავლე და სხვადასხვა დროს შესრულებული თარგმანების მრავალფეროვნება, რომელიც დღეისათვის არის წარმოდგენილია „ვეფხისტყაოსნის“ თარგმანების პარალელურ კორპუსში Rustaveli goes digital, იშვიათ შესაძლებლობას იძლევა თარგმანმცოდნეობისათვის თარგმანების ხარისხის შესასწავლად, კერძოდ, თარგმანის მეთოდების გასაანალიზებლად, მთარგმნელთა მიერ გამოყენებული სტრატეგიების გამოსავლენად და შეპირისპირებითი ანალიზის ჩასატარებლად. წინამდებარე ნაშრომში განხილულია თარგმანის ხარისხის დადგენის, კერძოდ ეკვივალენტობის კვლევის თეორიული საფუძვლები და კვლევის მეთოდები, და წარმოდგენილია სტატიის ავტორთა მიერ შემუშავებული კონცეპტუალური მოდელი, რომლის მეშვეობითად ავტორები ცდილობენ აფორიზმების ეკვივალენტობის შეფასებას მრავალენოვან პარალელურ კორპუსში.
საკვანძო სიტყვები: აფხაზური, ქართული, ბერძნული, ლათინური, რუსული, ბიბლია, ახალი აღთქმა, პავლე მოციქული, წმინდა იერონიმე, ვულგატა, ტინდეილი, ბიბლიის თარგმნის ინსტიტუტი, საპატრიარქო, ქველმოქმედება, სიყვარული, ლასურია
აბსტრაქტი: საყოველთაოდ აღიარებულია, რომ ბიბლია მსოფლიოში ყველაზე ხშირად თარგმნილი წიგნია. ბიბლიის თარგმნას საუკუნეების განმავლობაში ჩამოყალიბებული ლიტერატურული ტრადიცია აქვს და ბიბლიის (ძველი და ახალი აღთქმის) არაერთი სრული თარგმანია ხელმისაწვდომი ქართულ ენაზე. აფხაზურ ენაზე კი მხოლოდ ახალი აღთქმის ერთი სრული ვერსია არსებობს, რომელიც 2004 წელს კერძო ინტერესებიდან გამომდინარე გამოიცა. თარგმანი შესრულებულია რუსული ენიდან აფხაზი მწერლის მუშნი ლასურიას მიერ. ბიბლიის თარგმნის ინსტიტუტი (რომელიც ერთ დროს სტოკჰოლმში იყო, ახლა კი მოსკოვშია) რამდენიმე წლის წინ დამიკავშირდა და მთხოვა ლასურიას მიერ შესრულებული სახარება-ოთხთავის აფხაზური თარგმანის რედაქტირება (იმავდროულად სხვა აფხაზურ თარგმანზეც ვმუშაობდი, კერძოდ, ზაირა ხიბას მიერ რუსულიდან აფხაზურად თარგმნილ ოთხთავზე). აფხაზურ თარგმანზე მუშაობა დიდხანს გაგრძელდა და მრავალი თვის განმავლობაში ინტენსიური მუშაობა დამჭირდა იმისათვის, რომ მეჩვენებინა, თუ რა ცვლილებები იყო შესატანი თარგმანში, რომ აფხაზური თარგმანი ბერძნულ დედანთან დაგვეახლოებინა. ზაირა ხიბას მიერ აფხაზურად თარგმნილი ოთხთავების ეს ვერსია ინტერნეტში ხელმისაწვდომია. ვფიქრობთ, საინტერესოა ახალი აღთქმის ერთი განსაკუთრებით ცნობილი ნაწილის, კერძოდ, პავლე მოციქულის ეპისტოლეში კორინთელთა მიმართ სიყვარულის თემის განხილვა და იმის შესწავლა, თუ როგორ ასახეს ეს საკითხი ლასურიამ აფხაზურად და ქართველმა მთარგმნელებმა ქართულად (როგორც ძველ ქართულში, ისე ახალში). საკითხი საინტერესოა იმ თვალსაზრისითაც, რომ ვნახოთ რამდენად ესადაგება შესრულებული თარგმანები ბერძნულ წყაროს. ზოგადად, პავლე მოციქულის პირველი ეპისტოლე კორინთელთა მიმართ, კერძოდ, მე-13 თავი, განიხილება, როგორც სიყვარულის თემისადმი მიძღვნილი წერილი. შეიძლება გასაკვირი იყოს, მაგრამ ინგლისურ თარგმანებში ყველგან არ იკითხება სიტყვა ‘love’ (სიყვარული); მის ნაცვლად გამოყენებულია სიტყვა ‘charity’ (ქველმოქმედება). სტატიაში განვიხილავთ იმ ცხარე პოლემიკის მიზეზებს, რაც ამ ჩანაცვლებამ გამოიწვია მე-16 საუკუნის ინგლისში.
საკვანძო სიტყვები: ევიდენციალობა, ქართველური ენები, ევიდენციალობის მორფოლოგიური მარკერები
აბსტრაქტი: პერფექტული ევიდენციალური ზმნური ფორმები საერთოქართველური მოვლენაა; მათთვის ევიდენციალობის გამოხატვა მეორეული, სინქრონიულ დონეზე გააქტიურებული ფუნქციაა; პერფექტულ ევიდენციალურ ზმნურ ფორმებს სპეციალური მორფოლოგიური მაწარმოებელი არ მოეპოვებათ. ისინი ლექსიკურად გამოხატავენ უნახაობას; ამით უპირისპირდებიან ნახული მოქმედების გამომხატველ აორისტის ჯგუფის ზმნურ ფორმებს. იმპერფექტული ევიდენციალური ზმნური ფორმები მხოლოდ არასალიტერატურო ქართველურ ენებში (მეგრული, ლაზური, სვანური) გაჩნდა; ამათგან, ლაზურში ლექსიკურადაა გამოხატული (აღწერითი წარმოებისაა), ხოლო მეგრულსა და სვანურში სპეციალური მორფოლოგიური მარკერით აღინიშნება. მეგრულში აწმყოსა და იმპერფექტის ზმნური ფორმები გამოხატავენ ნახულ მოქმედებას; მათ უპირისპირდებიან ევიდენციალური იმპერფექტული ზმნები უნახავი მოქმედების გამოხატვის თვალსაზრისით. სვანურში ნეიტრალურ იმპერფექტს ორი ფორმა უპირისპირდება: საზედაო ქცევის ევიდენციალური იმპერფექტი I და ევიდენციალური იმპერფექტი II. მეგრულში ევიდენციალური იმპერფექტი I და ევიდენციალური იმპერფექტი II, ხოლო სვანურში ევიდენციალური იმპერფექტი II თავიდან აღწერითი წარმოების იყო:. ეს ფორმები ტრანსფორმაციის შედეგად ორგანულ წარმოებად ჩამოყალიბდა და ორივე ენაში ევიდენციალობის გამომხატველი სპეციალური მარკერიც მაშინ გაჩნდა. საზედაო ქცევის გამომხატველი სვანური ევიდენციალური იმპერფექტი I თავიდანვე ორგანული წარმოების ჩანს. სვანურსა და მეგრულში ევიდენციალობა ჩამოყალიბებულია როგორც მორფოლოგიური კატეგორია. არასალიტერატურო ქართველურ ენებში ევიდენცილურ ზმნურ ფორმათა სეგმენტირება-გლოსირება და ევიდენციალობის მარკერის გამოყოფა პრაქტიკული ღირებულებისაა.
საკვანძო სიტყვები: ქართველური ენები, ქართული ენა, მეგრული ენა, სვანური ენა, შედარებითი ლექსიკონი, ტრანსლიტერაციის წესები, ენათა ნათესაობა
აბსტრაქტი: 1788 წელს ლონდონში გამოიცა ბრიტანელი ავტორის ჯორჯ ელისის წიგნი რუკა შავი და კასპიის ზღვებს შორის მოთავსებული ქვეყნებისა, კავკასიის ხალხთა აღწერითა და მათი ენების სიტყვარებით. მასში აღწერილია კავკასიის ხალხთა ისტორია, კულტურა, რელიგია და მოცემულია ინფორმაცია კავკასიის რეგიონში გავრცელებული ენების შესახებ. წიგნში ავტორი განიხილავს საქართველოსაც და მკითხველს აწვდის როგორც გეოგრაფიულ და პოლიტიკურ, ისე ეთნოგრაფიულ ინფორმაციას საქართველოს შესახებ. წიგნს დართული აქვს ქართველური ენების მომცრო შედარებითი ლექსიკონი. საყურადღებოა, რომ ავტორი ინტერესდება არა მხოლოდ ქართული ენით, არამედ ქართველური ენებით, და წიგნში ქართულთან ერთად წარმოდგენილია მეგრული და სვანური ენების მასალაც. შეიძლება ითქვას, რომ ამ წიგნში შესული ლექსიკოგრაფიული მასალა არის პირველი ნიმუში ქართველური ენების განხილვისა ინგლისურ ენასთან მიმართებით. სტატიაში წარმოდგენილია მოკლე ინფორმაცია თავად ამ წიგნის შესახებ, განხილულია ჯორჯ ელისის ქართველური ენების შედარებითი ლექსიკონი და მისი წყაროები. სტატიაში განსაკუთრებული ყურადღება ეთმობა ქართველური ენების სიტყვების ინგლისურად ტრანსლიტერაციის წესებს, რომელიც ძირითადად ახალი ინგლისური ენის კითხვის წესებს ეფუძნება. ჯორჯ ელისის ქართველური ენების ლექსიკონი მნიშვნელოვანია ინგლისურ-ქართული ლექსიკოგრაფიის ისტორიის ადრეული ეტაპის შესასწავლად. ეს ლექსიკონი საინტერესოა იმის გამოც, რომ მასში ქართველური ენები შეტანილია ენათა გენეზისური კავშირების კვლევისა და ენათა ნათესაობის დადგენის კონტექსტში.
ჩვენი გუნდი ყოველთვის მზად არის გაგიწიოთ კონსულტაცია