კომპიუტერული ლინგვისტიკა

NPLG Wiki Dictionaries გვერდიდან
გადასვლა: ნავიგაცია, ძიება

კომპიუტერული ლინგვისტიკა – გამოყენებითი ლინგვისტიკის მიმდინარეობა, რომელიც ადგენს ლინგვისტურ მონაცემთა დამუშავებისა და შენახვის ავტომატიზებულ მეთოდებს. ამ ტერმინის ატრიბუტული ნაწილი („კომპიუტერული”) გამართლებულია იმდენად, რამდენადაც პირველადი ბიძგი ამ დარგის განვითარებას გამომთვლელმა მანქანამ (კომპიუტერმა) მისცა. კვლევის არედ მანქანური თარგმნის ამოცანა იქცა. როგორც კი პირველი, საკმაოდ ზერელე, წარმატების შემდეგ აღმოჩნდა, რომ კომპიუტერი ამ ამოცანას მარტო ვერ გადაწყვეტდა, გაჩნდა ორგვარი რეაქცია: ერთი მხრივ, დაცხრა ინტერესი მანქანური თარგმნის მიმართ, მეორე მხრივ, სტიმული მიეცა ამ ამოცანისა (მანქანური თარგმნისა) და, საერთოდ, ენისადმი კომპიუტერული მიდგომის ღრმა თეორიულ შესწავლასა და გააზრებას.

ამ მიმდინარეობის განვითარებაში უდიდესი წვლილი მიუძღვის მოსკოვის სკოლას (ი. მელჩუკი, ა. ჟოლკოვსკი, ი. აპრესიანი). მათი (უპირველესად ი. მელჩუკის) თაოსნობით დამუშავდა ისეთი მოდელის საფუძვლები, რომელიც ნებისმიერი განვითარებული ენობრივი კომპიუტერული სისტემის ქვაკუთხედს უნდა წარმოადგენდეს. ასეთია „შინაარსი ←→ ტექსტი“-ს მოდული, რომელიც მოწოდებულია ადამიანის ენობრივი ქცევის ორი ძირითადი პროცესის საიმიტაციოდ. ეს პროცესებია ტექსტის წარმოქმნა (ანუ სინთეზი) და ტექსტის გაგება (ანუ ანალიზი). პროცესები ხორციელდება საფეხურებრივად: ანალიზი იწყება ტექსტის ჩვეულებრივი ფონემური/გრაფემული წარმოდგენის მორფოლ. გარჩევით, რის შემდეგაც სინტაქსურ წესებს მორფოლოგიური ანალიზის შედეგები გადაჰყავს ტექსტის სინტაქსურ წარმოდგენაში: შედეგი გადამუშავდება სემანტიკური კომპონენტების მეშვეობით ტექსტის საბოლოო (მოცემული პროცესისათვის) სემანტიკურ წარმოდგენად. ეს უკანასკნელი ექსპლიციტურად უნდა გამოხატავდეს შესავალ ტექსტში იმპლიციტურად კოდირებულ შინაარსს. სინთეზმა, ბუნებრივია, უნდა გაიაროს იგივე საფეხურები საპირისპირო მიმართულებით.

ყოველი ენობრივი დონის წარმოდგენას თავისი სპეციფიკა აქვს: ფონემურ/გრაფემულ დონეზე ტექსტი წარმოდგენილია როგორც ფონემათა/გრაფემათა უბრალო თანამიმდევრობა; მორფოლ. წესებს იგი გადაჰყავს სიტყვათა წარმოდგენის თანამიმდევრობაში, სადაც ყოველ სიტყვას ენაცვლება შესატყვისი – გრამატიკულად დახასიათებული ლექსემა, ანუ სიტყვის ფუძე. ამ უკანასკნელს ახლავს ფუძის კონკრეტული ფორმით და მასზე დართული აფიქსებით განსაზღვრული გრამატიკული კატეგორიების მნიშვნელობები. ეს ერთეულები სინტაქსური წესების სათანადო დამუშავების შემდეგ წინადადების სინტაქსის ამსახველი ხისებრი სტრუქტურის კვანძებში იკავებენ ადგილს. საბოლოოდ ეს უკანასკნელი წარმოდგენა სემანტიკურმა წესებმა უნდა გადაიყვანოს შინაარსის მაქსიმალურად ცალსახა და ექსპლიციტურ გამოხატულებაში, რომელიც წარმოდგენილია გრაფის სახით. გრაფაში მიმართებები მაქსიმალურად სტანდარტიზებულია, საკვანძო ერთეულები კი იდეალურ შემთხვევაში დაყვანილია სემანტიკური პრიმიტივების დონეზე. საერთოდ, ანალიზის ერთ-ერთ ძირითად პრინციპს წარმოადგენს ტექსტური ერთეულების მრავალმნიშვნელიანობის, ანუ ომონიმიის, ამ ტერმინის ყველაზე ფართო გაგებით, მოხსნა და შინაარსის შესაძლებელი ვარიანტების მაქსიმალური შეზღუდვა.

მის საპირისპიროდ, ტექსტის მასინთეზირებელმა პროცესმა უნდა შეძლოს (იდეალურ შემთხვევაში) მოცემული შინაარსის ყველა დასაშვები ენობრივი გამოხატულების აგება, ე. ი. უნდა წარმოქმნას სინონიმური ტექსტების, ანუ ურთიერთპარაფრაზების სრული სიმრავლე.

ამრიგად, ლაპარაკია სისტემაზე, რომელიც თავის იდეალურ, ზღვრულ გადაწყვეტაში ენას ადამიანივით უნდა ფლობდეს. თეორიული თვალსაზრისით ეს მოასწავებს ახალ, მეტად მნიშვნელოვან ეტაპს ენათმეცნიერების საერთო განვითარებაში: თუ ტრადიციულად ენათმეცნიერება იკვლევდა ენობრივი ქცევის პროდუქტს, ანუ ტექსტს (ამ სიტყვის ფართო გაგებით), ადგენდა ამ ტექსტის ერთეულების ინვენტარებს ლექსიკონებისა და გრამატიკების სახით, კომპიუტერული ლინგვისტიკის განვითარების ფაზაში დღის წესრიგში შესულია ახალი, თუმცა წინა პუნქტიდან ბუნებრივად გამომდინარე საკითხი: როგორ წარმოიქმნება ტექსტი, ანუ როგორ შეიძლება ფუნქციონირებდეს ის ენობრივი მექანიზმი, რომელიც ტექსტს წარმოქმნის.

ნიშანდობლივია ისიც, რომ სწორედ ამ ღრმა თეორიულ კვლევას მოჰყვება წმინდა პრაქტიკული (კომპიუტერული) გამოყენების ისეთი პერსპექტივები, როგორიცაა ავტომატური თარგმანი, დიალოგი კომპიუტერთან (და სხვ. ტექნიკურ მოწყობილობებთან) ბუნებრივი ენის საშუალებით, ენის სწავლების ავტომატიზაცია და ა.შ. ამ ტექნოლოგიებს უდიდესი მნიშვნელობა ენიჭება ახალ ათასწლეულში, რომელმაც უკვე დაიმსახურა ინფორმაციის ეპოქის სახელი.

კომპიუტერული ლინგვისტიკის პირველი კერა საქართველოში წარმოიშვა XX ს.50-იანი წლების დამლევს ახლანდელი მართვის სისტემების ინსტიტუტში. პირველი მიღწევა იყო რუსულ-ქართული ავტომატური თარგმნის ექსპერიმენტული სისტემის შექმნა, შემდეგ – ლინგვისტური პროცესორების დამუშავება კომპიუტერთან ბუნებრივ ენაზე დიალოგისათვის და გრამატიკის სწავლების კომპიუტერული სისტემები. ამ სამუშაოების საფუძველი ენობრივი (ქართული, რუსული, გერმანული, ინგლისური) ალგორითმების შექმნა იყო, ხოლო კვლევის პრიორიტეტული ობიექტი – მორფოლოგიური დონე.

70-იანი წლებიდან თსუ-ში ფუნქციონირებს სტრუქტურული და გამოყენებითი ლინგვისტიკის კათედრა, რომელმაც ამ დარგის მრავალი სპეციალისტი აღზარდა. ბოლო წლებში ამ სფეროს მკვლევართა წრე გაფართოვდა. შეიქმნა სათანადო ჯგუფი ენათმეცნიერების ინსტიტუტში (ქართული მორფოლოგიის მონაცემთა ბაზები), თსუ-სთან ჩამოყალიბდა ცენტრი „ენა, ლოგიკა, მეტყველება“, რომელმაც დიდი სამუშაო ჩაატარა ამ სამეცნიერო მიმართულების პროპაგანდისათვის და უცხოეთში ანალოგიური სამეცნიერო ინტერესების მქონე წრეებთან ურთიერთობის დასამყარებლად.

გ. ჩიკოიძე

წყარო

ქართული ენა: ენციკლოპედია

პირადი ხელსაწყოები
სახელთა სივრცე

ვარიანტები
მოქმედებები
ნავიგაცია
ხელსაწყოები